提取PDF电子书中的文字!
我有一个PDF电子书,里面都是扫描的原版书籍内容,如何提取出扫描书籍中的文字。
找了很多软件,目前没有看到有一个软件能做到。。。 有的,发给我试试 文字识别ocr 肉眼识别,一定可以。
titter.gif
有软件的 Acrobat有自带的OCR 刚找了一款软件,要付费。
http://www.jsocr.com/gm.html orc 识别工具,书的扫描质量越好 准确率越高,不过通常都不会太好,还得肉眼校对一遍 ocr 然后人肉校,没有更还办法 ABBYY老牌OCR了ABBYY不错的
页:
[1]
2