https://www.padchip.com

PDF 作为一款通用的文字处理格式,经常是扫描仪等设备的默认输出格式;有些用户经常遇到需要让文档可识别文字,可搜索;可能还要输出成 Word 文档等其他格式,下面对比一下几款常用的 PDF 工具对其的支持。

支持系统

Cisdem PDF Converter OCR:Mac 单系统
PDFElement Pro: Mac/Windows 双系统
FineReader OCR Pro:Mac/Windows 双系统
Adobe Acrobat DC: Mac/Windows 双系统

测试版本

所以测试基于 Mac 系统
PDFElement Pro: 6.6.3
FineReader OCR Pro:12.1.11
Adobe Acrobat DC: 2018.011.20058
Cisdem PDF Converter OCR:6.0.0

OCR 识别

OCR 的功能是可以将图片识别成文本,从而可以让你搜索里面的文字;OCR 还是后面将 PDF 文件转换成 Word 等文本文件的基础,因为格式转换实际上就是将识别的文本输出,如果没有 OCR 功能,那么格式转换只能重新输出一张图片。正因为这样,OCR 识别的越好,后面文本输出的真实度越高。

下面分别用几款常用的软件对比下 OCR 识别效果:

  • 中文
    下面是从网上随机找的一篇新闻报道,然后分别使用上面的四款软件做了 OCR 识别只是,Command + A 全选复制之后黏贴到剪切板。

    从结果可以看出 PDFElement Pro 和 Cisdem PDF Converter OCR 的识别效果和排版基本上是相同的,视觉的美观度也是最高的;Acrobat DC 的识别效果也是一流的,但是排版效果较次;FineReader 的识别效果和排版效果最次,基本无法阅读。

    中文识别
  • 英文
    下面是从 Wiki 里面找的一篇文章,英文的 OCR 识别四个软件做的都很不错,排版也很类似,除了 Acrobat 中间没有空行。从乱码出现的概率看,Cisdem 的效果是最好的,FineReader 的效果最次。
英文识别
  • 其它
    四款软件中 OCR 的准确率和排版效果看,Cisdem 和 PDFElement 的效果最好,Acrobat 也很不错,FineReader 的效果最次。不过 Acrobat 还支持更改识别的内容,手动校准,如果对识别要求很高的顾客,这个功能可能是必须的。

格式转换

对于很多需要扫描的顾客来说,另一个重要的功能就是能够将 OCR 识别的文字输出成 Word 文档进行编辑。

格式转换出来的质量和 OCR 识别的准确率关系很大,从上面就可以大概能够猜到结果了,实验的结果也基本上也预期一致。Cisdem == PDFElement > Acrobat > FineReader。

  • Cisdem 支持的格式最为宽泛,PDF,Word 文档(DOC,DOCX),PowerPoint 文稿(PPTX),Excel,文本(RTFD,TXT),HTML,EPUB,Pages,Keynote,图片(JPEG,BMP,PNG,GIF,TIFE)。

    Cisdem
  • PDFElement 的 OCR 识别也很不错, 但是如果想要输出到其它格式,需要在打开文件后在菜单中选择导出按钮,导出的格式包含,Word,Excel,PowerPoint,图像,EPUB,纯文本,Pages,HTML,RTF。和 Cisdem 支持的格式类似,除了不支持苹果的幻灯片应用 Keynote 之外。

PDFElement
  • Acrobat 识别也很不错,但是从上面复制的结果看,排版问题比较多,所以输出的结果排版也比较混乱。和 PDFElement 一样,你无法直接转换格式,需要打开文件之后在菜单导出。支持的格式也很多,包括 Office 办公格式,图像,纯文本,还独家支持 PostScript 和 XML 格式。
Acrobat
  • FineReader 因为 OCR 识别乱码很多,测试结果也很差,基本上是无法直接阅读的,支持的格式和其它几款类似,包括 PDF,Office 办公软件格式,出文本,HTML,EPUB,独家支持的格式包括 CSV 和 FB2。

    FineReader

下面是四种软件的输出图, 从截图看 Cisdem 和 PDFElement 的结果很出色,基本可以直接阅读。Acrobat 背景混乱,FineReader 的识别效果造成排版混乱。

输出结果

试用版下载

官网
PDFElement Pro: https://pdf.wondershare.com/
FineReader OCR Pro:https://www.abbyy.cn/finereader/
Adobe Acrobat DC: https://acrobat.adobe.com/cn/zh-Hans/acrobat.html
Cisdem PDF Converter OCR:https://www.cisdem.com/pdf-converter-ocr-mac.html

价格

Cisdem 团购的价格是69 元,PDFElement Pro 的团购价格是 199 元,Adobe Acrobat DC 和 FineReader OCR Pro 都属于专业类别软件,针对不同的使用用户群有不同的价格,价格也不菲,如果想要了解,可以直接去官网查看。

总结

从测试的结果看,Cisdem 和 PDFElement Pro 的效果都十分优秀,而且效率也是四款软件里面的佼佼者。

Cisdem 是一款纯 PDF 批量处理工具,界面设计的也十分简洁,可以一键处理多个文档;自带的 PDF 创建工具也十分高效。配合 PDF Expert 或者 PDFElement Express 一类的简洁阅读工具(价格相比较而言十分便宜),基本可以满足轻度 PDF 使用者的需求。

PDFElement Pro 是一款强大的 PDF 阅读和编辑工具,除了 OCR 和各种输出格式支持,还支持 PDF 文件阅读,编辑,适合需要经常处理 PDF 文件的专业人士。

Acrobat 和 PDFElement Pro 类似,具有强大的 PDF 阅读和编辑功能,因为是 Adobe 家的产品,所以兼容性是里面的软件最强大的。

FineReader 不清楚是不是拿来测试的版本过低,无论是性能还是功能,都无法达到让人满意的成都。

更多资讯

欢迎关注店铺公众号 mifengapptalk,获取更多的软件使用技巧和资讯;还可以领取店铺优惠券购买软件。

公众号