‘壹’ 如何提取出PDF图片文字
1)将PDF文件的各页导出为图片
2)用OCR软件将这些图片识别为WORD文档
具体步骤可参见http://..com/question/5755640.html
‘贰’ 求一款软件可以识别并提取pdf中图片的汉字。
图片可以用Chief-Win PDF Converter PE提取出来,此软件小巧,但提取速度快,效率高,同时还可提取文字成Word、TXT文档。但图片中的汉字……只能提取后用专业识别程序来做吧,不过效率极其低,效果极其差,还不如你自己打字来的爽
你这是扫描后制作的,那就只能抽出图片了,因为扫描仪扫描进去的一般是tif文件
Chief-Win PDF Converter下载地址(纳米盘):
http://www.namipan.com/d/
内附破解文件
‘叁’ 如何从PDF图片中提取文字
用OCR就可以了.
比如Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。
Office2003实现PDF文件转Word文档
经过尝试,发现可以利用 Office 2003 中的 Microsoft Office Document Imaging 组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:
用Adobe Reader 打开想转换的PDF文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,确认后将该PDF文 件输出为 MDI格式的虚拟打印文件 。
注: 如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。
然后, 运行 “Microsoft Office Document Imaging”,并利用它来 打开 刚才保存的MDI文件,选择“工具→ 将文本发送到Word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 OCR 。这可能需要一些时间”,不管它, 确认 即可。
注: 对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在 word2003 中可用,其他版本没有Microsoft Office Document Image Writer
‘肆’ 怎么样将PDF文件中的图片中的文字提取出来
哈哈,我前段时间刚刚解决这个问题,首先,下一个叫PDFEdit的软件,它可以帮你提取你所谓的都是图片的PDF中的(其实是扫描版)你需要的页数,还可以对写保护的PDF进行解码,比如,一个PDF文件一共有300页,你需要其中的第1页,第50-60页,第203-205页,直接在软件里输入“1,50-60,203-205”;其次,你还要下一个叫ABBYY FineReader 10 Professional Edition的软件,这个软件可以扫描PDF文件中的文字并转化到Word中,可以编辑的哦,不是图片(但要注意的是凡是扫描的东西都有误差,不可能每个字都是正确的,上面的软件会把可能错误的字用颜色标出来,你可以自己直接修改)。
这个是我花了好久才找到的,一定要给分哦。我已经用这两个软件编辑了好多东西了!确定对你有帮助,我也试了好多软件,这两个最好用,而且完全是傻瓜版,很好用,不需要什么专业知识。
如果你需要的话,告诉我邮箱,直接发给你。
楼上说的汉王,我也试过,不太好用哦。
‘伍’ 免费好用的OCR软件是哪个可以提取图片或者PDF文字的工具.谢谢!
用云脉文档识别工具,可以识别普通照片、电脑截图、纸质文档、PDF文件等,下面是操作步骤介绍:
步骤一:下载并打开“云脉文档识别”工具,进入软件后,点击绿色“+”号,选择图片识别/图像拍摄。
步骤四:获得识别结果后,可以根据自己的需要,对文件名、文件备注、文件分组进行重新编辑,并存储、分享和收藏。
‘陆’ 哪位高手知道怎么把PDF图片里的文字提取出来么
图片性质的pdf,应该使用OCR识别软件提取。您可以使用 汉王PDFOCR 软件试试。
‘柒’ 有没有什么软件可以把PDF格式中的文字和图片提取出来
你用什么软件 看pdf的文件的呢 ?一般都是可以的呀,你选择选择工具就可以选择图片用快照工具就可以截图的
‘捌’ pdf全是图片,用什么软件才能有效的把图片中的文字复制出来
用这个软件把,看图。