『壹』 如何提取出PDF圖片文字
1)將PDF文件的各頁導出為圖片
2)用OCR軟體將這些圖片識別為WORD文檔
具體步驟可參見http://..com/question/5755640.html
『貳』 求一款軟體可以識別並提取pdf中圖片的漢字。
圖片可以用Chief-Win PDF Converter PE提取出來,此軟體小巧,但提取速度快,效率高,同時還可提取文字成Word、TXT文檔。但圖片中的漢字……只能提取後用專業識別程序來做吧,不過效率極其低,效果極其差,還不如你自己打字來的爽
你這是掃描後製作的,那就只能抽出圖片了,因為掃描儀掃描進去的一般是tif文件
Chief-Win PDF Converter下載地址(納米盤):
http://www.namipan.com/d/
內附破解文件
『叄』 如何從PDF圖片中提取文字
用OCR就可以了.
比如Office 2003中也提供了文字識別服務,結合那個Image writer可以很方便將PDF轉成WORD。
Office2003實現PDF文件轉Word文檔
經過嘗試,發現可以利用 Office 2003 中的 Microsoft Office Document Imaging 組件來實現PDF轉WORD文檔,也就是說利用WORD來完成該任務。方法如下:
用Adobe Reader 打開想轉換的PDF文件 ,接下來 選擇 「文件→列印」菜單,在打開的「列印」窗口中將 「列印機」欄中的名稱設置為 「Microsoft Office Document Image Writer」,確認後將該PDF文 件輸出為 MDI格式的虛擬列印文件 。
注: 如果沒有找到「Microsoft Office Document Image Writer」項,使用Office 2003安裝光碟中的「添加/刪除組件」更新安裝該組件,選中「Office 工具 Microsoft DRAW轉換器」。
然後, 運行 「Microsoft Office Document Imaging」,並利用它來 打開 剛才保存的MDI文件,選擇「工具→ 將文本發送到Word 」菜單,在彈出的窗口中選中「 在輸出時保持圖片版式不變 」,確認後系統會提示「必須在執行此操作前重新運行 OCR 。這可能需要一些時間」,不管它, 確認 即可。
注: 對PDF轉DOC的識別率不是特別完美,轉換後會丟失原來的排版格式,所以轉換後還需要手工對其進行排版和校對工作。
以上僅在 word2003 中可用,其他版本沒有Microsoft Office Document Image Writer
『肆』 怎麼樣將PDF文件中的圖片中的文字提取出來
哈哈,我前段時間剛剛解決這個問題,首先,下一個叫PDFEdit的軟體,它可以幫你提取你所謂的都是圖片的PDF中的(其實是掃描版)你需要的頁數,還可以對防寫的PDF進行解碼,比如,一個PDF文件一共有300頁,你需要其中的第1頁,第50-60頁,第203-205頁,直接在軟體里輸入「1,50-60,203-205」;其次,你還要下一個叫ABBYY FineReader 10 Professional Edition的軟體,這個軟體可以掃描PDF文件中的文字並轉化到Word中,可以編輯的哦,不是圖片(但要注意的是凡是掃描的東西都有誤差,不可能每個字都是正確的,上面的軟體會把可能錯誤的字用顏色標出來,你可以自己直接修改)。
這個是我花了好久才找到的,一定要給分哦。我已經用這兩個軟體編輯了好多東西了!確定對你有幫助,我也試了好多軟體,這兩個最好用,而且完全是傻瓜版,很好用,不需要什麼專業知識。
如果你需要的話,告訴我郵箱,直接發給你。
樓上說的漢王,我也試過,不太好用哦。
『伍』 免費好用的OCR軟體是哪個可以提取圖片或者PDF文字的工具.謝謝!
用雲脈文檔識別工具,可以識別普通照片、電腦截圖、紙質文檔、PDF文件等,下面是操作步驟介紹:
步驟一:下載並打開「雲脈文檔識別」工具,進入軟體後,點擊綠色「+」號,選擇圖片識別/圖像拍攝。
步驟四:獲得識別結果後,可以根據自己的需要,對文件名、文件備注、文件分組進行重新編輯,並存儲、分享和收藏。
『陸』 哪位高手知道怎麼把PDF圖片里的文字提取出來么
圖片性質的pdf,應該使用OCR識別軟體提取。您可以使用 漢王PDFOCR 軟體試試。
『柒』 有沒有什麼軟體可以把PDF格式中的文字和圖片提取出來
你用什麼軟體 看pdf的文件的呢 ?一般都是可以的呀,你選擇選擇工具就可以選擇圖片用快照工具就可以截圖的
『捌』 pdf全是圖片,用什麼軟體才能有效的把圖片中的文字復制出來
用這個軟體把,看圖。