A. 有沒有把 txt 或者其他格式的文本文件轉換成epud或者pdf格式文本文件的軟體
《文檔格式轉換器》(AVS Document Converter)v2.1.2.182
http://www.verycd.com/topics/2907431/
支持所有主要格式
讀:PDF, HTML, HTM, MHT, RTF, DOC, DOCX, ODT, PPT, PPTX, TXT, TIFF, TIF, EPUB, FB2, DjVu, XPS
寫:PDF, HTML, MHT, RTF, DOC, DOCX, ODT, TXT, GIF, JPEG, PNG, TIFF, EPUB
B. 有沒有什麼軟體能將錄音文件轉換成文本格式的
應該不會有。象IBM的ViaVoice、微軟語音等軟體,對語音的識別都需要經過使用者的語音識別訓練,ViaVoice是180句,以此來識別你的語音特徵。
應該不會有什麼天才軟體能識別任意錄音文件。
C. 有能將電腦里圖片上的文字復制或轉換成文本格式的軟體嗎
可以利用Office 2003新增的OCR功能從圖片中提取文字
Office在2003版中增加了Document Imaging工具,用它可以查看、管理、讀取和識別圖像文檔和傳真文本。其實,利用它的這個功能,我們還可以把網頁或電子書中的文字給「摳」出來。
打開電子書,盡量採用較大的字體,翻到想要獲取的頁面,用抓圖軟體SnagIt對相關的內容進行抓取,然後在「文件」菜單中選擇「復制到剪貼板」命令(也可以用其他抓圖軟體,當然最簡單的是Windows中自帶的Print Screen鍵來抓取整個屏幕,然後在「畫圖」程序中對不要的部分進行裁剪並保存,然後復制)。
在「開始」菜單的「Microsoft Office工具」中打開Microsoft Office Document Imaging,在左側窗口中單擊滑鼠右鍵,選擇「粘貼頁面」,把復制的圖片粘貼到Document Imaging中,在「工具」中選擇「使用OCR識別文本」,Document Imaging的OCR識別程序就會對圖片進行識別,完成後選擇「工具」中的「將文本發送到Word」,程序會自動打開Word文檔,展現在你面前的就是從圖片中「摳」出來的文字,
提示:一般而言,識別的准確率可以達到95%以上,但對英文和數字的識別不是太好
你也可以用尚書六號
我用了一下還不錯 你到綠盟去下吧
D. 有沒有一種軟體能把圖片上的字轉換成word或者文本格式
首先用圖片工具將圖片另存為.tiff格式,然後利用office
2003中的Microsoft
Office
Document
Imaging工具就可以實現識別圖片文本了
E. 推薦1個辦公室各種格式文件可以相互轉換的軟體感激。
為不同格式的文件怎麼變成word文件發愁嗎?各種識別軟體各有缺陷,識別效率低,讓你痛苦不堪,有的只能識別字,對表格和圖形無能為力,識別完了,版面亂七八糟,無法使用。現在好了,針對各種情況下文字識別進行總結,幫助掌握正確方法,節省時間,給出了所有情況下全文件表格、圖形、文字識別的完美解決方案:
1、PDF文件的識別:
1)文件可以直接識別的(以文本形式保存的PDF文件):安裝acrobat 5 專業版,注意不是acrobat reader,直接另存為rtf文件(識別整個文件),或者選擇工具欄上的文字選擇按鈕,然後選擇文字區域,然後復制到word等中。
2)文件不能直接識別的(以圖片形式保存的PDF文件):安裝office2003,並裝上office工具Microsoft Office Document Imaging(完全安裝此工具),然後在列印機裡面會增加Microsoft Office Document Image Writer列印機,然後將PDF文件列印到此列印機,選擇列印形成的文件的保存位置,然後會自動形成一個MDI文件,並且自動用Microsoft Office Document Image打開此文件,然後選擇「工具」菜單下的「使用ocr識別文本」,識別完成後,在選擇「工具」下的,「將文本發送到word」,最後將把整個PDF文件識別輸出到word文件中。
注意:Microsoft Office Document Image可以非常准確的全文件識別轉化中文、英文、表格,但是無法將圖形輸出到word,而是把文件中的所有圖形單獨形成一個個獨立的圖片文件,放在相同位置的一個相同名稱的文件夾中,因此可用snagit軟體將圖形打開,然後復制到word中。(所有的識別軟體都不能很好的處理圖形的識別問題,Microsoft Office Document Image的這種處理方法已經是非常好的解決這個問題了。)
3)加密的Pdf文件:先下載解密軟體,解密後在參看1),2)
4)繁體pdf文件:用2)的方法識別到word後,用word中的「工具」--「語言」---「中文繁簡轉換」
2、讓JPG上的文字轉換到WORD中在日常工作中,我們可能會遇到需要把掃描後的表格或文章再重新修改或排版,然而大家都知道,掃描後的文件格式是圖片格式.一般情況下只有高檔點的掃描儀可以直接選擇掃描成PDF後者WORD格式.但是如果我們只有普通的掃描儀,而又要做到修改掃描後的文檔,現在我就來教大家怎麼在條件限制下,達到我們的目的.
首先我們要准備好OFFICE 2003,然後打開OFFCIE工具中的Micosoft Office Document Scanning工具,設置完後,我們就可以在需要修改的圖片上右擊,選擇列印,然後一直下一步,知道選擇列印機時,選擇Micosoft Office Document Image Writer,然後將圖片列印到文件擴展名為mdi格式的圖片格式.打開後選擇菜單工具中的"將文本發送到WORD".就是這么簡單方便
3、caj文件的識別:
1)局部文字識別:直接使用caj瀏覽器的ocr
2)全文件識別:列印到Microsoft Office Document Image Writer列印機,後面和上面的2)操作一樣
3)博碩論文全文下載:在線閱讀博碩論文,待可以看到最後一頁後,不要關閉caj瀏覽器,到caj安裝目錄下cache中找到一個較大的文件,拷貝到其他位置即可。然後使用2)全部轉化為word。
4、超星文件的識別:
1)局部文字識別:直接使用超星瀏覽器的ocr
2)全文件識別:列印到Microsoft Office Document Image Writer列印機,後面和上面的2)操作一樣,要注意的是,超星列印功能有點區別,因為超星是目錄和全文分開的,所以列印時,需要分別把目錄和正文識別到word中,在合並到一起。列印時要填入列印頁碼從1到最後一頁,不要選擇列印全部。此外在列印選項中,還要將頁面比例設成真實大小,而不是整寬。注意:識別速度比其他格式要慢很多,請保持耐心,但是最後當你看到輕松的生成全本書的word版本時,你會欣喜若狂的,呵呵。我的試驗結果是一本280頁的書,識別需要幾分鍾的時間。
3)超星相對比較麻煩一些,如果還有問題,可以先把超星列印成完整的pdf文件,然後在用1、的方法轉成word
5、其他情況下的識別:
使用snagit軟體將任何形式的文字可以變成圖片,例如使用snagit將屏幕拷貝成圖片,然後右鍵點擊圖片文件,用microsoft Office Document Image打開圖形,其他和2)一樣。
注意:其他的各種識別軟體請不要在用,因為要麼只能識別中文,要麼只能識別英文,要麼不能識別整個文件,要麼不能識別屏幕拷貝圖像,要麼識別誤差很大,要麼不能識別表格,要麼需要注冊,要麼識別速度很慢,要麼使用不便(和word結合不緊),這些軟體包括:紫光ocr,萬方pdfocr,尚書,漢王,ScanSoft PDF Converter,pdf2word,以及各種被推薦的軟體等等,我都裝過,現在都像垃圾一樣刪除了。只要安裝了acrobat 專業版,snagit,office2003,現在你可以完美的做任何事,最重要的是這幾個軟體很好得到。
針對一些問題的補充:
經過一些試驗,發現microsoft Office Document Image 存在一些不穩定的問題,例如在用caj列印到Microsoft Office Document Image Writer列印機時,發現用caj5.5版本比較快,(caj5.5不能加升級補丁),而caj5.0有時出現假死機。
另外頁面顯示大時,轉化的識別率較高。
如果頁數多的文件,包括超星,如果有問題,可以分多次轉化。
再次補充:
1、由於虛擬列印到Microsoft Office Document Image Writer 比較慢,並且形成的虛擬文件很大,1本200多頁的書大約是60M,因此會嚴重影響機器的運行速度和C盤空間以及內存空間,建議配置好的機器一次轉化不要超過200頁,配置差的不要超過100頁,同時列印時在右下角系統欄中會出現列印機圖,你可以雙擊,看到列印任務的進度,以免以為死機了。另外轉化完成後請刪除c:\windows\temp目錄下的虛擬列印文件,否則你的c盤很快會被用光。
2、建議如果發生列印到Microsoft Office Document Image Writer很慢或者假死的情況,可以先列印到snagit虛擬列印機,會自動生成tiff文件,速度比Microsoft Office Document Image Writer快,然後在snagit中,選擇列印機為Microsoft Office Document Image Writer列印機,(相當於再列印到Microsoft Office Document Image Writer列印機),然後選擇snagit---outputs下的printer,然後選擇snagit----file----finish output,即可生成msi文件,其他一樣。
F. 急求能打開bib格式文件的軟體或著轉換為其他文本格式的方法。。。
bib格式的文件是參考文獻. 在我們用ctex寫論文的時候, bib格式的文件相當於一個參考文獻資料庫. 可以用記事本打開該文件.你可以看到該文件記錄了參考文獻的信息,例如,題目,作者,時間等等.
當然, 也可以用ctex打開.這樣就自動生成了一篇文章的參考文獻.
G. 有沒有一種軟體可以將掃描儀掃描下的文字材料轉換成文本格式
掃描儀掃描出來的是圖片格式的,不知道網上又沒有自動識別軟體。
以前在一家平面公司工作,有一個自動識別軟體,可以把掃描的圖片文字
識別為txt可編寫文字格式的~不過好像是掃描儀上自帶的~
H. 請問用什麼軟體可以把掃描的文檔(含圖)里的文字挖出來轉換成文本格式
你用那個Adobe Reader PDF閱讀器就可以了啊,圖片和文字都可以復制的,下載個這個就行了