A. 有没有把 txt 或者其他格式的文本文件转换成epud或者pdf格式文本文件的软件
《文档格式转换器》(AVS Document Converter)v2.1.2.182
http://www.verycd.com/topics/2907431/
支持所有主要格式
读:PDF, HTML, HTM, MHT, RTF, DOC, DOCX, ODT, PPT, PPTX, TXT, TIFF, TIF, EPUB, FB2, DjVu, XPS
写:PDF, HTML, MHT, RTF, DOC, DOCX, ODT, TXT, GIF, JPEG, PNG, TIFF, EPUB
B. 有没有什么软件能将录音文件转换成文本格式的
应该不会有。象IBM的ViaVoice、微软语音等软件,对语音的识别都需要经过使用者的语音识别训练,ViaVoice是180句,以此来识别你的语音特征。
应该不会有什么天才软件能识别任意录音文件。
C. 有能将电脑里图片上的文字复制或转换成文本格式的软件吗
可以利用Office 2003新增的OCR功能从图片中提取文字
Office在2003版中增加了Document Imaging工具,用它可以查看、管理、读取和识别图像文档和传真文本。其实,利用它的这个功能,我们还可以把网页或电子书中的文字给“抠”出来。
打开电子书,尽量采用较大的字体,翻到想要获取的页面,用抓图软件SnagIt对相关的内容进行抓取,然后在“文件”菜单中选择“复制到剪贴板”命令(也可以用其他抓图软件,当然最简单的是Windows中自带的Print Screen键来抓取整个屏幕,然后在“画图”程序中对不要的部分进行裁剪并保存,然后复制)。
在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到Document Imaging中,在“工具”中选择“使用OCR识别文本”,Document Imaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字,
提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好
你也可以用尚书六号
我用了一下还不错 你到绿盟去下吧
D. 有没有一种软件能把图片上的字转换成word或者文本格式
首先用图片工具将图片另存为.tiff格式,然后利用office
2003中的Microsoft
Office
Document
Imaging工具就可以实现识别图片文本了
E. 推荐1个办公室各种格式文件可以相互转换的软件感激。
为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识别效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,版面乱七八糟,无法使用。现在好了,针对各种情况下文字识别进行总结,帮助掌握正确方法,节省时间,给出了所有情况下全文件表格、图形、文字识别的完美解决方案:
1、PDF文件的识别:
1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 5 专业版,注意不是acrobat reader,直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到word等中。
2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003,并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个PDF文件识别输出到word文件中。
注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)
3)加密的Pdf文件:先下载解密软件,解密后在参看1),2)
4)繁体pdf文件:用2)的方法识别到word后,用word中的“工具”--“语言”---“中文繁简转换”
2、让JPG上的文字转换到WORD中在日常工作中,我们可能会遇到需要把扫描后的表格或文章再重新修改或排版,然而大家都知道,扫描后的文件格式是图片格式.一般情况下只有高档点的扫描仪可以直接选择扫描成PDF后者WORD格式.但是如果我们只有普通的扫描仪,而又要做到修改扫描后的文档,现在我就来教大家怎么在条件限制下,达到我们的目的.
首先我们要准备好OFFICE 2003,然后打开OFFCIE工具中的Micosoft Office Document Scanning工具,设置完后,我们就可以在需要修改的图片上右击,选择打印,然后一直下一步,知道选择打印机时,选择Micosoft Office Document Image Writer,然后将图片打印到文件扩展名为mdi格式的图片格式.打开后选择菜单工具中的"将文本发送到WORD".就是这么简单方便
3、caj文件的识别:
1)局部文字识别:直接使用caj浏览器的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样
3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为word。
4、超星文件的识别:
1)局部文字识别:直接使用超星浏览器的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到word中,在合并到一起。打印时要填入打印页码从1到最后一页,不要选择打印全部。此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。注意:识别速度比其他格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的word版本时,你会欣喜若狂的,呵呵。我的试验结果是一本280页的书,识别需要几分钟的时间。
3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的pdf文件,然后在用1、的方法转成word
5、其他情况下的识别:
使用snagit软件将任何形式的文字可以变成图片,例如使用snagit将屏幕拷贝成图片,然后右键点击图片文件,用microsoft Office Document Image打开图形,其他和2)一样。
注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要注册,要么识别速度很慢,要么使用不便(和word结合不紧),这些软件包括:紫光ocr,万方pdfocr,尚书,汉王,ScanSoft PDF Converter,pdf2word,以及各种被推荐的软件等等,我都装过,现在都像垃圾一样删除了。只要安装了acrobat 专业版,snagit,office2003,现在你可以完美的做任何事,最重要的是这几个软件很好得到。
针对一些问题的补充:
经过一些试验,发现microsoft Office Document Image 存在一些不稳定的问题,例如在用caj打印到Microsoft Office Document Image Writer打印机时,发现用caj5.5版本比较快,(caj5.5不能加升级补丁),而caj5.0有时出现假死机。
另外页面显示大时,转化的识别率较高。
如果页数多的文件,包括超星,如果有问题,可以分多次转化。
再次补充:
1、由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度和C盘空间以及内存空间,建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在右下角系统栏中会出现打印机图,你可以双击,看到打印任务的进度,以免以为死机了。另外转化完成后请删除c:\windows\temp目录下的虚拟打印文件,否则你的c盘很快会被用光。
2、建议如果发生打印到Microsoft Office Document Image Writer很慢或者假死的情况,可以先打印到snagit虚拟打印机,会自动生成tiff文件,速度比Microsoft Office Document Image Writer快,然后在snagit中,选择打印机为Microsoft Office Document Image Writer打印机,(相当于再打印到Microsoft Office Document Image Writer打印机),然后选择snagit---outputs下的printer,然后选择snagit----file----finish output,即可生成msi文件,其他一样。
F. 急求能打开bib格式文件的软件或着转换为其他文本格式的方法。。。
bib格式的文件是参考文献. 在我们用ctex写论文的时候, bib格式的文件相当于一个参考文献数据库. 可以用记事本打开该文件.你可以看到该文件记录了参考文献的信息,例如,题目,作者,时间等等.
当然, 也可以用ctex打开.这样就自动生成了一篇文章的参考文献.
G. 有没有一种软件可以将扫描仪扫描下的文字材料转换成文本格式
扫描仪扫描出来的是图片格式的,不知道网上又没有自动识别软件。
以前在一家平面公司工作,有一个自动识别软件,可以把扫描的图片文字
识别为txt可编写文字格式的~不过好像是扫描仪上自带的~
H. 请问用什么软件可以把扫描的文档(含图)里的文字挖出来转换成文本格式
你用那个Adobe Reader PDF阅读器就可以了啊,图片和文字都可以复制的,下载个这个就行了