怎样把tif格式转换成doc格式的文本_毛毛的空间

来源:百度文库 编辑:神马文学网 时间:2024/03/28 18:50:42
怎样把tif格式的文本转换成doc格式的文本2007-03-06 13:18

这是word换PDF~
PDF文件格式转换心得
世事无绝对,首先解密方面,试过几种软件,最好用的还是Passware_Acrobat Key,其次是Adult PDF Password Recovery v2.2.0PDF Password Remover v2.2,再次,至于图像扫描的文本转换,中文的话,比较麻烦,将图片存为不压缩的TIF格式,用清华TH-OCR 9.0版或者汉王文本王进行识别转换,如只是部分识别也可以不存图片,用文通慧视小灵鼠进行屏幕捕获识别,上面这3个OCR软件可以在VeryCD.Com上面下载,如果是文本格式可用Solid Converter PDF转换成Word编辑翻译,不过,Solid Converter PDF支持的语言较多,英文和繁体中文应该也没问题,至于英文方面,文本格式的PDF可以通过ABBYY PDF Transformer 1.0进行文本转换,格式为RTF可以在Word中编辑,图像格式可以使用最近刚推出的OCR软件_IRIS Readiris Pro v10.0,速度效果都还不错,最后翻译软件方面就看大家自己的喜好了。以上是个人的小小心得,仅供各位参考!
最近更新的Recosoft PDF2Office Personal v2.0软件也可以将PDF文件转换成DOC格式,也支持中文,如果有专业版就更好了。IRIS Readiris Pro v10.0也有亚洲语言支持包OCR,如果可以下载到带Keygen的最新版本就可以转换中文了!目前看来只有再等等看了!
部分软件可以在eastgame.net的ISO和0day下载到,也可以去Verycd.com找不到部分!
这是PDF换WORD
PDF文件是很常见的一类电子文档,但在对其中的文字进行摘录时很不方便,有很多将PDF文件转化为文本的工具软件,但直接在Office中转化却是Office 2003中新增的一项功能,与其它专用的程序相比,限制少,使用方便,它实质是利用了OCR文字识别方法,故对含图片等对象识别后会有一些乱码,但对纯文字内容的转化正确率是比较高的,使用也非常方便。
在Office中将PDF转换为DOC(word文件)具体实现是利用Office 2003中的Microsoft Office 文档 Imaging组件来实现这一要求。 
  第一步:先用Adobe Reader打开想转换PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office 文档 Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
  注:如果没有找到“Microsoft Office 文档 Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。
第二步:运行“Microsoft Office 文档 Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
  注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在word2003中可用,其它版本没有Microsoft Office 文档 Image Writer。