怎么才能把PDF中的扫描成的书中的文字转化成WORD格式

来源:百度文库 编辑:神马文学网 时间:2024/04/27 23:55:53
怎么才能把PDF中的扫描成的书中的文字转化成WORD格式? 悬赏分:50 - 解决时间:2006-3-27 08:59怎么才能把PDF中的扫描成的书中的文字转化成WORD格式?我下了一本书,但是里面的字不识很清晰,而且不可以编辑。我想把它弄为WORD格式的,就能打印了。
我下了几个能转换格式的,从pdf到word的,但是还只是扫描出来的图片,并不能编辑。大家能给我一个具体的答案吗?万分感谢。我现在真的很急用!
问题补充:就是我下载了一本书,使pdf格式的。但是里面的文本是用扫描仪扫的,都是一张一张图片组成的,不能编辑。我转成word后还是一张张图片。大家说怎么才能变成可编辑的文字阿??

在自己没有扫描仪的情况下怎么办呢?用OCR识别软件还用有扫描仪吗?希望大家能说得具体点。大恩不言谢!OCR识别软件还用有扫描仪吗?提问者: libinichen - 童生 一级 最佳答案如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。
它能够将扫描的文字直接导入到WORD中进行编辑。


Pdf转化word

1. 第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。





2. 情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件——>另存为——>把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。Ny1
情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。
回答者:agi_78 - 见习魔法师 二级 3-13 16:33提问者对于答案的评价:很可以的,多谢 评价已经被关闭 目前有 0 个人评价

50% (0) 不好
50% (0)
对最佳答案的评论我想把由扫面图片组成的pdf另存为txt tiff或jpg格式都提示许可不足 无法提取图象 请问怎么解决 我的pdf有几百页我想把它们一次性用汉字识别软件识别出来 应该怎么做 不能全选 一次只能选一张评论者: fengmuling - 试用期 一级 怎么那么麻烦呀,你如果只导出文字的话,Adobe Reader自带一个导出功能的,你点别存为——保存为(TXT)——保存,之后所有的文全部出来了,连版都不用排。直接考到WORD里边就成了。评论者: 乐可宝 - 试用期 一级 其他回答共 6 条好像现在的工具都不能 如果有也通知我一下 回答者:xiaooliter - 童生 一级 3-13 15:45尚书OCR软件可以将图片格式的文字转成可编辑的,不过你说的不清晰,就有点难度了 回答者:小洪 - 高级魔法师 六级 3-13 15:46用汉王2.5试试,我一直用,还不错。 回答者:梦飞船2006 - 魔法师 四级 3-13 15:46史上最好的PDF转WORD工具----SolidConverterPDF[带注册]

由于个人编辑时,用PDF格式的很不方便经常要转为WORD格式,有没有好的工具呢,有很少,这款就是史上最好的软件

文件大小: 16000 K

超酷PDF转换WORD工具,100%支持中文,唯一支持中文的!安装的时候是英文,装好就是中文了!
说明:安装的时候是英文,装好就是中文了!
注册方法:Name:zhou_S_@sohu.com
Email:zhou_S_@sohu.com
Organization: zhou_S_@sohu.com
Unlock code: XGXT
注:邮箱与注册码是必须填写正确,其余则是可以随便填写的。
注册运行后有网络验证,把注册表里的HKEY_CURRENT_USER\Software\SolidDocuments\SolidConverterPDF\HistoryList键值删除即可。(或者用防火墙禁止访问网络?)


破解补丁:

path.exe是注册补丁 patch到软件的安装目录下即可。

超酷PDF转换WORD工具,100%支持中文,唯一支持中文的!内有效果图!

安装的时候是英文,装好就是中文了!

下载地址:
http://www.peee.net/Soft/rj/200507/767.html 回答者:jojohans - 魔法学徒 一级 3-15 17:28用图片制作的PDF文件转换成WORD文件也还是图像,是无法直接编辑的。比较简单的办法是将图像中的文字识别出来,然后就可以编辑了。

你可以这样去做:
一、将PDF文件中的各页图像提取出来
1)使用Adobe Acrobat软件
2)在上面菜单上选文件>导出>提取图像为>JPEG文件(其他二种也行,JPEG文件比较小)
3)按提示,选择一个适当的文件夹,保存图像
二、安装一个文字识别(OCR)软件用来识别已提取的图像
本人使用过多款识别软件,推荐汉王文本王、清华紫光TH,它们不但汉字识别率高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出WORD文件;使用起来也都不复杂。
三、输出成WORD文件,进行编辑打印。 回答者:玉梭 - 见习魔法师 三级 3-21 21:41用尚书七号OCR软件吧。
操作简单,而且识别率高!
不需要扫描仪设备,直接把图片识别成文字。
下载:
http://www.okget.com/Soft/Soft_1265.htm 回答者:vasonchen - 助理 二级 3-24 17:18