马上注册,结交更多好友,享用更多功能,让你轻松玩转闽南师范大学。
您需要 登录 才可以下载或查看,没有账号?立即加入
×
很久以前,PDF格式文件就已经出现在我们的日常工作中,但由于某些方面的因素,这一极具优势的格式一直没能获得大规模的应用。在经历了一段时间的沉寂这后,随着互联网技术的发展以及以内联网为代表的网络环境的完善,再加上其制造者Adobe公司的大力推广,PDF格式已经成为在Internet 上进行跨平台传输最通用的文件格式。 5 L0 m# s; V2 m# g
< > 大家可能会在许多地方遇到很多PDF格式的电子教程、说明书等文件,但在某些时候,您很可能需要将它们转换成其他格式,从而能够方便地使用相关软件进行编辑。 </P>
/ W& v5 p/ r! M d) E0 }< > 但是,PDF文件格式的特殊性众所周知,因此在转换时,需要针对不同情况选择不同的方法。如何将PDF文件转换为TXT格式恐怕是目前大家最关心的话题了,在转换的过程中通常会出现2种可能的情况,本文将针对这2种情况,为您详细介绍具体的转换方法。 </P>0 H/ E ^* D2 ^# W
< >第一种情况: 文件内容多为文字 </P>
$ C% Q. l# q* Q' \0 {< > 如果需要转换的PDF文件的内容不是PDF图片,且内容不多,可以在打开PDF文件后,点击工具栏中含有“T”字样的“文本选择工具”按钮,在鼠标指针变为“I”字型后,通过拖拽鼠标选定当前页中需要复制的文本内容,然后选择“编辑”*“复制”,将选定的内容复制到剪贴板,最后到其他的编辑软件中进行“粘贴”即可。 </P>+ J S# y. C9 }
< > 如果需要转换的PDF文件的内容比较多,您可以使用第三方软件Aerial达到批量转换的目的。Aerial是Adobe Acrobat软件的一个插件,其30天免费试用版的下载地址为<IMG><a href="http://www.ambia.com/" target="_blank" >http://www.ambia.com</A>。虽然Aerial的使用说明中指出它只能支持Acrobat Reader 3.0版本,但是经验证明,它同样支持Acrobat Reader 5.0中文版,只需在安装时将默认路径改变为Acrobat Reader 5.0的安装路径即可。 </P>6 s8 Y' H8 N; n% [- E- o7 n0 F0 g+ Z
< > Aerial安装完成后,在Acrobat Reader工具栏的“增效工具”菜单中就会多出一个“Aerial”子菜单(如图1所示)。依次选择“增效工具”*“Aerial”*“Save As RIF”,进入“Save As RIF”对话框(如图2所示)。在“General”选项卡中,选择适合的输出程序和输出页码范围,然后单击“File Name”按钮指定保存文件名,再次单击“OK”按钮即可将文件转换为RIF格式,最后使用 Word打开RIF文件并保存为TXT文档即可。当然,您还可以使用一些专门的转换工具,例如著名的PDFTools等。 <BR><a href="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01a.gif" target="_blank" ><IMG src="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01a.gif" border=0></A></P># H' J5 }4 H1 d
< ><a href="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01b.gif" target="_blank" ><IMG src="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01b.gif" border=0></A></P>; V) U) @. B( Q4 f8 S
< >第二种情况: 文件内容多为图片 </P>( H' T% T" d1 ^5 g, R) a
< > 如果需要转换的PDF文件全部是PDF格式图片,这时Aerial等其他第三方插件就无能为力了。如果文件很大,整个过程则会比较烦琐。 </P>
8 N6 i0 x, a: d% P7 c& O< >1.PDF文件转换成BMP文件 </P>
# b+ s% X0 B$ ~/ R<P> 当然,您完全可以将PDF文件打开后,使用抓图工具一页一页地抓取并保存成BMP文件,但是这显然是最笨的解决方法了。这里我们向您推荐一款实用的工具软件——Konvertor_pdf2xxx,它可以一次性将所有页面转换为连续的多个BMP文件,其免费试用版下载地址为<IMG><a href="http://www.tucows.com/mmedia/preview/220570.html" target="_blank" >http://www.tucows.com/mmedia/preview/220570.html</A>。Konvertor_pdf2xxx的工作界面如图3所示。具体使用方法如下。 </P>! Q1 h* x1 E; e- T
<P><a href="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01c.gif" target="_blank" ><IMG src="http://www.pcworld.com.cn/issue/2003/0304/pics/0409_01c.gif" border=0></A></P>7 \' O6 W& ]( r' e% `) g, x' ?1 J
<P> (1)选中“Input setup”项目的“Paths”选项卡,在“Source Path”文本输入栏中指定需要转换的PDF文件所在的文件夹; 点击“Select files”按钮,在弹出的“Select”对话框中,选择需要转换的PDF文件; 选中“Output setup”项目的“Paths”选项卡,在“Target path”文本输入栏中指定转换后生成BMP文件的保存路径。 </P>
% F9 X# z# f( {4 H: ?8 R<P> (2)选中“Input setup”项目的“Output”选项卡,在“Output format”下拉列表中设定文件格式为BMP,在“Misc”选项卡中设置需要转换PDF文件的页码范围,以及转换时的分辨率。 </P>( h$ C2 x0 z! K; H7 x
<P> 根据笔者经验,普通的五号字体(100%显示比例)的PDF图片采用250~300dpi即可; 如果字号比较大(即四号以上),采用 150~200dpi较好; 如果是六号或七号字,可以考虑使用400~500dpi。当然,您也可以根据图片的实际质量加大分辨率。但需要注意的是,当分辨率超过600dpi后,系统的转换速度会直线下降,有时候甚至会发生假死机等情况。 </P>) z* ]; E. C# }( ?
<P> 接下来,选中“Output setup”项目的“Misc”选项卡,在“Target file name”项目中设置生成BMP文件的名称,在“Resize”项目中设定生成BMP图片长和宽的像素值。如果PDF图像文件自身的质量不是很好,可以适当地将像素值设定得大一些,例如1600× 1200; 然后,在“BMP”选项卡中设置图片颜色为“Black & White”选项。 </P>
& |/ V; H7 q% F7 h<P> (3)单击“Launch”按钮开始格式转换,生成的BMP文件将保存在前面指定的位置,转换所需的时间跟您的设置有很大关系。 </P>: `3 q" x# _: B# A" O' ?$ M' d
<P>2.通过OCR软件将图片中的字符识别出来 </P>
+ ]" a) q9 X, d# E4 g4 g<P> 这里推荐您使用清华紫光的OCR光学字符识别软件,您可以到清华紫光的主页<IMG><a href="http://www.thunis.com/default.htm" target="_blank" >http://www.thunis.com/default.htm</A>下载清华紫光OCR 2000 千禧专业版。 </P>- ^9 \/ f$ {, j M/ }8 }: U
<P> 选择“文件”*“打开”,在弹出的“打开”对话框中,选中前Konvertor_pdf2xxx转换得到的BMP图片。然后,选择“命令”*“全部识别”,一次性将所有打开的BMP图片进行识别。最后,选择“文件”*“导出”,在弹出的“导出为”对话框中定义保存的文件名,并指定保存文件类型为 TXT即可。</P> |