昨天打算帮儿子把PDF格式的作业转成Word格式,可是,用在线转换工具完成后,表格全乱,字也乱码。赶紧去PDF论坛找相关的大神,找了几个原因,分别试了下,终于搞定了,今天把原因和相对应的解决方法分享给大家。
其实我也很好奇到底怎么回事,把5份不同格式的PDF拆开看了,发现乱码的原因就这几种。
---
原因一:文件本身是扫描件
很多PDF其实是图片,不是文字。用普通转换工具直接转,出来的就是乱码。
怎么判断:在PDF里用鼠标选文字,如果选不中,就是扫描件。
解决:先用OCR工具识别文字再转。Adobe Acrobat有OCR功能,PDF24也有免费的OCR。识别完再转Word,就不会乱码。
---
原因二:字体缺失
有些PDF用的特殊字体,电脑里没有,转出来就乱码。
怎么判断:转完后乱码的文字看起来像符号,不是正常汉字。
解决:用WPS转,它对中文字体支持好,会自动替换缺失字体。或者转之前把PDF打印成新的PDF(用Microsoft Print to PDF),把字体“印”进去再转。
---
原因三:表格太复杂
带合并单元格、跨页的表格,很多工具处理不了。
怎么判断:转完后表格边框没了,内容挤在一起。
解决:用iLovePDF的“增强版OCR”功能,它对表格识别准。或者用Adobe的“导出表格”单独转表格部分。
---
原因四:加密文件
有些PDF有编辑限制,转了也改不了。
怎么判断:转完后文档打不开,或者能打开但改不了。
解决:先用PDF24的“移除密码”功能(限自己的文件),或者用Chrome打开PDF,点打印,另存为新的PDF,密码就没了。
---
原因五:工具选错
不同工具擅长的不一样。
怎么选:
· 纯文字PDF:PDF24最快
· 带表格的PDF:iLovePDF最准
· 扫描件PDF:Adobe OCR最强
· 要发给别人用的:WPS最稳
---
总结
遇到PDF转Word乱码,先看是哪种情况:
扫描件就先OCR再转。字体缺失就换WPS。表格复杂用iLovePDF。加密就先解密。工具选对,一次搞定。
你曾经遇到过PDF转Word乱码的时候吗?如果的话,试试这些方法,说不定能解决你的问题!