⑴ pdf乱码是怎么回事
原因如下:
原因一、说明你的pdf文档是扫描版的,也就是由扫描图片制成的pdf文档蔽迟激弊,由于一般的pdf转换软件无法识别,使用造宏铅李成出现乱码或者是出现文字重叠。
原因二、pdf文件是不是内嵌了很多字体,如果你PDF文件中内嵌的某个或者某些字体在你的操作系统中没有,那么转换出来的word文件一般都会出现乱码。
⑵ PDF转换后全是乱码怎么办
方法一:当出现罕见字体时
1.首先在文档属性中检查该pdf文件所用的字体,将字体名称记录下来后将其关闭。
图3 pdf字体
2.之后在互联网上下载对应的字体,并将字体移动到Fonts目录中即可。
图4 fonts目录
方法二:当ocr文字识别技术较弱时
1.打开ABBYY FineReader,在首页目录选择需要转换的文件格式,这里可供选择的有word、excel、ppt等上百种格式。
图5 转换格式
2.之后选择好要转换的文件,选择图像质量为最佳,并将“全文搜索”一栏改为“如在原始文档中”。
图6 高睁搭质量转换
3.之后打开“更多选项”,在“ocr”下方勾选“通篇识别”,点击下方确定,最后回到准备页面开始转换,这样输出的pdf文件就不会出现乱码了。
图7 通篇识别
三、pdf乱码怎么恢复正常
1.找到源头pdf文件,将其拖动到ABBYY软件中在ocr编辑器中打开,此模式可以敬早腊审核并验证已识别的文字,且能够通过手动绘制区域来进行ocr识别。
图8 ocr编辑器
2.之后软件会生成左右两个页面,分别是原版文件和ocr识别结果,左边可以选中识别区域,右边则可以查看转换结果并进行编辑。
图9 原版与转换文件
3打开下图标注的按钮,软件会突出显示疑似错误的字符,通过此方法能够从根本上解亮滑决pdf乱码的问题,也可以将pdf乱码恢复正常。