⑴ pdf亂碼是怎麼回事
原因如下:
原因一、說明你的pdf文檔是掃描版的,也就是由掃描圖片製成的pdf文檔蔽遲激弊,由於一般的pdf轉換軟體無法識別,使用造宏鉛李成出現亂碼或者是出現文字重疊。
原因二、pdf文件是不是內嵌了很多字體,如果你PDF文件中內嵌的某個或者某些字體在你的操作系統中沒有,那麼轉換出來的word文件一般都會出現亂碼。
⑵ PDF轉換後全是亂碼怎麼辦
方法一:當出現罕見字體時
1.首先在文檔屬性中檢查該pdf文件所用的字體,將字體名稱記錄下來後將其關閉。
圖3 pdf字體
2.之後在互聯網上下載對應的字體,並將字體移動到Fonts目錄中即可。
圖4 fonts目錄
方法二:當ocr文字識別技術較弱時
1.打開ABBYY FineReader,在首頁目錄選擇需要轉換的文件格式,這里可供選擇的有word、excel、ppt等上百種格式。
圖5 轉換格式
2.之後選擇好要轉換的文件,選擇圖像質量為最佳,並將「全文搜索」一欄改為「如在原始文檔中」。
圖6 高睜搭質量轉換
3.之後打開「更多選項」,在「ocr」下方勾選「通篇識別」,點擊下方確定,最後回到准備頁面開始轉換,這樣輸出的pdf文件就不會出現亂碼了。
圖7 通篇識別
三、pdf亂碼怎麼恢復正常
1.找到源頭pdf文件,將其拖動到ABBYY軟體中在ocr編輯器中打開,此模式可以敬早臘審核並驗證已識別的文字,且能夠通過手動繪制區域來進行ocr識別。
圖8 ocr編輯器
2.之後軟體會生成左右兩個頁面,分別是原版文件和ocr識別結果,左邊可以選中識別區域,右邊則可以查看轉換結果並進行編輯。
圖9 原版與轉換文件
3打開下圖標注的按鈕,軟體會突出顯示疑似錯誤的字元,通過此方法能夠從根本上解亮滑決pdf亂碼的問題,也可以將pdf亂碼恢復正常。