pdf複製至word變亂碼 好像該pdf字型特殊 有無辦法破解
latest #32
PDF第幾版呢?我印象中這幾年的pdf已經都可以存成unicode。只有大約五六年前的中日韓文pdf才有這個問題,那個時候的PDF內嵌代碼。不然你把檔案傳給我,讓我做實驗看看。
pdfmaker轉的,規格acrobat 5.x ,就是我說的那種舊版的。
有一個辦法,找一個OCR軟體,像是以前的丹青中文OCR那種的
正確的說,他沒有內嵌unicode的碼。而是存一種當時流行的碼,叫做CID
有試過Acrobat pro 內鍵OCR辨試 殘念
他們原先是用word打字,再用列印到acrobat 印表機輸出成PDF,應該有原始的word
這東西很多嗎?找一個舊版,可以在windows2000跑的OCR應該比較方便,大陸做的清華紫光OCR不錯,我要上網查查看。也許有「迷」之版本
早個幾年,我敢自稱是兩岸少數幾個這類電子文件資料的專家,現在有了unicode,什麼專家都是假的
那只有剩下我想到的最後一個方法,用小畫家抓螢幕畫面上的圖,存成JPG,丟進去丹青OCR,或是清華OCR辨認
Acrobat 8 可存jpg等圖檔 再用丹青辨認
如果有軟體,就可以試試看,這是打字以外的做法。OCR需要重新校對,有時候錯字會錯得很離譜。
嗯,印象中應該會高一點,如果是6-7成,我會建議重新打字
打注音法嗎?如果是的話,改用自然注音會比較快喔,大約可以到一分鐘40-50字,他的長句子辨認的比較準,想要選字也比較方便,還有標點符號鍵。
back to top