jsdar 正在
15 years ago
pdf複製至word變亂碼 好像該pdf字型特殊 有無辦法破解
latest #32
PDF第幾版呢?我印象中這幾年的pdf已經都可以存成unicode。只有大約五六年前的中日韓文pdf才有這個問題,那個時候的PDF內嵌代碼。不然你把檔案傳給我,讓我做實驗看看。
jsdar
15 years ago
檔案已傳 試試看
傳到哪裡,hotmail嗎?
立即下載
MS1.hinet,收到了。
jsdar
15 years ago
它確實有內崁代碼 不知如何轉換
pdfmaker轉的,規格acrobat 5.x ,就是我說的那種舊版的。
有一個辦法,找一個OCR軟體,像是以前的丹青中文OCR那種的
從螢幕把圖抓下來,放進去OCR掃瞄辨認
我手頭沒有OCR軟體,也許重新打字比較快。
正確的說,他沒有內嵌unicode的碼。而是存一種當時流行的碼,叫做CID
jsdar
15 years ago
還好字不多 後來只好打字
jsdar
15 years ago
有試過Acrobat pro 內鍵OCR辨試 殘念
他們原先是用word打字,再用列印到acrobat 印表機輸出成PDF,應該有原始的word
acrobat pro裡現在有OCR?第幾版的?
這東西很多嗎?找一個舊版,可以在windows2000跑的OCR應該比較方便,大陸做的清華紫光OCR不錯,我要上網查查看。也許有「迷」之版本
早個幾年,我敢自稱是兩岸少數幾個這類電子文件資料的專家,現在有了unicode,什麼專家都是假的
不好意思,沒幫上忙
jsdar
15 years ago
Acrobat 8 Pro (CS3)
acrobat 8的產品說明中說是中文OCR
完全不能用嗎?
jsdar
15 years ago
有試過 沒用
那只有剩下我想到的最後一個方法,用小畫家抓螢幕畫面上的圖,存成JPG,丟進去丹青OCR,或是清華OCR辨認
jsdar
15 years ago
Acrobat 8 可存jpg等圖檔 再用丹青辨認
如果有軟體,就可以試試看,這是打字以外的做法。OCR需要重新校對,有時候錯字會錯得很離譜。
jsdar
15 years ago
沒錯 辨識精確率約6至7成
嗯,印象中應該會高一點,如果是6-7成,我會建議重新打字
jsdar
15 years ago
打字一直沒進步 至今還不能完全不看鍵盤
打注音法嗎?如果是的話,改用自然注音會比較快喔,大約可以到一分鐘40-50字,他的長句子辨認的比較準,想要選字也比較方便,還有標點符號鍵。
jsdar
15 years ago
不太習慣新注音 有時忘記按enter打的字全消失
那麼你用哪一個輸入法?
jsdar
15 years ago
最笨注音
挑字太辛苦了,應該交一個網路筆友,天天練
back to top