jsdar
正在 2009-08-25T15:50:47.000Z
pdf複製至word變亂碼 好像該pdf字型特殊 有無辦法破解
latest #32
PDF第幾版呢?我印象中這幾年的pdf已經都可以存成unicode。只有大約五六年前的中日韓文pdf才有這個問題,那個時候的PDF內嵌代碼。不然你把檔案傳給我,讓我做實驗看看。
jsdar
說 2009-08-26T11:52:54.000Z
檔案已傳 試試看
jsdar
說 2009-08-26T12:05:08.000Z
它確實有內崁代碼 不知如何轉換
pdfmaker轉的,規格acrobat 5.x ,就是我說的那種舊版的。
有一個辦法,找一個OCR軟體,像是以前的丹青中文OCR那種的
正確的說,他沒有內嵌unicode的碼。而是存一種當時流行的碼,叫做CID
jsdar
說 2009-08-26T12:09:45.000Z
還好字不多 後來只好打字
jsdar
說 2009-08-26T12:11:58.000Z
有試過Acrobat pro 內鍵OCR辨試 殘念
他們原先是用word打字,再用列印到acrobat 印表機輸出成PDF,應該有原始的word
這東西很多嗎?找一個舊版,可以在windows2000跑的OCR應該比較方便,大陸做的清華紫光OCR不錯,我要上網查查看。也許有「迷」之版本
早個幾年,我敢自稱是兩岸少數幾個這類電子文件資料的專家,現在有了unicode,什麼專家都是假的
jsdar
說 2009-08-26T12:33:01.000Z
Acrobat 8 Pro (CS3)
jsdar
說 2009-08-26T12:43:48.000Z
有試過 沒用
那只有剩下我想到的最後一個方法,用小畫家抓螢幕畫面上的圖,存成JPG,丟進去丹青OCR,或是清華OCR辨認
jsdar
說 2009-08-26T12:55:25.000Z
Acrobat 8 可存jpg等圖檔 再用丹青辨認
如果有軟體,就可以試試看,這是打字以外的做法。OCR需要重新校對,有時候錯字會錯得很離譜。
jsdar
說 2009-08-26T13:15:18.000Z
沒錯 辨識精確率約6至7成
嗯,印象中應該會高一點,如果是6-7成,我會建議重新打字
jsdar
說 2009-08-26T13:43:35.000Z
打字一直沒進步 至今還不能完全不看鍵盤
打注音法嗎?如果是的話,改用自然注音會比較快喔,大約可以到一分鐘40-50字,他的長句子辨認的比較準,想要選字也比較方便,還有標點符號鍵。
jsdar
說 2009-08-26T13:56:00.000Z
不太習慣新注音 有時忘記按enter打的字全消失
jsdar
說 2009-08-26T14:09:42.000Z
最笨注音
back to top