pdf複製至word變亂碼 好像該pdf字型特殊 有無辦法破解

jsdar 正在

2009-08-25T15:50:47.000Z

pdf複製至word變亂碼好像該pdf字型特殊有無辦法破解

latest #32

三腳貓型地痞rice_b

2009-08-25T22:48:39.000Z

PDF第幾版呢？我印象中這幾年的pdf已經都可以存成unicode。只有大約五六年前的中日韓文pdf才有這個問題，那個時候的PDF內嵌代碼。不然你把檔案傳給我，讓我做實驗看看。

jsdar 說

2009-08-26T11:52:54.000Z

檔案已傳試試看

三腳貓型地痞rice_b

2009-08-26T11:58:24.000Z

傳到哪裡，hotmail嗎？

立即下載

三腳貓型地痞rice_b

2009-08-26T12:00:03.000Z

MS1.hinet，收到了。

jsdar 說

2009-08-26T12:05:08.000Z

它確實有內崁代碼不知如何轉換

三腳貓型地痞rice_b

2009-08-26T12:06:02.000Z

pdfmaker轉的，規格acrobat 5.x ，就是我說的那種舊版的。

三腳貓型地痞rice_b

2009-08-26T12:07:02.000Z

有一個辦法，找一個OCR軟體，像是以前的丹青中文OCR那種的

三腳貓型地痞rice_b

2009-08-26T12:07:26.000Z

從螢幕把圖抓下來，放進去OCR掃瞄辨認

三腳貓型地痞rice_b

2009-08-26T12:07:57.000Z

我手頭沒有OCR軟體，也許重新打字比較快。

三腳貓型地痞rice_b

2009-08-26T12:08:59.000Z

正確的說，他沒有內嵌unicode的碼。而是存一種當時流行的碼，叫做CID

jsdar 說

2009-08-26T12:09:45.000Z

還好字不多後來只好打字

jsdar 說

2009-08-26T12:11:58.000Z

有試過Acrobat pro 內鍵OCR辨試殘念

三腳貓型地痞rice_b

2009-08-26T12:15:44.000Z

他們原先是用word打字，再用列印到acrobat 印表機輸出成PDF，應該有原始的word

三腳貓型地痞rice_b

2009-08-26T12:16:32.000Z

acrobat pro裡現在有OCR？第幾版的？

三腳貓型地痞rice_b

2009-08-26T12:18:57.000Z

這東西很多嗎？找一個舊版，可以在windows2000跑的OCR應該比較方便，大陸做的清華紫光OCR不錯，我要上網查查看。也許有「迷」之版本

三腳貓型地痞rice_b

2009-08-26T12:20:32.000Z

早個幾年，我敢自稱是兩岸少數幾個這類電子文件資料的專家，現在有了unicode，什麼專家都是假的

三腳貓型地痞rice_b

2009-08-26T12:26:33.000Z

不好意思，沒幫上忙

jsdar 說

2009-08-26T12:33:01.000Z

Acrobat 8 Pro (CS3)

三腳貓型地痞rice_b

2009-08-26T12:39:19.000Z

acrobat 8的產品說明中說是中文OCR

三腳貓型地痞rice_b

2009-08-26T12:39:29.000Z

完全不能用嗎？

jsdar 說

2009-08-26T12:43:48.000Z

有試過沒用

三腳貓型地痞rice_b

2009-08-26T12:49:09.000Z

那只有剩下我想到的最後一個方法，用小畫家抓螢幕畫面上的圖，存成JPG，丟進去丹青OCR，或是清華OCR辨認

jsdar 說

2009-08-26T12:55:25.000Z

Acrobat 8 可存jpg等圖檔再用丹青辨認

三腳貓型地痞rice_b

2009-08-26T12:59:02.000Z

如果有軟體，就可以試試看，這是打字以外的做法。OCR需要重新校對，有時候錯字會錯得很離譜。

jsdar 說

2009-08-26T13:15:18.000Z

沒錯辨識精確率約6至7成

三腳貓型地痞rice_b

2009-08-26T13:17:53.000Z

嗯，印象中應該會高一點，如果是6-7成，我會建議重新打字

jsdar 說

2009-08-26T13:43:35.000Z

打字一直沒進步至今還不能完全不看鍵盤

三腳貓型地痞rice_b

2009-08-26T13:49:03.000Z

打注音法嗎？如果是的話，改用自然注音會比較快喔，大約可以到一分鐘40-50字，他的長句子辨認的比較準，想要選字也比較方便，還有標點符號鍵。

jsdar 說

2009-08-26T13:56:00.000Z

不太習慣新注音有時忘記按enter打的字全消失

三腳貓型地痞rice_b

2009-08-26T14:04:25.000Z

那麼你用哪一個輸入法？

jsdar 說

2009-08-26T14:09:42.000Z

最笨注音

三腳貓型地痞rice_b

2009-08-26T14:13:14.000Z

挑字太辛苦了，應該交一個網路筆友，天天練