怎麼樣把掃描的pdf轉成可編輯的word
展開全部
掃描過後的就是圖片格式了,做成PDF或DOC那也是圖片插入的。
兩個方法可以解決你的問題。
1。 用Adobe Acrobat 8 Professional系列或者第三方轉換軟體SolidConverterPDFv4之類的,把那些圖片進行轉換,輸出為TXT格式。
但這個的提前是你掃描的時候,解析度要高些,不然可能會輸出為空白的TXT。
2。 實在沒辦法了,才用ORC軟體進行識別。但ORC軟體的識別率也不是100%,它會把源文件的很多線條什麼的也都進行識別,造成誤判。
反正你想要把圖片格式的PDF或者DOC變成能編輯,那麼後期的重新校對排版是必須的了。
我自己的經驗,第一個方法相對要好很多,建議樓主試試。
不清楚的地方可以M我
chyidc@sohu。com
用福昕閱讀器看看是不是能複製文字的,如果不能就是說是圖片做的,用漢王ocr來識別,如果能,下載小丑魚 pdf轉換成word,直接就能轉好了
展開全部
使用OCR軟體進行識別。在網上搜索一下OCR就能找到很多這種軟體
展開全部
如果PDF文件是透過掃描紙質檔案生成的,就不能夠用上述簡單的方法匯出文字了,但也可以藉助OCR文字識別技術來匯出文字。
在adobe acrobat裡可以操作選單“文件”→“OCR文字識別”→“使用OCR識別文字”,經過識別以後,就可以用“選擇工具”選中文字進行復制了。
adobe reader沒有自帶OCR文字識別功能,但可以這樣操作,操作選單“檔案”→“列印”,印表機名稱選擇“Microsoft Office Document Image Writer”,這是一個隨Microsoft Office 2003一起安裝到計算機裡的虛擬印表機,它將PDF文件列印到字尾為“mdi”的檔案裡,並自動開啟,在開啟的“mdi”檔案裡依次操作選單“工具”→“使用OCR識別文字”和“工具”→“將文字傳送到word”就可以將文字匯出到一個Word文件裡。
OCR文字識別技術的識別率取決於建立PDF文件時的掃描精度,那些字跡模糊不清的文件,能夠正確識別出的文字也不會太多。
詳見http://hi。baidu。com/d%5Fzzn0470/blog/item/f3784fb16e20dc5c09230280。html