电竞比分网-中国电竞赛事及体育赛事平台

分享

【PDF】怎樣將掃描的圖片變成可編輯文件

 ***壁虎漫步*** 2012-07-14

 

 PDF的強(qiáng)大完全不用懷疑,哈哈,本期的PDF被用來解決下面這類問題:

第一類問題——通過OCR文本識別功能識別掃描版的PDF文檔。什么是掃描版的PDF文檔?就是那些不能復(fù)制粘貼的文檔。通過識別,可將文檔導(dǎo)出為可編輯文檔

第二類問題——通過OCR文本識別圖片上的文字,將其導(dǎo)出為可編輯的文檔,這個(gè)方法可用來對付那些不能復(fù)制的網(wǎng)站,截圖之后利用文本識別得到文字

 

 

工具/原料

  •  Adobe Acrobat Pro 9 (或系列軟件)

如何識別掃描版的PDF文檔

  1.  一些電子版的書籍大多通過掃描的方式得到,這類的PDF稱為掃描版的PDF。好的,我們就來處理這類文檔吧

     

  2. 以上面上傳的PDF截圖為例,把它當(dāng)做是掃描版的PDF文檔的部分頁面。首先大家通過頁面直觀的就可以看出它是掃描版的文檔:點(diǎn)擊文本,文本選中,無法復(fù)制

    右擊沒有復(fù)制命令

    點(diǎn)擊頁面變色

  3. 好的,然后我們可以開始識別工作了。一次點(diǎn)擊{文檔}{OCR文本識別}{使用OCR識別文本}

  4. 在彈出窗口根據(jù)需要選擇{所有頁面}或者{當(dāng)前頁面}

  5. 點(diǎn)擊編輯設(shè)置需要識別的語言。如果是中文簡體,就選擇它,如果是英語就選擇英語

  6. 點(diǎn)擊確定,開始識別

  7. 通過幾秒鐘的識別處理,我們發(fā)現(xiàn)原來不能復(fù)制的文檔內(nèi)容可以右擊復(fù)制~\(≧▽≦)/~啦啦啦

  8. 最后我們一次點(diǎn)擊{文件}{導(dǎo)出}{word文檔}可以將其導(dǎo)出為文檔,開始編輯了。完美?。?/P>

    、

識別無法復(fù)制網(wǎng)頁內(nèi)容

  1. 對于不能復(fù)制的網(wǎng)頁內(nèi)容,這個(gè)是比較討厭的,就來對付他們吧

  2. 以取材以大家熟悉的內(nèi)容為原則,我們來處理一下百度知道的三個(gè)按鈕吧,哈哈。

  3. 首先,利用截屏按鈕或者截圖軟件把需要識別的部分截圖成圖片。利用系統(tǒng)自帶畫圖軟件,得到需要處理的部分圖片

  4. 把圖片保存在桌面或者其它你容易找到的位置。右擊轉(zhuǎn)化為PDF文檔

  5. 然后按照{(diào)識別掃描版的PDF文檔}的相應(yīng)步驟我們就可以得到下面內(nèi)容啦

     

注意事項(xiàng)

  •  識別的文檔內(nèi)容最好是黑白的,沒有雜色,這樣的識別效果才能最大化

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多