2021年從圖片中讀取文字、把圖片轉(zhuǎn)換成文本格式(用word附帶功能就能做到)_第1頁(yè)
2021年從圖片中讀取文字、把圖片轉(zhuǎn)換成文本格式(用word附帶功能就能做到)_第2頁(yè)
2021年從圖片中讀取文字、把圖片轉(zhuǎn)換成文本格式(用word附帶功能就能做到)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、超簡(jiǎn)單從圖片中讀取文字的方法(使用word自帶軟件)(全文原創(chuàng),轉(zhuǎn)載請(qǐng)注明版權(quán)。本文下載免費(fèi),如果對(duì)您有一定幫助,請(qǐng)?jiān)谟疫吔o予評(píng)價(jià),這樣有利于將本文檔位于百度搜索結(jié)果的靠前位置,方便本方法的推廣)【本文將介紹讀取圖片中的文字、讀取書(shū)中文字、讀取pdf格式文件中的文字的方法】一、背景看到圖片中滿(mǎn)是文字,而你又想把這些文字保存下來(lái),怎么辦?日常讀書(shū),某篇文章寫(xiě)的極好,想把它到網(wǎng)絡(luò)上,怎么辦?一個(gè)字一個(gè)字敲進(jìn)電腦?太麻煩了。是不是希望有一種東西能自動(dòng)識(shí)別讀取這些文字?是的,科技就是拿來(lái)偷懶的。其實(shí)你們電腦中安裝的word早就為你考慮過(guò)這些問(wèn)題了,只是你還不知道。二、方法1、圖片格式轉(zhuǎn)換只有特定格式的

2、圖片才能讀取文字,所以要轉(zhuǎn)換。大家常見(jiàn)的圖片格式都是jpg,或者png,bmp等,用電腦自帶的畫(huà)圖軟件打開(kāi)你要獲取文字的圖片(畫(huà)圖軟件在開(kāi)始所有程序附件中,win7用戶(hù)直接右擊圖片,選擇編輯,就默認(rèn)使用畫(huà)圖軟件打開(kāi)圖片),然后把圖片另存為tiff格式。(以我的win7畫(huà)圖為例。另存為tiff格式如下圖)2、打開(kāi)讀取文字的工具開(kāi)始所有程序microsoft office microsoft office工具microsoft office document imaging(本文全部以office23為例。另外,有些人安裝的是office精簡(jiǎn)版,可能沒(méi)有附帶這個(gè)功能,那就需要添加安裝一下,安裝步驟

3、見(jiàn)文末注釋?zhuān)?、導(dǎo)入tiff格式的圖片在microsoft office document imaging軟件界面中,選擇文件導(dǎo)入,然后選擇你剛才存放的tiff格式的圖片,導(dǎo)入。4、文字識(shí)別點(diǎn)擊下圖橙色方框圈中的圖標(biāo),進(jìn)行ocr識(shí)別,就是讓軟件把圖片中的文字讀取出來(lái)(圖片中文字越多,識(shí)別花費(fèi)的時(shí)間越長(zhǎng),進(jìn)行識(shí)別完成之后,左邊縮略圖框中會(huì)有一個(gè)眼睛的標(biāo)志,如圖紅色箭頭所指);點(diǎn)擊下圖橙色橢圓圈中的圖標(biāo),就能將整個(gè)圖片中的文本發(fā)送到word。5、也可以選擇圖片中的部分文字。首先還是要點(diǎn)擊ocr識(shí)別(如果上面已經(jīng)識(shí)別過(guò),就不用再識(shí)別一次了,具體看有沒(méi)有眼睛標(biāo)志),然后點(diǎn)擊下圖中左上角菜單中的箭頭,就

4、可以自由拖動(dòng)選擇文字、圖片,右擊選擇框,就可以復(fù)制文本、圖片或者將選中的文字發(fā)送到word。6、展示一下識(shí)別效果7、重要說(shuō)明一般來(lái)講,圖片清晰、對(duì)比鮮明的時(shí)候,該軟件對(duì)文字的識(shí)別率在95%以上,但不能保證1%。為保險(xiǎn)起見(jiàn),還是要人工核對(duì)一下識(shí)別的結(jié)果,尤其是格式特別復(fù)雜、有特殊文字、特殊符號(hào)的地方。識(shí)別率與圖片清晰度、文字大小、文字的端正程度、文字與底色的對(duì)比程度有關(guān)。不要指望你用肉眼都看不清楚或者不能分辨的文字可以用該軟件識(shí)別出來(lái)。該軟件的原理是使用掃描的文本字符與系統(tǒng)內(nèi)置的字符形狀、語(yǔ)言辭典進(jìn)行比較,從而識(shí)別文字,只能掃描指定的語(yǔ)言,其他語(yǔ)言不能識(shí)別。要更改使用的掃描語(yǔ)言,在“工具”菜單下

5、選項(xiàng)ocr選項(xiàng)卡ocr語(yǔ)言,選擇你要使用的語(yǔ)言。一般默認(rèn)使用的語(yǔ)言跟你word的默認(rèn)語(yǔ)言相同,因此沒(méi)有特殊要求,不必更改。現(xiàn)在網(wǎng)上有許多這方面的專(zhuān)門(mén)軟件(百度一下ocr就出來(lái)了),使用的基本原理都是ocr,但人家既然號(hào)稱(chēng)“專(zhuān)業(yè)”,可能功能更強(qiáng)大一些(比如支持更多語(yǔ)言)、識(shí)別率更高一些(具體是不是,我沒(méi)用過(guò),也不知道,感覺(jué)word自帶的這個(gè)就夠用了),而且,他們大都需要付費(fèi),我就看到一款在淘寶賣(mài)的,叫價(jià)69元(淘寶網(wǎng)址可以參見(jiàn)文末注釋?zhuān)?。三、其他讀取文字的需要1、讀取書(shū)上的文字可以把書(shū)上的文字用像素較高的相機(jī)照下來(lái),注意照片要端正,盡量清晰,白紙黑字對(duì)比鮮明的照片最好,然后對(duì)照片執(zhí)行以上操作。2

6、、讀取pdf文件用adobe reader 打開(kāi)pdf格式的文件如果讀取全文,在adobe reader中單擊文件打印,將“打印機(jī)”設(shè)置為“microsoft office document image writer”,單擊打印,默認(rèn)輸出tiff格式虛擬打印文件(也可以設(shè)置為輸出mdi格式的文件),然后對(duì)輸出的tiff格式文件或者mdi格式文件執(zhí)行以上讀取文字的操作;如果讀取部分文字,翻到你需要的文字所在頁(yè)面,摁下prscrn鍵(有抓取屏幕圖像的功能),然后打開(kāi)microsoft office document imaging,在左側(cè)窗口中單擊右鍵,選擇“粘貼頁(yè)面”,就能把剛才prscrn鍵抓

7、取的整個(gè)屏幕粘貼到document imaging中,然后執(zhí)行以上讀取文本的操作。需要說(shuō)明的是,現(xiàn)在pdf轉(zhuǎn)word,有更多更方便的方法了。一是現(xiàn)在大家使用的新版的adobe reader,其本身就能把pdf頁(yè)面中的文字轉(zhuǎn)換成文本文檔;二是同方知網(wǎng)獨(dú)創(chuàng)的cajviewer軟件(免費(fèi)),一般被用來(lái)閱讀知網(wǎng)的論文使用,也可以閱讀pdf格式的文件,對(duì)pdf文本的操作功能更多;三是上網(wǎng)轉(zhuǎn)換,百度一下“pdf to word ”,就有許多免費(fèi)的軟件和許多免費(fèi)的在線(xiàn)網(wǎng)站提供轉(zhuǎn)換服務(wù)(網(wǎng)站大多是英文的,但也很簡(jiǎn)單理解),能一步到位把pdf全文轉(zhuǎn)換為word 格式。四、科普一下ocr,optical char

8、acter recognition ,通過(guò)光學(xué)技術(shù)對(duì)文字進(jìn)行識(shí)別,當(dāng)有大量文字需要錄入電腦的時(shí)候,如果能有計(jì)算機(jī)自動(dòng)完成,要比人工錄入快很多,且節(jié)省人力和時(shí)間。ocr軟件需要光學(xué)輸入設(shè)備(如掃描儀,數(shù)碼相機(jī)等)的配合,構(gòu)成ocr系統(tǒng)。microsoft office document scanning組件,便于用戶(hù)通過(guò)掃描儀將文檔掃描到計(jì)算機(jī);microsoft office document imaging組件,便于用戶(hù)在計(jì)算機(jī)屏幕上查看掃描的文檔、重拍多頁(yè)文檔、選擇識(shí)別的文本并操作等等。電子文本是指帶有文字的圖片或者電子書(shū)籍(指諸如pdf格式的書(shū)籍而并非txt格式的電子書(shū)),用戶(hù)需要從中提取文字。導(dǎo)入電子文本的方式有兩種,掃描文檔和導(dǎo)入tag圖像文件(tiff)、microsoft document imaging文件(mdi)。注釋添加office ocr工具的方法(以office23為例)使用office23安裝軟件的“添加或刪除功能(a),更改已安裝的功能或刪除指定的功能”選項(xiàng),安裝該組件,單擊下一步;勾選“選擇應(yīng)用程序的高級(jí)自定義”選項(xiàng),單擊下一步;打開(kāi)“office工具”“microsoft office document imaging”,選擇安裝“掃描、ocr和索引服務(wù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論