掃描儀與OCR課件_第1頁(yè)
掃描儀與OCR課件_第2頁(yè)
掃描儀與OCR課件_第3頁(yè)
掃描儀與OCR課件_第4頁(yè)
掃描儀與OCR課件_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

掃描儀與OCR技術(shù)1、什么是掃描儀?

掃描儀是一種獲取圖像的設(shè)備,并將信息轉(zhuǎn)為電腦可以顯示、編輯、存儲(chǔ)和輸出的數(shù)字格式。即可以完成以下工作:在文件中插隊(duì)圖和照片;將文字識(shí)別,免去打字;將傳真文件掃到庫(kù)中存檔;在多媒體中加入圖像;在報(bào)刊中加入圖片有效表達(dá)主題。掃描儀通過光源照射到被掃描的材料上來獲得材料的圖像。材料將光線反射到CCD(ChangeCoupledDevice,電荷偶合器件)的光敏元件上,由于材料不同的位置反射的光線強(qiáng)弱不同,CCD器件將光線轉(zhuǎn)換成數(shù)字信號(hào),并傳送到計(jì)算機(jī)中,此時(shí)我們就獲得了材料的圖像。如果您將紙張上的文字掃描到電腦中就可以通過OCR(光學(xué)字符識(shí)別)軟件將圖像轉(zhuǎn)換成文字,可以減輕錄入工作。掃描儀的技術(shù)發(fā)展很快,但就其光學(xué)系統(tǒng)而言,不外乎CIS、CCD和棱鏡分色系統(tǒng)幾類,由于CIS(接觸式圖像傳感器)十分適合OCR(光學(xué)字符識(shí)別),特別是其黑白方式,比CCD方式的掃描儀價(jià)格低廉,所以市場(chǎng)占有率曾一度較大,但隨著掃描儀市場(chǎng)從黑白到灰度再到彩色的轉(zhuǎn)變,彩色CIS掃描儀也已進(jìn)入市場(chǎng)。采用三棱鏡分色系統(tǒng),使得彩色掃描儀的關(guān)鍵技術(shù)全面提高,該系統(tǒng)利用光學(xué)物理原理,以三棱鏡來分離自然光R、G、B三原色,由于三原色采用一致的角度,同一時(shí)間曝光完成,使掃描的圖像的邊緣光潔度十分理想,掃描三維立體圖像時(shí),效果更好,這一技術(shù)代表未來新潮流,目前,只有少數(shù)幾個(gè)廠家擁有該技術(shù)。CCD是目前掃描儀的主要技術(shù),它的發(fā)展已從黑白、灰度演變到8位、12位、24位、30位乃至36位彩色,這決定了掃描儀的基本發(fā)展趨勢(shì),即其精度和色彩度方面將不斷增高。

決定掃描儀掃描質(zhì)量的因素很多,首先,分辨率是掃描儀的一項(xiàng)重要指標(biāo),掃描儀的分辨率包括光學(xué)分辨率和插值分辨率,作為掃描儀真實(shí)分辨率的光學(xué)分辨率,又分為水平分辨率和垂直分辨率兩種方式,水平分辨率和光源系統(tǒng)CCD的真實(shí)分辨率及相應(yīng)的硬件電路設(shè)計(jì)有關(guān),它是由CCD的像素點(diǎn)數(shù)除以掃描儀最大可掃描尺寸而得到的數(shù)值;垂直分辨率則與傳動(dòng)機(jī)構(gòu)的精密程度有關(guān),水平分辨率較垂直分辨率顯得更為重要。為提高掃描儀的圖像質(zhì)量,利用軟件技術(shù)在硬件產(chǎn)生的像點(diǎn)之間插入另外的像點(diǎn),由此獲得的分辨率稱為插值分辨率,該種分辨率在一定程度上使掃描儀的圖像質(zhì)量得到提高。所以,選擇掃描儀一定要弄清其光學(xué)分辨率是多少,即便是光學(xué)分辨率高的掃描儀,在處理不同的掃描儀介質(zhì)對(duì)象時(shí),其性能表現(xiàn)也迥然不同。

例如在掃描彩色照片時(shí),較低的分辨率效果反而更好,一般而言,分辨率在150~200dpi之間為最佳;而掃描膠片時(shí)則需要較高的分辨率,因此在選擇掃描儀時(shí),對(duì)分辨率因素的選擇要和用戶的用途結(jié)合起來考慮。掃描儀具有精確的縮放技術(shù)能力也是非常重要的,它可極大地影響圖像質(zhì)量、掃描文件的大小以及掃描和處理的時(shí)間??s放的質(zhì)量和掃描圖像的質(zhì)量在不同掃描儀間差異非常大。實(shí)驗(yàn)結(jié)果表明,一定的插值分辨率在一特定的掃描儀中能產(chǎn)生最小的鋸齒,而在其他插值分辨率下,卻不一定具有最低的鋸齒。某插值分辨率對(duì)某一掃描儀合適,對(duì)另一掃描儀卻不一定帶來最低的鋸齒,因此,僅根據(jù)插值分辨率的大小判斷掃描儀的質(zhì)量是不可靠的。

決定掃描質(zhì)量的因素還有色彩定位能力、圖像噪音、灰度精確度、光源的一致性等。另外,掃描儀的掃描速度和掃描圖像的質(zhì)量之間一直是相互制約的,掃描速度的提高總是以損失圖像信息為代價(jià),對(duì)掃描儀的這一指標(biāo),也應(yīng)該和傳統(tǒng)的認(rèn)識(shí)有所區(qū)別。事實(shí)上,傳統(tǒng)的掃描速度只是將圖像送入計(jì)算機(jī)中所需的時(shí)間大小的度量,除了用于光學(xué)字符識(shí)別(OCR)或進(jìn)行掃描文檔管理的掃描儀之外,掃描速度不是十分關(guān)鍵的指標(biāo),而其他指標(biāo)也影響掃描處理的速度,如從掃描儀到計(jì)算機(jī)的數(shù)據(jù)傳輸速度;圖像存儲(chǔ)到磁盤的速度;掃描圖像瀏覽和設(shè)置曝光的時(shí)間;對(duì)掃描結(jié)果進(jìn)行校正處理和調(diào)整的時(shí)間等。

一、OCR的發(fā)展

要談OCR的發(fā)展,早在60、70年代,世界各國(guó)就開始有OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開始有一些簡(jiǎn)單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國(guó)所倡導(dǎo)的地址書寫方式。

一個(gè)OCR識(shí)別系統(tǒng),其目的很簡(jiǎn)單,只是要把影像作一個(gè)轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計(jì)算機(jī)文字,使能達(dá)到影像資料的儲(chǔ)存量減少、識(shí)別出的文字可再使用及分析,當(dāng)然也可節(jié)省因鍵盤輸入的人力與時(shí)間。掃描:掃描是紙質(zhì)文稿圖像輸入計(jì)算機(jī)的過程。一般把相關(guān)文稿順序掃描,在掃描質(zhì)量控制程序自動(dòng)檢測(cè)并修正后,自動(dòng)保存到數(shù)據(jù)庫(kù)中。圖像處理:為了提高識(shí)別率,對(duì)圖像進(jìn)行“消藍(lán)去污”的處理,即去掉圖像上影響識(shí)別率的噪音如麻點(diǎn)、下劃線等,圖像質(zhì)量控制程序自動(dòng)監(jiān)測(cè)圖像處理質(zhì)量。版面分析:能自動(dòng)進(jìn)行版面理解并定位,判別劃框區(qū)域是橫排文本區(qū)、豎排文本區(qū)、表格區(qū)還是圖像區(qū),并對(duì)不同屬性的區(qū)域以不同顏色的線框標(biāo)識(shí)出來。自動(dòng)版面分析在后臺(tái)運(yùn)行,操作人員可在前臺(tái)進(jìn)行確認(rèn),必要時(shí)對(duì)自動(dòng)版面分析結(jié)果加入手工干預(yù)。識(shí)別:把文字圖像轉(zhuǎn)化為計(jì)算機(jī)文字內(nèi)碼,可以識(shí)別印刷體和手寫體中文(包括簡(jiǎn)體字和繁體字)、表格、中英文混排,識(shí)別出來的文字內(nèi)碼可以是GB碼、BIG5碼、GBK碼或者Unicode碼。識(shí)別過程在后臺(tái)運(yùn)行??v向校對(duì):縱向校對(duì)是將一個(gè)圖像或若干個(gè)圖像中識(shí)別成同一個(gè)字的文字圖像列在一起顯示,并以突出顏色標(biāo)出可疑字,便于操作員發(fā)現(xiàn)錯(cuò)誤和修改。橫向校對(duì):這是傳統(tǒng)的人工校對(duì)方法,操作員直接對(duì)比識(shí)別結(jié)果文本和圖像,以發(fā)現(xiàn)識(shí)別錯(cuò)誤文字。系統(tǒng)自動(dòng)調(diào)出文字對(duì)應(yīng)的圖像,進(jìn)行比對(duì)。同時(shí),以醒目的顏色標(biāo)出識(shí)別可信度不高的文字。版面還原:將識(shí)別并修改好的文本還原成跟掃描文稿版面的布局一樣、可以供計(jì)算機(jī)閱讀和查詢檢索的RTF、PDF、HTML、SGML/XML格式的數(shù)字文檔。文字特征抽取:?jiǎn)我宰R(shí)別率而言,特征抽取可說是OCR的核心,用什么特征、怎么抽取,直接影響識(shí)別的好壞,也所以在OCR研究初期,特征抽取的研究報(bào)告特別的多。而特征可說是識(shí)別的籌碼,簡(jiǎn)易的區(qū)分可分為兩類:一為統(tǒng)計(jì)的特征,如文字區(qū)域內(nèi)的黑/白點(diǎn)數(shù)比,當(dāng)文字區(qū)分成好幾個(gè)區(qū)域時(shí),這一個(gè)個(gè)區(qū)域黑/白點(diǎn)數(shù)比之聯(lián)合,就成了空間的一個(gè)數(shù)值向量,在比對(duì)時(shí),基本的數(shù)學(xué)理論就足以應(yīng)付了。而另一類特征為結(jié)構(gòu)的特征,如文字影像細(xì)線化后,取得字的筆劃端點(diǎn)、交叉點(diǎn)之?dāng)?shù)量及位置,或以筆劃段為特征,配合特殊的比對(duì)方法,進(jìn)行比對(duì),市面上的線上手寫輸入軟件的識(shí)別方法多以此種結(jié)構(gòu)的方法為主。

對(duì)比數(shù)據(jù)庫(kù):當(dāng)輸入文字算完特征后,不管是用統(tǒng)計(jì)或結(jié)構(gòu)的特征,都須有一比對(duì)數(shù)據(jù)庫(kù)或特征數(shù)據(jù)庫(kù)來進(jìn)行比對(duì),數(shù)據(jù)庫(kù)的內(nèi)容應(yīng)包含所有欲識(shí)別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。

對(duì)比識(shí)別:這是可充分發(fā)揮數(shù)學(xué)運(yùn)算理論的一個(gè)模塊,根據(jù)不同的特征特性,選用不同的數(shù)學(xué)距離函數(shù),較有名的比對(duì)方法有,歐式空間的比對(duì)方法、以及類神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)建立及比對(duì)、等著名的方法,為了使識(shí)別的結(jié)果更穩(wěn)定,也有所謂的專家系統(tǒng),利用各種特征比對(duì)方

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論