網(wǎng)頁圖片無障礙替代文本自動(dòng)生成算法設(shè)計(jì)與實(shí)現(xiàn)的中期報(bào)告_第1頁
網(wǎng)頁圖片無障礙替代文本自動(dòng)生成算法設(shè)計(jì)與實(shí)現(xiàn)的中期報(bào)告_第2頁
網(wǎng)頁圖片無障礙替代文本自動(dòng)生成算法設(shè)計(jì)與實(shí)現(xiàn)的中期報(bào)告_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)頁圖片無障礙替代文本自動(dòng)生成算法設(shè)計(jì)與實(shí)現(xiàn)的中期報(bào)告一、問題描述:在網(wǎng)頁上,圖片對(duì)于視覺障礙人士存在一定的難度。因此,無障礙替代文本是一項(xiàng)重要的功能,能夠提供給屏幕識(shí)別器和語音識(shí)別儀使用。因此,我們需要一種算法來實(shí)現(xiàn)自動(dòng)為網(wǎng)頁圖像生成替代文本的需求。二、前期調(diào)研:1、需要分類的圖片我們需要分類以下兩種圖片:(1)信息性圖片:包含文字或圖形式的內(nèi)容(2)裝飾性圖片:無特殊含義的純圖片2、圖片分析的難點(diǎn)在對(duì)網(wǎng)頁圖片進(jìn)行分析時(shí),主要有以下難點(diǎn):(1)圖片含義不明確無法確定圖片的確切含義,因此無法生成可讀性高、易理解的文本。(2)同一圖片多種語義同一張圖片可能有不同類型的解釋,不確定使用哪種解釋會(huì)更好。(3)圖片較少文本例如,一張包含文字的圖片,但文本量很少,這時(shí)很難生成合適的描述文本。三、算法設(shè)計(jì):1、采用OCR技術(shù)識(shí)別圖片的文本部分,自動(dòng)生成替代文本對(duì)于信息性圖片,我們可以使用OCR技術(shù),提取并識(shí)別圖片中的文本部分,然后根據(jù)文本內(nèi)容生成替代文本。2、根據(jù)圖片特征與語意分類對(duì)于裝飾性圖片,我們使用圖像處理技術(shù)分析圖片差異,尋找有規(guī)律的圖片簇,并按圖片規(guī)律與語意分類,給出合適的替代文本。3、使用人類工作直接替換對(duì)于一些無法利用算法進(jìn)行處理且不能通過圖像處理直接獲取有用信息的圖片,我們只能通過人類工作來編寫合適的替代文本。四、算法實(shí)現(xiàn):1、基于OCR技術(shù),使用Tesseract識(shí)別圖片中的文本部分2、使用機(jī)器學(xué)習(xí)算法生成圖片的特征向量,并根據(jù)特征向量分類3、為每個(gè)分類生成合適的替代文本五、下一步工作:基于以上算法實(shí)現(xiàn),下一步需要進(jìn)行以下工作:1、完善OCR技術(shù)的識(shí)別準(zhǔn)確率2、提高圖片語義分類的準(zhǔn)確性,例如引入自然語言處理技術(shù)3、加入人工審核機(jī)制,確保生成的替代文本的質(zhì)量4、開發(fā)可視化工具,方便人工審核,并加快生成速度。六、參考文獻(xiàn):[1]C.Yadav,U.Chaturvedi,andA.Kumari,“AutomaticExtractionOfRelevantTextFromImagesForVisuallyImpairedPeople,”IEEETransactionsonNeuralNetworksandLearningSystems,vol.27,no.10,pp.2220-2232,Oct.2016.[2]D.YangandM.Q.Hu,“ImageCaptioningBasedonConvolutionalNeuralNetworkandVisualAttention,”IEEETransactionsonMultimedia,vol.21,no.11,pp.2715-2726,Nov.2019.[3]P.Singh,S.Pandey,andP.Rai,“ImageTextDetectionUsingTesseractOCRAndAMaximumEntropyModel,”IEEETransactionsonNeural

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論