




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Windows語(yǔ)音助手—軟件規(guī)格說(shuō)明書(shū)(SRS)青島大學(xué)—FirstDreamTeam小組青島大學(xué)Windows語(yǔ)音助手軟件需求說(shuō)明書(shū)
文檔編號(hào): D01版本號(hào): V1.1編寫(xiě): 文檔編號(hào): D01版本號(hào): V1.1編寫(xiě): ___ 編寫(xiě)日期:__________校對(duì): _______ 校對(duì)日期:_______審核: FirstDreamTeam團(tuán)隊(duì)開(kāi)發(fā)人員批準(zhǔn): _____________________開(kāi)發(fā)單位: 青島大學(xué)——FirstDreamTeam團(tuán)隊(duì)項(xiàng)目負(fù)責(zé)人: _______文檔修改記錄修改人文檔修改記錄修改人修改時(shí)間版本號(hào)備注*****200V1.0初次編寫(xiě)*****2008-6-30V1.1調(diào)整需求,重點(diǎn)強(qiáng)調(diào)項(xiàng)目功能需求*****2008-7-10V1.3細(xì)化需求,重新調(diào)整文檔結(jié)構(gòu)。*****2008-V1.4統(tǒng)一文檔結(jié)構(gòu)。目錄一.引言 51.1編寫(xiě)目的 51.2項(xiàng)目背景 51.3定義 51.4參考資料 7二.任務(wù)概述 82.1語(yǔ)音識(shí)別技術(shù)的起源與發(fā)展前景 82.1.1語(yǔ)音識(shí)別技術(shù)簡(jiǎn)介 82.1.2語(yǔ)音識(shí)別技術(shù)的應(yīng)用 92.1.3語(yǔ)音識(shí)別技術(shù)的發(fā)展 102.2功能簡(jiǎn)介(目標(biāo)) 112.3用戶的特點(diǎn) 112.4運(yùn)行環(huán)境 112.4.1硬件環(huán)境 112.4.2軟件環(huán)境 122.5條件與限制 122.6假設(shè)與依賴 12三.大賽項(xiàng)目要求(功能需求) 123.1功能需求介紹 123.2功能需求實(shí)例圖 133.2功能需求流程圖 143.2功能一——語(yǔ)音識(shí)別與輸入 153.2.1功能說(shuō)明 153.2.2功能描述 153.3功能二——屏幕取詞 153.3.1功能說(shuō)明 153.3.2功能描述 153.4功能三——語(yǔ)音控制 153.4.1功能說(shuō)明 153.4.2功能描述 163.5功能四——語(yǔ)音精靈 163.5.1功能說(shuō)明 163.5.2功能描述 163.6功能五——語(yǔ)音朗讀(TTS) 163.6.1功能說(shuō)明 163.6.2功能描述 16四.運(yùn)行要求 174.1用戶界面 174.2硬件接口 174.3軟件接口 174.4通信接口(無(wú)) 18
一.引言1.1編寫(xiě)目的該文檔對(duì)所開(kāi)發(fā)的Windows語(yǔ)音助手達(dá)到功能、性能、用戶界面及運(yùn)行環(huán)境等作出了詳細(xì)的說(shuō)明。他作為對(duì)該系統(tǒng)概要設(shè)計(jì)的依據(jù),幫助開(kāi)發(fā)人員了解本系統(tǒng)的框架思想及實(shí)現(xiàn)功能,并驗(yàn)證核實(shí)該產(chǎn)品能否滿足用戶要求的標(biāo)準(zhǔn),便于技術(shù)文檔和需求變化的管理。同時(shí)也是用戶與開(kāi)發(fā)人員雙方對(duì)軟件需求取得共同理解的基礎(chǔ)。預(yù)期讀者:大賽評(píng)委、項(xiàng)目投資商、產(chǎn)品用戶、開(kāi)發(fā)人員,指導(dǎo)老師。1.2項(xiàng)目背景系統(tǒng)名稱:Windows語(yǔ)音助手任務(wù)提出者:_______開(kāi)發(fā)者:青島大學(xué)FirstDreamTeam團(tuán)隊(duì)。面向用戶:希望能夠借助語(yǔ)音系統(tǒng)更加快捷、方便的操作電腦的用戶。無(wú)法很好利用鼠標(biāo)或鍵盤(pán)對(duì)電腦進(jìn)行操作的殘障人士用戶。特此聲明:此軟件的開(kāi)發(fā)作為后期商業(yè)項(xiàng)目的原型,均采用授權(quán)開(kāi)發(fā)工具,產(chǎn)品擁有自主知識(shí)產(chǎn)權(quán),未經(jīng)允許不得隨意傳播或使用。1.3定義SDK:SDK就是SoftwareDevelopmentKit的縮寫(xiě),中文意思就是“軟件開(kāi)發(fā)工具包”。這是一個(gè)覆蓋面相當(dāng)廣泛的名詞,可以這么說(shuō):輔助開(kāi)發(fā)某一類軟件的相關(guān)文檔、范例和工具的集合都可以叫做“SDK”。TTS全稱為:TextToSpeech即文本合成語(yǔ)音,此為SAPI的基本類型之一,TTS可以將文本中的字符或文檔合成為語(yǔ)音并“說(shuō)”出來(lái)。SR全拼:SpeechRecognise即語(yǔ)音識(shí)別,此也為SAPI的基本類型之二,SR則可以把人說(shuō)話的語(yǔ)音轉(zhuǎn)換為易讀的字符或文檔。SAPISAPI又稱語(yǔ)音應(yīng)用程序編程接口,它減少了語(yǔ)音識(shí)別和語(yǔ)音合成應(yīng)用中的程序代碼,使得語(yǔ)音技術(shù)在廣泛和蓬勃發(fā)展的實(shí)際應(yīng)用中更容易使用。SAPI使得應(yīng)用程序和語(yǔ)音引擎之間高度緊密的結(jié)合。SAPI可以實(shí)時(shí)處理各種語(yǔ)音引擎在底層工作中的細(xì)節(jié)。 SAPI包括文本合成語(yǔ)音應(yīng)用程序接口,語(yǔ)音識(shí)別應(yīng)用程序接口。SAPI的兩種基本類型是文本合成語(yǔ)音(TTS)引擎和語(yǔ)音識(shí)別(SR)引擎。WindowsAPI(Win32API)WindowsAPI是一套用來(lái)控制Windows的各個(gè)部件(從桌面的外觀到為一個(gè)新進(jìn)程分配的內(nèi)存)的外觀和行為的一套預(yù)先定義的Windows函數(shù).用戶的每個(gè)動(dòng)作都會(huì)引發(fā)一個(gè)或幾個(gè)函數(shù)的運(yùn)行以告訴Windows發(fā)生了什么.API函數(shù)包含在Windows系統(tǒng)目錄下的動(dòng)態(tài)連接庫(kù)文件中(如User32.dll,GDI32.dll,Shell32.dll...).
1.4參考資料1.大賽題目設(shè)置《Windows語(yǔ)音助手》的相關(guān)具體要求。2.參考書(shū)籍:《語(yǔ)音識(shí)別與控制應(yīng)用技術(shù)》作者:劉幺和,宋庭新編著出版社:科學(xué)出版社 出版時(shí)間:2008-2-1《新編API大全》2009版MicrosoftMSDNMicrosoftSpeechSDK5.1Help《C#開(kāi)發(fā)技巧大全》中國(guó)水利出版社《C#數(shù)據(jù)安全手冊(cè)》人民郵電出版社《C#高級(jí)編程》-清華大學(xué)出版社《國(guó)家標(biāo)準(zhǔn)軟件產(chǎn)品需求規(guī)格說(shuō)明書(shū)》《國(guó)家標(biāo)準(zhǔn)可行性分析報(bào)告》《軟件工程》 作者:曾建潮 ISBN:7562919542 出版社:武漢工大 出版日期:2004-5-1《軟件工程與軟件文檔寫(xiě)作》作者:文斌,劉長(zhǎng)青,田原編著ISBN:9787810825702,7810825704出版社:清華大學(xué)出版社出版日期:2005-8-1《軟件需求工程》作者黃國(guó)興周勇 出版社清華大學(xué)出版社 書(shū)號(hào)302-16860-7 出版時(shí)間2008年4月字?jǐn)?shù)千字二.任務(wù)概述項(xiàng)目最終采用最新微軟.NET技術(shù),并結(jié)合微軟最新語(yǔ)音識(shí)別引擎,通過(guò)語(yǔ)音輸入達(dá)到對(duì)計(jì)算機(jī)的基本控制。本項(xiàng)目在VisualStudio2008集成開(kāi)發(fā)環(huán)境下開(kāi)發(fā),基于.NET及Speech語(yǔ)音引擎平臺(tái)。給客戶帶來(lái)方便快捷的全新體驗(yàn)。2.1語(yǔ)音識(shí)別技術(shù)的起源與發(fā)展前景2.1.1語(yǔ)音識(shí)別技術(shù)簡(jiǎn)介智能翻譯機(jī)、語(yǔ)音撥號(hào)、語(yǔ)音查詢、語(yǔ)音自動(dòng)定票系統(tǒng)、語(yǔ)音工業(yè)控制等等,可以想見(jiàn),凡用計(jì)算機(jī)的地方都會(huì)有語(yǔ)音識(shí)別。在計(jì)算機(jī)輔助教育方面,計(jì)算機(jī)就成為專業(yè)的家庭輔導(dǎo)教師;在幼兒進(jìn)行啟蒙教育的玩具中,語(yǔ)音識(shí)別也將倍受歡迎。電腦語(yǔ)音合成技術(shù)即CTI(ComputerTelephoneIntegration),是用計(jì)算機(jī)技術(shù)處理電話語(yǔ)音。通常是建一個(gè)信息呼叫中心,用戶打來(lái)電話時(shí)計(jì)算機(jī)會(huì)自動(dòng)地一層層地轉(zhuǎn)給相關(guān)部門(mén),一直到為用戶解決問(wèn)題為止。有的語(yǔ)音信箱可以支持不同語(yǔ)種。CTI并非新技術(shù)。與網(wǎng)絡(luò)電話把數(shù)據(jù)壓縮打包進(jìn)行傳輸有所不同,CTI到底還是一種語(yǔ)音模擬傳輸技術(shù),只不過(guò)用上了計(jì)算機(jī)對(duì)語(yǔ)音進(jìn)行智能管理而已。發(fā)達(dá)國(guó)家早幾年就普及了這項(xiàng)應(yīng)用,“是個(gè)機(jī)構(gòu)就有呼叫中心”,以保證客戶或合作伙伴打來(lái)的每一個(gè)電話都有回應(yīng)。中國(guó)卻還沒(méi)有走到這一步,目前除了電信部門(mén)普遍開(kāi)通了“呼叫中心”服務(wù)之外,大多數(shù)企業(yè)還剛剛起步。這個(gè)差距反映了管理和競(jìng)爭(zhēng)意識(shí)方面的問(wèn)題。中文語(yǔ)音瀏覽器產(chǎn)品“Interversa”使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說(shuō)即所得”。Interversa已針對(duì)PentiumⅢ的SSE指令集進(jìn)行了優(yōu)化,并將在PentiumⅢ上實(shí)現(xiàn)最好的性能和識(shí)別率。常見(jiàn)的語(yǔ)音識(shí)別系統(tǒng)還有“命令和控制(Command&Control)”(是連續(xù)的,擁有小詞匯量和獨(dú)立揚(yáng)聲器)、“語(yǔ)音導(dǎo)航”、微軟的“不連續(xù)聽(tīng)寫(xiě)(DiscreteDictation)”(是不連續(xù)、大詞匯量和非獨(dú)立揚(yáng)聲器的),IBM的ViaVoice則屬于連續(xù)聽(tīng)寫(xiě)。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù),也就是讓機(jī)器聽(tīng)懂人類的語(yǔ)音。也就是說(shuō),如果電腦配置有“語(yǔ)音辨識(shí)”的程序組,那么當(dāng)你的聲音通過(guò)一個(gè)轉(zhuǎn)換裝置輸入電腦內(nèi)部、并以數(shù)位方式儲(chǔ)存后,語(yǔ)音辨識(shí)程序便開(kāi)始以你輸入的聲音樣本與事先儲(chǔ)存好的聲音樣本進(jìn)行對(duì)比工作。聲音對(duì)比工作完成之后,電腦就會(huì)輸入一個(gè)它認(rèn)為最“象”的聲音樣本序號(hào),就可以知道你剛才念的聲音是什么意義,進(jìn)而執(zhí)行此命令。說(shuō)起來(lái)簡(jiǎn)單,但要真正建立辨識(shí)率高的語(yǔ)音辨識(shí)程序組,卻是非常困難而專業(yè)的,世界各地的學(xué)者們也還在努力研究最好的方式。專家學(xué)者們研究出許多破解這個(gè)問(wèn)題的方法,如傅立葉轉(zhuǎn)換、倒頻譜參數(shù)等,使目前的語(yǔ)音辨識(shí)系統(tǒng)已達(dá)到一個(gè)可接受的程度,并且辨識(shí)度愈來(lái)愈高。本項(xiàng)目是一個(gè)基于語(yǔ)音識(shí)別的一個(gè)智能化服務(wù)產(chǎn)品,是面向服務(wù)設(shè)計(jì)的成功案例之一。2.1.2語(yǔ)音識(shí)別技術(shù)的應(yīng)用語(yǔ)音識(shí)別技術(shù)的應(yīng)用主要有以下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲很高,因?yàn)槭褂面I盤(pán)、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語(yǔ)或不熟悉漢語(yǔ)拼音的人被拒之于門(mén)外,影響到電子計(jì)算機(jī)的進(jìn)一步普及。語(yǔ)音識(shí)別技術(shù)的采用,改變了人與計(jì)算機(jī)的互動(dòng)模式,人們只需動(dòng)動(dòng)口,就能打開(kāi)或關(guān)閉程序,改變工作界面。這種使電腦人性化的結(jié)果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。電話仍是目前使用最為普遍的通信工具,通過(guò)電話與語(yǔ)音識(shí)別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語(yǔ)音撥號(hào)、電話購(gòu)物以及通過(guò)電話辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。不久,能按主人口令接通電話、打開(kāi)收音機(jī),以及通過(guò)聲紋識(shí)別來(lái)者身份的安全系統(tǒng)也將獲得應(yīng)用。語(yǔ)音識(shí)別技術(shù)的另一方面應(yīng)用便是語(yǔ)音輸入和合成語(yǔ)音輸出?,F(xiàn)在,已經(jīng)出現(xiàn)能將口述的文稿輸入計(jì)算機(jī)并按指定格式編排的語(yǔ)音軟件,它比通過(guò)鍵盤(pán)輸入在速度上要提高2~4倍。裝有語(yǔ)音軟件的電腦還能通過(guò)語(yǔ)音合成把計(jì)算機(jī)里的文件用各種語(yǔ)言“讀”出來(lái),這將大大推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)電話的發(fā)展。在現(xiàn)階段,語(yǔ)音技術(shù)主要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對(duì)于節(jié)省人力、時(shí)間,提高工作效率將起到明顯的作用。能實(shí)現(xiàn)自動(dòng)翻譯的語(yǔ)音識(shí)別系統(tǒng)目前也正在研究、完善之中。2.1.3語(yǔ)音識(shí)別技術(shù)的發(fā)展語(yǔ)音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。它是一門(mén)交叉學(xué)科,正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)。語(yǔ)音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行操作。語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。與機(jī)器進(jìn)行語(yǔ)音交流,讓機(jī)器明白你說(shuō)什么,這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),語(yǔ)音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語(yǔ)音識(shí)別聽(tīng)寫(xiě)機(jī)在一些領(lǐng)域的應(yīng)用被美國(guó)新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語(yǔ)音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語(yǔ)音識(shí)別產(chǎn)品將是繼電話、計(jì)算機(jī)、Internet之后信息產(chǎn)業(yè)界的又一次革命。如果我們能夠突破人機(jī)交互的瓶頸,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。正是這充滿潛力的市場(chǎng)前景使世界上一些知名公司無(wú)不看重“語(yǔ)音識(shí)別”這塊正待開(kāi)發(fā)的市場(chǎng),IBM、Dragon、Intel、Microsoft、Philips、Motorola、Apple、National、Nortel等大公司都設(shè)有專門(mén)的語(yǔ)音識(shí)別技術(shù)研發(fā)部或子公司,每年投入的研究經(jīng)費(fèi)達(dá)數(shù)千萬(wàn)美元。Intel公司推出的PentiumⅢ為語(yǔ)音產(chǎn)品的實(shí)時(shí)化提供了進(jìn)一步的保證。反過(guò)來(lái),語(yǔ)音產(chǎn)品的發(fā)展也將為半導(dǎo)體工業(yè)提供新的契機(jī)。在國(guó)際市場(chǎng)上,由于中國(guó)的國(guó)際地位與日俱增以及在經(jīng)濟(jì)和市場(chǎng)方面所處的重要地位,漢語(yǔ)語(yǔ)音識(shí)別越來(lái)越受到重視;各大公司都相繼投入到漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā)中,其投資也在逐年增加。日漸火爆的語(yǔ)音市場(chǎng)再一次給我們帶來(lái)了機(jī)遇和挑戰(zhàn);不斷涌現(xiàn)和日新月異的新產(chǎn)品將證明,語(yǔ)音識(shí)別產(chǎn)品是繼電話、計(jì)算機(jī)、Internet之后,信息產(chǎn)業(yè)界的又一次革命。2.2功能簡(jiǎn)介(目標(biāo))本系統(tǒng)的主要功能是實(shí)現(xiàn)用戶通過(guò)語(yǔ)音來(lái)進(jìn)行對(duì)系統(tǒng)的操作以及完成對(duì)系統(tǒng)資源的控制與使用,使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說(shuō)即所得”。講的通俗一點(diǎn),就是用戶“說(shuō)話”來(lái)操縱電腦,省去使用鼠標(biāo),鍵盤(pán)的麻煩了。此外,還可以幫助用戶“讀”文本,實(shí)現(xiàn)文本到語(yǔ)音的轉(zhuǎn)換,同樣免去用戶長(zhǎng)期用眼看資料的勞頓。本產(chǎn)品實(shí)現(xiàn)了人機(jī)交互的功能,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。 為用戶操作windows系統(tǒng)提供一種更智能,更人性化的操作方式,通過(guò)語(yǔ)音來(lái)完成windows基本操作,使用戶有一種親切的感覺(jué)。為用戶操作系統(tǒng)帶來(lái)一種耳目一新,方便、快捷的感受,語(yǔ)音的控制使用戶辦公及基本操作達(dá)到事半功備的效果。更加新穎的操作界面(語(yǔ)音精靈的加入)能使用戶在操作過(guò)程中達(dá)到一種娛樂(lè)的效果。2.3用戶的特點(diǎn)該語(yǔ)音系統(tǒng)既可使深入了解windows基本操作的用戶操作起來(lái)更加快捷、方便,也可對(duì)初步有windows操作知識(shí)的用戶進(jìn)一步學(xué)習(xí)電腦知識(shí)有輔助效果,使其學(xué)得更快??傮w來(lái)講本系統(tǒng)適用的用戶范圍較廣,只要具備一點(diǎn)電腦知識(shí)的用戶都可以順利的應(yīng)用本系統(tǒng)。2.4運(yùn)行環(huán)境2.4.1硬件環(huán)境CPU:2.2GHZ或更快; 內(nèi)存:512MB或更大的內(nèi)存; 硬盤(pán):7200RPM或更快的硬盤(pán); 其他外設(shè):麥克風(fēng)等音頻輸入設(shè)備,耳麥等音頻輸出設(shè)備;2.4.2軟件環(huán)境(一)操作系統(tǒng): MicrosoftWindowsXPMicrosoftWindowsServer2003ServicePack2MicrosoftWindowsServer2008(二)運(yùn)行環(huán)境 1..NETFrameWork3.5或更高版本。 2.正確安裝微軟SDK語(yǔ)音引擎包及微軟SDK語(yǔ)音引擎中日語(yǔ)言包。2.5條件與限制由于本系統(tǒng)為語(yǔ)音識(shí)別系統(tǒng),程序運(yùn)行時(shí)需要接收并分析判斷來(lái)自終端輸入的語(yǔ)音音頻,所以程序運(yùn)行時(shí)對(duì)周圍環(huán)境的嘈雜程度要求很高,要求周圍環(huán)境噪音越小越好,最好是在一個(gè)安靜的環(huán)境里;其次,在使用我們的產(chǎn)品之前,最好是做一個(gè)語(yǔ)音訓(xùn)練,以便讓計(jì)算機(jī)更熟悉用戶的聲音,方便用戶的操作,讓用戶使用的更舒心,我們更放心;再次,也要求用戶所使用的音頻輸入設(shè)備(麥克風(fēng))的質(zhì)量要好,也就是要保證語(yǔ)音識(shí)別率高。2.6假設(shè)與依賴本項(xiàng)目基于.NET并依賴于微軟最新語(yǔ)音識(shí)別引擎、SpeechAPI5.1(語(yǔ)音編程接口)。三.大賽項(xiàng)目要求(功能需求) 3.1功能需求介紹利用現(xiàn)有語(yǔ)音引擎或獨(dú)立底層開(kāi)發(fā)基于語(yǔ)音識(shí)別技術(shù)的Windows操作助手,助手能夠協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語(yǔ)音命令輸入文字,也可以幫助用戶使用語(yǔ)音進(jìn)行Windows的常規(guī)操作,如啟動(dòng)某某軟件,關(guān)閉當(dāng)前窗口,關(guān)閉Windows,點(diǎn)擊特定按鈕或選擇指定的菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(即使得該軟件窗口獲得焦點(diǎn)),拷貝屏幕區(qū)域,上翻或下翻當(dāng)前正在瀏覽的網(wǎng)頁(yè)或閱讀的文章,刪除文件,清空文件垃圾桶等。助手在協(xié)助用戶進(jìn)行各種操作時(shí)要在屏幕上明顯體現(xiàn)出該操作是助手幫助完成的,以區(qū)別于用戶通過(guò)鼠標(biāo)或鍵盤(pán)進(jìn)行的其他操作。要保證在不需要助手的時(shí)候,它會(huì)安靜的呆在一邊,不能影響用戶的正常操作。賽題中涉及的主要技術(shù)難點(diǎn)有兩個(gè),語(yǔ)音識(shí)別及屏幕取詞,本產(chǎn)品都已經(jīng)突破。此語(yǔ)音系統(tǒng)的主要功能是通過(guò)語(yǔ)音輸入、識(shí)別來(lái)實(shí)現(xiàn)最終的語(yǔ)音控制,其中語(yǔ)音識(shí)別子系統(tǒng)中又有語(yǔ)音訓(xùn)練向?qū)?、麥克風(fēng)設(shè)置向?qū)А⒆远x詞庫(kù)、發(fā)音靈敏度設(shè)置等設(shè)置功能;此外,文本朗讀,語(yǔ)音精靈是本系統(tǒng)的輔助功能;對(duì)本系統(tǒng)的功能介紹我們將在功能概要設(shè)計(jì)說(shuō)明及細(xì)節(jié)說(shuō)明中給出詳細(xì)的說(shuō)明,下面通過(guò)一個(gè)形象的實(shí)例介紹系系統(tǒng)所提供的服務(wù)。3.2功能需求實(shí)例圖3.2功能需求流程圖3.2功能一——語(yǔ)音識(shí)別與輸入3.2.1功能說(shuō)明此功能應(yīng)該是本系統(tǒng)實(shí)現(xiàn)主功能的基礎(chǔ)重要功能,優(yōu)先級(jí)高。3.2.2功能描述要求系統(tǒng)能夠準(zhǔn)確識(shí)別用戶通過(guò)終端輸入的語(yǔ)音,在任何可以輸入文字的地方根據(jù)用戶語(yǔ)音命令輸入文字,并也可以幫助用戶使用語(yǔ)音進(jìn)行Windows的常規(guī)操作(涉及語(yǔ)音控制)。語(yǔ)音識(shí)別是大賽要求中提到的技術(shù)難點(diǎn)之一。用戶對(duì)著麥克風(fēng)說(shuō)話,實(shí)現(xiàn)和計(jì)算機(jī)的互動(dòng),實(shí)際上是我們的產(chǎn)品接受了用戶說(shuō)的內(nèi)容,然后把聲音轉(zhuǎn)換為文字,在命令模式下,實(shí)現(xiàn)了用戶說(shuō)什么計(jì)算機(jī)則會(huì)根據(jù)用戶所說(shuō)的命令執(zhí)行相應(yīng)的操作。當(dāng)用戶的命令計(jì)算機(jī)不存在或用戶說(shuō)的不準(zhǔn)確時(shí),我們的精靈則會(huì)提醒用戶沒(méi)有該命令,或說(shuō)的命令不準(zhǔn)確提醒用戶請(qǐng)?jiān)僬f(shuō)一遍。在輸入模式下,實(shí)現(xiàn)了完全取代鍵盤(pán)和鼠標(biāo)的操作,使用戶不用再利用鼠標(biāo)和鍵盤(pán)向計(jì)算機(jī)傳輸輸入的信息文字,在此模式下,用戶說(shuō)什么,計(jì)算機(jī)就會(huì)“寫(xiě)”什么。同時(shí),輸入模式和命令模式可以相互轉(zhuǎn)換。3.3功能二——屏幕取詞3.3.1功能說(shuō)明屏幕取詞功能同樣是實(shí)現(xiàn)主控制功能的重要基礎(chǔ)功能,是實(shí)現(xiàn)語(yǔ)音識(shí)別的重要基石之一。其優(yōu)先級(jí)別也較高。3.3.2功能描述通過(guò)此功能能夠取得桌面,系統(tǒng)窗體,以及任務(wù)欄、選項(xiàng)卡、標(biāo)簽等其內(nèi)部的任何文本,在命令模式下,根據(jù)用戶說(shuō)出的命令,在打開(kāi)的窗體中進(jìn)行“查找”和“匹配”,在模糊匹配的協(xié)助下,找到用戶說(shuō)出的命令然后執(zhí)行相應(yīng)的操作。此功能在描述上簡(jiǎn)單,但是實(shí)現(xiàn)上將是一個(gè)難點(diǎn),屏幕取詞同樣也是大賽要求中提到的技術(shù)難點(diǎn)之二。3.4功能三——語(yǔ)音控制3.4.1功能說(shuō)明語(yǔ)音控制功能是本系統(tǒng)的主功能及核心功能,語(yǔ)音控制計(jì)算機(jī)的各個(gè)內(nèi)部操作。其優(yōu)先級(jí)別最高。3.4.2功能描述在語(yǔ)音識(shí)別,屏幕取詞的基礎(chǔ)上實(shí)現(xiàn)的語(yǔ)音控制最終達(dá)到協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語(yǔ)音命令輸入文字,并也可以幫助用戶
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 隔音墊施工方案
- 水利設(shè)施提升施工方案
- 路面硬化路肩首件施工方案
- 青海四合院庭院施工方案
- 地下室成品隔油池施工方案
- 晉中導(dǎo)向標(biāo)志牌施工方案
- 【市占率證明權(quán)威指南】摩托車行業(yè)市占率全解(智研咨詢發(fā)布)
- 排放源的治理技術(shù)選擇與應(yīng)用分析
- 綠色金融與低碳投資的策略及實(shí)施路徑
- 低空經(jīng)濟(jì)公司的經(jīng)營(yíng)策略
- 2025年江西陶瓷工藝美術(shù)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)1套
- 《計(jì)算機(jī)基礎(chǔ)與應(yīng)用(Office 和 WPS Office )》課件 項(xiàng)目二?計(jì)算機(jī)操作系統(tǒng)配置與應(yīng)用
- 2025年湖南電氣職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及參考答案
- 混凝土拌合站拌合運(yùn)輸工程合同
- 機(jī)床操作與數(shù)控編程作業(yè)指導(dǎo)書(shū)
- 2025云南昆明空港投資開(kāi)發(fā)集團(tuán)招聘7人高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級(jí)下冊(cè)第二單元百分?jǐn)?shù)(二)單元檢測(cè)(含答案)
- 人教版 八年級(jí)英語(yǔ)下冊(cè) Unit 2 單元綜合測(cè)試卷(2025年春)
- 湖北省武漢市江漢區(qū)2024-2025學(xué)年八年級(jí)(上)期末物理試卷(含解析)
- 2025年無(wú)錫商業(yè)職業(yè)技術(shù)學(xué)院高職單招高職單招英語(yǔ)2016-2024歷年頻考點(diǎn)試題含答案解析
- 《寄生蟲(chóng)學(xué)檢驗(yàn)》課件-結(jié)膜吸吮線蟲(chóng)
評(píng)論
0/150
提交評(píng)論