基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第1頁
基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第2頁
基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第3頁
基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第4頁
基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).docx_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五屆“挑戰(zhàn)杯,中國聯(lián)通安徽省大學(xué)生課外學(xué)術(shù)科技作品競賽研究報(bào)告基于云的機(jī)器人問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)薛建2013年4月目錄一、序言11. 1研究背景 1 1.1.1人機(jī)交互技術(shù) 11.1.2自然語言識(shí)別技術(shù) 2 1.2國內(nèi)外研究現(xiàn)狀分析 3二、系統(tǒng)設(shè)計(jì)4 2 1設(shè)計(jì)思路 42 1. 1機(jī)器人隱0 5 2 1. 2訊飛語音云 5 2.1.3百度問答服務(wù)云 6 2.2詳細(xì)設(shè)計(jì) 7 2.2 1機(jī)器人隱0模塊 7 2.2.2訊飛語音云模塊 9 2.2.3百度問答服務(wù)云模塊 10三、系統(tǒng)性能分析12四、應(yīng)用前景與展望未來13五、參考文獻(xiàn)14一、序言隨著機(jī)器人技術(shù)和人工智能研究的發(fā)展,越來越多的智能機(jī)器人進(jìn)入到人們的 日常生活當(dāng)中,但是目前人與機(jī)器人之間的交互仍然主要是通過按鈕、開關(guān)等命令 方式,這種交互方式顯得很生硬,不夠人性化。為了使得人與機(jī)器人的交互方式更 加方便、自然、和諧,基于自然語義識(shí)別的人機(jī)交互系統(tǒng)的研究顯得十分重要,這 也是近年來人機(jī)交互技術(shù)的研究重點(diǎn)。基于云計(jì)算的機(jī)器人問答系統(tǒng)使用了訊飛語 音云和百度知道問答服務(wù)云,實(shí)現(xiàn)了用戶向機(jī)器人提出問題,機(jī)器人經(jīng)過短暫“思 考”回答出相應(yīng)的答案并且在說話的同時(shí)做出相應(yīng)行為的功能,該系統(tǒng)實(shí)現(xiàn)了一定 程度的自然語義的識(shí)別,提供了一種更加人性化的人機(jī)交互方式?;谠频臋C(jī)器人問答系統(tǒng)運(yùn)用當(dāng)前主流的云技術(shù),將機(jī)器人技術(shù)、語音識(shí)別技 術(shù)和網(wǎng)絡(luò)查詢技術(shù)結(jié)合在一起,建立一套機(jī)器人問答服務(wù)系統(tǒng),提供了一種更加人 性化的基于自然語言的人機(jī)交互方式。云技術(shù)的使用,提高了語音識(shí)別的效率和問 題答案的準(zhǔn)確率,為系統(tǒng)的可行性提供了保證。1.1研究背景1.1.1人機(jī)交互技術(shù)人機(jī)交互技術(shù)是指通過計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī) 對(duì)話、交換信息的技術(shù)。人們可以借助鍵盤、鼠標(biāo)、操作桿、位置跟蹤器、數(shù)據(jù)手 套等設(shè)備,用手、腳、聲音、姿態(tài)和身體的動(dòng)作、視線甚至腦電波等向計(jì)算機(jī)傳遞 信息;計(jì)算機(jī)通過打印機(jī),繪圖儀、頭盔式顯示器、音頻等輸出設(shè)備或顯示設(shè)備給 人提供信息。目前,人機(jī)交互技術(shù)正處于多通道、多媒體的智能人機(jī)交互階段,已經(jīng)取得了 不少研究成果,不少產(chǎn)品已經(jīng)問世。側(cè)重多媒體技術(shù)的有:觸摸式顯示屏實(shí)現(xiàn)的“桌 面”計(jì)算機(jī),能夠隨意折疊的柔性顯示屏制造的電子書,從電影院搬進(jìn)客廳指日可 待的30顯示器,使用紅綠藍(lán)光激光二極管的視網(wǎng)膜成像顯示器;側(cè)重多通道技術(shù) 的有:“漢王筆”手寫漢字識(shí)別系統(tǒng),結(jié)合在微軟的了處16?0操作系統(tǒng)中數(shù)字墨 水技術(shù),廣泛應(yīng)用于0打1。60?的中文版等辦公、應(yīng)用軟件中的181八匕0106 連續(xù)中文語音識(shí)別系統(tǒng),輸入設(shè)備為攝像機(jī)、圖像采集卡的手勢識(shí)別技術(shù),以 1?只0肥手機(jī)為代表的可支持更復(fù)雜的姿勢識(shí)別的多觸點(diǎn)式觸摸屏技術(shù),以及 1?只0肥中基于傳感器的捕捉用戶意圖的隱式輸入技術(shù)。人機(jī)交互技術(shù)領(lǐng)域熱點(diǎn)技術(shù)的應(yīng)用潛力已經(jīng)開始展現(xiàn),比如智能手機(jī)配備的地 理空間跟蹤技術(shù),應(yīng)用于可穿戴式計(jì)算機(jī)、隱身技術(shù)、浸入式游戲等的動(dòng)作識(shí)別技 術(shù),應(yīng)用于虛擬現(xiàn)實(shí)、遙控機(jī)器人及遠(yuǎn)程醫(yī)療等的觸覺交互技術(shù),應(yīng)用于呼叫路由、 家庭自動(dòng)化及語音撥號(hào)等場合的語音識(shí)別技術(shù),對(duì)于有語言障礙的人士的無聲語音 識(shí)別,應(yīng)用于廣告、網(wǎng)站、產(chǎn)品目錄、雜志效用測試的眼動(dòng)跟蹤技術(shù),針對(duì)有語言 和行動(dòng)障礙人開發(fā)的“意念輪椅”采用的基于腦電波的人機(jī)界面技術(shù)等。熱點(diǎn)技術(shù)的應(yīng)用開發(fā)是機(jī)遇也是挑戰(zhàn)?;谝曈X的手勢識(shí)別率低,實(shí)時(shí)性差, 需要研究各種算法來改善識(shí)別的精度和速度;眼睛虹膜、掌紋、筆跡、步態(tài)、語音、 唇讀、人臉、0嫩等人類特征的研發(fā)應(yīng)用也正在受到關(guān)注;自然語言理解目前在語 言模型、語料庫等方面取得了很大的進(jìn)展,基于自然語言理解的人機(jī)交互方式也是 目前研究的熱點(diǎn);另外,與“云計(jì)算”等相關(guān)技術(shù)的融合與促進(jìn)也需要繼續(xù)探索。人機(jī)交互技術(shù)與計(jì)算機(jī)始終相伴發(fā)展,匕6?的運(yùn)算能力日趨強(qiáng)大,網(wǎng)絡(luò)和 通信技術(shù)的快速發(fā)展,顯示技術(shù)的重大突破都將為人機(jī)交互提供新的起點(diǎn)與高度。 也許有一天,你的房間的墻壁和窗戶都是基于技術(shù)的巨型顯示器,無需遙控 器和控制器,游戲機(jī)或電視機(jī)就能“感應(yīng)”到你目光的變化、捕捉到你的手勢和動(dòng) 作、聽懂你語音的命令,用你的頭、手、足、軀干就可以控制游戲中的角色?;ヂ?lián) 網(wǎng)正在向“云端”計(jì)算時(shí)代發(fā)展,人機(jī)交互的發(fā)展仍將延續(xù)由以計(jì)算機(jī)為中心的復(fù) 雜交互向以人為中心的簡單、自然交互轉(zhuǎn)移的理念,理想的人機(jī)交互模式就是“用 戶自由。1.1.2自然語言識(shí)別技術(shù)自然語言識(shí)別,即實(shí)現(xiàn)人機(jī)間自然語言通信,或?qū)崿F(xiàn)自然語言理解和自然語言 生成,這是十分困難的。造成困難的根本原因是自然語言文本和對(duì)話的各個(gè)層次上 廣泛存在的各種各樣的歧義性或多義性。使機(jī)器識(shí)別語言是人類早已有之的科技幻想,并且早有實(shí)踐足跡。早在1920 年,美國一家公司所出品的名為“此也0如X”玩具狗便可以“聽從”主人的話而 執(zhí)行走或者停的任務(wù)。不過在這之后相當(dāng)長的時(shí)間里。這項(xiàng)科技的進(jìn)展僅限于如何 更多、更精確地識(shí)別各種口音,進(jìn)而執(zhí)行諸如文字顯示等十分簡單的任務(wù)。1952 年,貝爾實(shí)驗(yàn)室的0狀18等人成功研究出了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā) 音的實(shí)驗(yàn)系統(tǒng)。大規(guī)模的語音識(shí)別研究是在進(jìn)入了上個(gè)世紀(jì)70年代以后,在孤立詞和小詞匯 量句子的識(shí)別方面取得了實(shí)質(zhì)性的進(jìn)展。進(jìn)入80年代以后,研究的重點(diǎn)逐漸轉(zhuǎn)向大詞匯量、非特定人連續(xù)語音識(shí)別。 此時(shí)語音識(shí)別的研究思路也發(fā)生了重大變化,即由傳統(tǒng)的基于標(biāo)準(zhǔn)模板匹配的技術(shù) 思路開始轉(zhuǎn)向基于統(tǒng)計(jì)模型(目)的技術(shù)思路。此外,再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù) 引入語音識(shí)別問題的技術(shù)思路,亦即開始了跨學(xué)科的人工智能研究道路。進(jìn)入90年代以后,語音識(shí)別的研究并沒有什么重大突破。但是,在語音識(shí)別 技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進(jìn)展,諸如聽寫機(jī)等基于語音的信息輸入設(shè)21備此時(shí)大量出現(xiàn)。由僅限于定義為輸入法功能的語音識(shí)別,向包含后臺(tái)數(shù)據(jù)分析的 語義識(shí)別轉(zhuǎn)型的關(guān)鍵推動(dòng)力量,是美國的0仙?八作仙68680 ?0608八陰此丫)計(jì)劃。顯然,語義識(shí)別技術(shù)蘊(yùn)含著著人機(jī)互動(dòng)的遠(yuǎn)大前景,也因 此擁有各方足夠高的評(píng)價(jià)和期許。但它幾十年來卻缺乏足夠的表現(xiàn)。自然語義識(shí)別技術(shù)目前在語言模型、語料庫等方面取得了一些進(jìn)展。語言文字 是人類之間用來傳播信息的主要載體,怎樣讓機(jī)器理解這些由人類自然語言組成的 信息,是擺在人們面前的一個(gè)難題。這個(gè)難題又可以分為“自然語言處理”和“自 然語言理解”兩個(gè)部分,“自然語言處理”是基礎(chǔ)技術(shù),我們的最終目的也必定是 為了更好地實(shí)現(xiàn)“自然語言理解”。自然語言的處理是一個(gè)十分龐大的工程,自然語言的語法通常都是十分復(fù)雜 的,相對(duì)于英語來說,漢語語法就更加復(fù)雜,因此目前還沒有什么方法能夠有效的 消除自然語義識(shí)別時(shí)的“歧義問題”?,F(xiàn)階段,自然語言的處理主要有以下幾種主 要方法:1.基于關(guān)鍵字匹配的方法;2以句法-語義分析為主的方法;3基于大規(guī)模語料庫的自然語言處理的方法。這幾種方法雖然都有各自的一些特點(diǎn),但是效果都不是十分理想,也都存在著 弊端。基于關(guān)鍵字匹配的方法是一種近似匹配技術(shù),主要的缺點(diǎn)是分析技術(shù)不精確, 會(huì)導(dǎo)致很多的錯(cuò)誤。以語法-語義分析為主的方法,由于自然語言語法的復(fù)雜性、 語義的歧義性,分析起來非常復(fù)雜,而且無法做到準(zhǔn)確、全面。而基于大規(guī)模語料 庫的自然語言處理,則是一個(gè)過于龐大的工程,不適合于工程應(yīng)用。1.2國內(nèi)外研究現(xiàn)狀分析在10月2日的蘋果產(chǎn)品發(fā)布會(huì)上,1?06 48的技術(shù)升級(jí)幅度可謂令業(yè)界失望。 然而,被蘋果定義為“私人語音助理”來做壓軸功能發(fā)布的義匕應(yīng)用,仍然是抓 足了人們的眼球。在發(fā)布會(huì)上,蘋果宣稱5匕1可以支持自然語言輸入與識(shí)別,用戶可“命令” 手機(jī)讀短信、詢問天氣、設(shè)置鬧鐘等,并且可以搜尋餐廳、電影院等生活信息,甚 至是直接訂位、訂票;另外其與8結(jié)合服務(wù)的能力也相當(dāng)強(qiáng)悍,能夠依據(jù)用戶默 認(rèn)的居家地址或是所在位置來判斷、過濾搜尋的結(jié)果。811被蘋果這樣的企業(yè)推出進(jìn)行商用,已經(jīng)意味著“語音識(shí)別”這一已經(jīng)不 算新鮮的科技,進(jìn)一步實(shí)現(xiàn)了人工智能化,進(jìn)而向“語義識(shí)別”又邁出了一大步, 同時(shí)意味著第一款基于它的改變大眾生活的消費(fèi)級(jí)產(chǎn)品已經(jīng)誕生。在國內(nèi),科大訊飛通過在語音核心技術(shù)領(lǐng)域的長期積累,不但在中文語音技術(shù) 上保持領(lǐng)先地位,并且在英文語音技術(shù)上也達(dá)到國際領(lǐng)先水平。訊飛語音云是全球 首個(gè)能同時(shí)提供語音合成、語音搜索、語音聽寫的移動(dòng)互聯(lián)網(wǎng)智能交互平臺(tái)。作為3移動(dòng)互聯(lián)網(wǎng)基礎(chǔ)能力設(shè)施,訊飛語音云基于“云計(jì)算”技術(shù)基礎(chǔ)將上述業(yè)界領(lǐng)先的 智能語音技術(shù)向各開發(fā)廠商和用戶同時(shí)開放。移動(dòng)互聯(lián)網(wǎng)應(yīng)用開發(fā)伙伴可以像使用 水、電那樣“即開即用、按需取用”,在很短時(shí)間內(nèi)構(gòu)建出“能聽會(huì)說”的特色移 動(dòng)互聯(lián)網(wǎng)應(yīng)用,從而使移動(dòng)互聯(lián)網(wǎng)語音創(chuàng)新開發(fā)的門檻顯著降低、開發(fā)周期顯著縮 短,將有利于移動(dòng)互聯(lián)網(wǎng)應(yīng)用的不斷創(chuàng)新和豐富。二、系統(tǒng)設(shè)計(jì) 2.1設(shè)計(jì)思路人機(jī)交互技術(shù)的未來發(fā)展趨勢,就是基于自然語義識(shí)別的人機(jī)交互技術(shù),我們 的目標(biāo)是使得計(jì)算機(jī)或者機(jī)器人能夠聽懂人類的語言,能夠執(zhí)行人類語言語義中所 包含的命令,并能用人類語言與人類進(jìn)行交流。系統(tǒng)設(shè)計(jì)的基本思路是:利用機(jī)器人的話筒采集用戶提出的問題的語音數(shù)據(jù), 調(diào)用訊飛語音云的語音識(shí)別技術(shù)將采集到的語音數(shù)據(jù)識(shí)別成文字?jǐn)?shù)據(jù),獲得文字問 題,然后將文字問題在百度問答系統(tǒng)中進(jìn)行查詢并獲得問題的答案,最后調(diào)用機(jī)器 人語音合成模塊將文字答案合成成為語音答案并回答給用戶,同時(shí)配合一些說話時(shí) 候的動(dòng)作,顯得更加生動(dòng)。系統(tǒng)主要包含三個(gè)模塊:嫩0機(jī)器人模塊、訊飛語音云 模塊和百度問答服務(wù)云模塊。系統(tǒng)的工作流程圖如圖一所示:圖一:系統(tǒng)工作流程圖2.1.1機(jī)器人嫩0嫩0機(jī)器人是一款人工智能機(jī)器人,身高為23寸,約60厘米,它是由法國 八1己6“以 100108公司生產(chǎn)的。嫩0擁有著討人喜歡的外形,并具備有一定程度 的人工智能和情感智商,在學(xué)術(shù)領(lǐng)域里,嫩0是目前世界上運(yùn)用最廣泛的類人機(jī)器 人。圖二:似0機(jī)器人實(shí)物圖 嫩0的硬件是采用最新科技設(shè)計(jì)制造的,這保證了嫩0動(dòng)作的流暢性,同時(shí)嫩0 還配備了多種傳感器,比如攝像頭、聲納、陀螺儀等等。嫩0使用的是八10 6606 的嵌入式處理器,嫩0支持在多種平臺(tái)上(“皿X、11仏0*8或08等操作系統(tǒng) 下)編程并且擁有一個(gè)開放式的編程構(gòu)架,使得不同的軟件模塊可以更好的相互作 用。不論使用者的專業(yè)水平如何,都能夠通過圖形化編程平臺(tái)來為嫩0編寫程序, 實(shí)現(xiàn)各種復(fù)雜的功能,進(jìn)行各個(gè)領(lǐng)域的研究。2.1.2訊飛語音云基于自然語言的人機(jī)交互技術(shù)的基礎(chǔ)是自然語義識(shí)別技術(shù),而自然語義識(shí)別技 術(shù)的前提是語音的識(shí)別技術(shù)。語音作為人們獲取和溝通信息最方便、最有效的手段, 智能語音交互技術(shù)對(duì)于未來人機(jī)交互技術(shù)的發(fā)展具有不可替代的作用,已經(jīng)被業(yè)界 公認(rèn)為移動(dòng)互聯(lián)網(wǎng)時(shí)代的關(guān)鍵技術(shù)之一,蘊(yùn)藏著巨大的市場前景,并有重要的戰(zhàn)略意義??拼笥嶏w通過在語音核心技術(shù)領(lǐng)域的長期積累,不但在中文語音技術(shù)上保持領(lǐng) 先地位,并且在英文語音技術(shù)上也達(dá)到國際領(lǐng)先水平。訊飛語音云是全球首個(gè)能同 時(shí)提供語音合成、語音搜索、語音聽寫的移動(dòng)互聯(lián)網(wǎng)智能交互平臺(tái)。作為移動(dòng)互聯(lián) 網(wǎng)基礎(chǔ)能力設(shè)施,訊飛語音云基于“云計(jì)算”技術(shù)基礎(chǔ)將上述業(yè)界領(lǐng)先的智能語音 技術(shù)向各開發(fā)廠商和用戶同時(shí)開放。移動(dòng)互聯(lián)網(wǎng)應(yīng)用開發(fā)伙伴可以像使用水、電那 樣“即開即用、按需取用”,在很短時(shí)間內(nèi)構(gòu)建出“能聽會(huì)說”的特色移動(dòng)互聯(lián)網(wǎng) 應(yīng)用,從而使移動(dòng)互聯(lián)網(wǎng)語音創(chuàng)新開發(fā)的門檻顯著降低、開發(fā)周期顯著縮短,將有 利于移動(dòng)互聯(lián)網(wǎng)應(yīng)用的不斷創(chuàng)新和豐富。2.1.3百度問答服務(wù)云I社6四6七是計(jì)算機(jī)出現(xiàn)以來甚至是人類有史以來最偉大的創(chuàng)舉,它改變了全球 通訊和信息資源共享的方式,把各種各樣的資源從經(jīng)濟(jì)、科技、教育到體育、藝術(shù) 聯(lián)系在一起,構(gòu)成了一個(gè)巨大的網(wǎng)絡(luò)資源庫?,F(xiàn)在,網(wǎng)絡(luò)已經(jīng)發(fā)展成為一個(gè)全球的、巨大的、分布和共享的信息空間。人們 越來越依賴于網(wǎng)絡(luò)來獲取信息。我們可以隨時(shí)從網(wǎng)絡(luò)上查找所需要的信息,網(wǎng)絡(luò)作 為一個(gè)龐大的資源庫,其包含了人類現(xiàn)有的方方面面的知識(shí)?;诖笠?guī)模語料庫的自然語言處理方法是自然語義識(shí)別技術(shù)的方法之一,其難 點(diǎn)在于大規(guī)模語料庫的建立,前面提到網(wǎng)絡(luò)上有著各種資源、各種知識(shí),因此我們 可以想到將網(wǎng)絡(luò)作為我們的大規(guī)模語料庫。對(duì)網(wǎng)絡(luò)語料庫的使用,我們可以使用谷 歌、百度等搜索引擎進(jìn)行搜索,而百度問答服務(wù)系統(tǒng)則為我們提供了更為方便的使 用。圖三為百度知道網(wǎng)站頁面的截圖。圖三:百度知道網(wǎng)站截圖 百度知道是百度旗下的一款問答平臺(tái),它由用戶提出問題,再由別的具備該問 題知識(shí)的用戶進(jìn)行回答,并從眾多回答者中評(píng)選出最佳答案。由于互聯(lián)網(wǎng)的巨大性、網(wǎng)絡(luò)資源的豐富性,百度問答已經(jīng)匯集了無數(shù)個(gè)問題以及這些問題較為準(zhǔn)確的答 案,這些問題涉及了各個(gè)方面,小到生活點(diǎn)滴,大到科學(xué)、哲理。既然百度問答服 務(wù)云如此強(qiáng)大,我們自然可以想到將它近似的作為語義識(shí)別時(shí)所用到的巨大規(guī)模的 語料庫。趣答網(wǎng)是類似百度問答的一個(gè)網(wǎng)站,它也提供了網(wǎng)絡(luò)問答服務(wù)。該網(wǎng)站是由清 華大學(xué)計(jì)算機(jī)系人工智能實(shí)驗(yàn)室的智能信息獲取組設(shè)計(jì)和維護(hù)的。網(wǎng)站運(yùn)用互聯(lián)網(wǎng) 信息獲取技術(shù)的理論和方法,包括情感分析(評(píng)論與觀點(diǎn)挖掘自動(dòng)問答技術(shù)、 多文檔摘要技術(shù),實(shí)現(xiàn)了對(duì)用戶提出的問題,給出直接合理的答案,該網(wǎng)站也可以 作為我們系統(tǒng)的問答服務(wù)云。2.2詳細(xì)設(shè)計(jì)前面介紹了嫩0問答服務(wù)系統(tǒng)的相關(guān)背景知識(shí),而整個(gè)系統(tǒng)就是對(duì)這些知識(shí)的 一個(gè)綜合集成。嫩0問答服務(wù)系統(tǒng)主要分為三個(gè)模塊:嫩0模塊、訊飛語音云模塊 和百度問答模塊。該系統(tǒng)在前端方面,即面向用戶、與用戶交互的技術(shù),主要是語音識(shí)別以及語 音合成的技術(shù)。語音識(shí)別技術(shù)是把用戶的口語轉(zhuǎn)化成文字,其中需要強(qiáng)大的語音知 識(shí)庫,因此需要用到所謂的“云計(jì)算”技術(shù),即使用訊飛語音云。而語音合成則是 把返回的文字結(jié)果轉(zhuǎn)化成語音輸出,這個(gè)技術(shù)理論上本地就可以完成,比如直接調(diào) 用嫩0模塊的說話子模塊,當(dāng)然,在云端完成也可以,比如使用訊飛語音云的語音 合成模塊。在后臺(tái)技術(shù)方面,主要是處理用戶的問題,調(diào)用百度問答服務(wù)云模塊獲 取問題的答案,并返回最匹配的結(jié)果。2.2.1機(jī)器人嫩0模塊嫩0模塊的基礎(chǔ)是嫩00,嫩00是運(yùn)行在應(yīng)0上的主程序的名稱,它控制著 嫩0,嫩00的架構(gòu)也就是對(duì)嫩0進(jìn)行編程時(shí)所要用到的編程架構(gòu)。這個(gè)框架允許 不同的模塊(動(dòng)作模塊、音頻模塊、視頻模塊)之間進(jìn)行通信,提供了函數(shù)和信息 的共享機(jī)制。嫩00支持交叉編程平臺(tái),我們可以在110界8、11皿X或者1狀操作系統(tǒng)下對(duì) 他進(jìn)行編程。嫩00也支持多種編程語言,我們可以使用這些語言調(diào)用嫩00的功 能模塊,但是我們只能用語言和訪0語言來編寫在用戶自定義的在嫩00 上運(yùn)行的模塊,嫩00為這兩種語目提供了完備的八?I。嫩00對(duì)0+十語目的支持是 最好的,我們用編寫實(shí)時(shí)的代碼,的代碼可以快速的在嫩0上運(yùn)行。相比 較之下,訪0。語言的執(zhí)行效率就低很多。圖四展示了嫩0機(jī)器人編程模塊的結(jié) 構(gòu)。7圖四:似0機(jī)器人的編程結(jié)構(gòu)圖為了使代碼的編譯變得更加簡便,嫩0的編程建議使用0仙1“工具,它的作 用是管理工程中的依賴關(guān)系并且支持交叉編譯。4仙1“也是一個(gè)支持交叉平臺(tái)的 工具,支持評(píng)10*8、11皿X和操作系統(tǒng)。918114是基于著名的01成6編譯 系統(tǒng)開發(fā)來的,因此它允許你使用你電腦上已有的集成開發(fā)環(huán)境,比如叩。、1成6、 或者是18皿1 5七舊10。搭建好上述嫩0的編程平臺(tái)后,就可以開始編寫嫩0模塊。嫩0模塊的主要功 能是獲取聲音和說出語音答案。對(duì)于獲取聲音部分,主要用到以下模塊和函數(shù):1.從50皿亞X廿狀丨01模塊:該模塊提供了基本的聲音處理的函數(shù),任何處理 音頻的模塊需要新建一個(gè)模塊繼承自該模塊。2丨86比116社?;66;6此68 0函數(shù):該函數(shù)的作用是設(shè)置從嫩0的話筒里獲得 的聲音片段的格式,包括采樣頻率、聲道設(shè)置等等。3 #00688 0函數(shù):這事一個(gè)回調(diào)函數(shù),該函數(shù)的功能是對(duì)聲音緩沖區(qū)進(jìn)行處 理,每當(dāng)獲得了一塊緩沖區(qū)的聲音數(shù)據(jù)后,系統(tǒng)就會(huì)自動(dòng)就調(diào)用該函數(shù)對(duì) 聲音數(shù)據(jù)進(jìn)行處理。為了實(shí)現(xiàn)我們想要的功能,我們需要重載這個(gè)回調(diào)函 數(shù)。4 8仏代06丨610=0函數(shù)、8丨0沖6丨610=0函數(shù):這兩個(gè)函數(shù)的作用分別是 開始和停止聲音片段的獲取。對(duì)于說出語音答案部分,主要用到以下模塊和函數(shù):1.八16X00166也?0X7 0接口:該接口的功能是封裝對(duì)嫩0機(jī)器人說話功能 的控制。2 86讓冊(cè)8皿陰0函數(shù):該函數(shù)的功能是設(shè)置嫩0機(jī)器人說話所支持的語言。133 8#0函數(shù):該函數(shù)的功能是使得嫩0機(jī)器人說出答案。其中需要注意的地方是嫩00的說話模塊支持的文字編碼方式是機(jī)?-8,而 評(píng)1仏0*8下卩82010默認(rèn)的文字編碼方式是X,所以在使用8奶0函數(shù)前,需要將 文字的編碼方式進(jìn)行一次轉(zhuǎn)換,11忖-8和X的轉(zhuǎn)換方法是通過皿100如編碼來轉(zhuǎn)換。嫩0機(jī)器人模塊的另一個(gè)功能是實(shí)現(xiàn)機(jī)器人在說話的同時(shí),做出相應(yīng)的動(dòng)作, 模擬人類之間交流時(shí)的一些肢體動(dòng)作,使得問答過程顯得更加人性化、更加生動(dòng)。 X八0機(jī)器人的開發(fā)平臺(tái)提供了一個(gè)可視化的動(dòng)作編輯工具06狀即1卜6,該工具使 得開發(fā)者可以更加方便的設(shè)計(jì)和調(diào)試機(jī)器人的動(dòng)作,軟件的界面如下圖所示:01 0*4 6001 切 901*111 鉍成0。1*0“ 8000(1 1.祝.辦 0048 844 140919090091X010*1844丹0# 00110111140600159(4 7*191 VI 了蒙籌飯麯魯圖五:06狀叩化軟件截圖2.2.2訊飛語音云模塊訊飛語音云模塊的主要功能是將獲取到的聲音上傳到云端服務(wù)器,進(jìn)行識(shí)別, 并將識(shí)別到的文字結(jié)果抓取到本地。在訊飛語音云編程平臺(tái)中關(guān)于語音識(shí)別提供如下函數(shù)調(diào)用:1.以部匕“0:對(duì)IX在識(shí)別過程中用到的全局配置項(xiàng)參數(shù)進(jìn)行初始化,如服 務(wù)器地址、訪問超時(shí)設(shè)置等。2丨以部868810沛68化0:用來開始一路I部會(huì)話,并在參數(shù)中指定本路I部會(huì) 話用到的語法列表,本次會(huì)話所用的參數(shù)等。3.011&皿虹八&1社6 0 :本函數(shù)用來激活一個(gè)指定的語法,語法類型可以 是仍和一種合法的語法。圖六:訊飛語音云平臺(tái)網(wǎng)絡(luò)結(jié)構(gòu) 4.015狀舊1011*6 0 :寫入本次獲取到的音頻,音頻可以一次性寫入,也可以 多次調(diào)用此接口分批寫入。5-以部化找68匕0 :獲取識(shí)別到的結(jié)果。6丨以部868810沾0:結(jié)束一路I部會(huì)話。7丨以部化切虹肅0 :查詢IX記錄下來的一些信息如數(shù)據(jù)上傳或下載的數(shù)據(jù)量等。8.01部?1=10 :對(duì)180的18尺部分進(jìn)行逆初始化。對(duì)于整個(gè)機(jī)器人問答系統(tǒng),訊飛語音云初始化和逆初始化操作只需要進(jìn)行一 次,而每次回答一個(gè)問題的時(shí),首先要開始一段會(huì)話,獲得會(huì)話1么然后就要進(jìn) 入上傳聲音數(shù)據(jù)和獲取識(shí)別結(jié)果的一個(gè)循環(huán),循環(huán)的內(nèi)容:當(dāng)一個(gè)聲音緩沖區(qū)滿了 就上傳獲取到的語音數(shù)據(jù)并檢測云端是否有識(shí)別結(jié)果,如果有就抓取識(shí)別結(jié)果。直 到檢測到語音后端點(diǎn)(即說完話)時(shí)候循環(huán)才停止,最后再檢測一下云端是否有未 取下來的識(shí)別結(jié)果,如果有則抓取下來。2.2.3百度問答服務(wù)云模塊百度問答服務(wù)云模塊的主要功能是將文字問題在網(wǎng)絡(luò)中進(jìn)行搜索,獲得相應(yīng)的 答案,并抓取下來。百度問答的搜索包括兩個(gè)過程:1.搜索問題:通過搜索得到若干個(gè)包含該問題答案的網(wǎng)頁的鏈接,這些鏈接 是按照其頁面所包含的答案的相關(guān)性進(jìn)行排列的,第一個(gè)鏈接的相關(guān)性最 大,我們獲取該鏈接地址;2抓取答案:打開第一個(gè)過程中獲得的鏈接地址,獲取所提問題答案所在的 頁面內(nèi)容,該頁面會(huì)有一個(gè)滿意答案,這個(gè)答案就是我們要抓取的內(nèi)容。 下面用一個(gè)實(shí)例來詳細(xì)描述這個(gè)模塊的流程,例如我們想要獲取“安徽有哪些 好玩的地方? ”這個(gè)問題的答案,系統(tǒng)的運(yùn)行流程如下所示:第一步、將訊飛語音云模塊識(shí)別到的文字問題進(jìn)行編碼并添加到百度知道的網(wǎng) 址后面,這樣便獲得百度知道搜索該問題的網(wǎng)頁地址。比如“安徽有哪些好玩的 地方”的機(jī)1-8編碼是“80828805030004040098030026850485088780”,百度知 道的 搜索網(wǎng) 頁地址 前綴是 “匕七如:2卜1也0.1如.0/863;卜?即二0610如0;和”,因此將“安徽有哪些 好玩的地方”的編碼加在百度搜索地址后面便得到該問題的搜索地址:“匕七七:/?;匕土己80.8土己1000乂86已;0匕?10=0&;打二10凌口打二0凌亡;二86已;0匕&16二呂6垃凌界0;己二80828805030004040098030026850485088780”。為了獲取網(wǎng)頁的源代碼,我們需要調(diào)用11=1加七接口。11=1他七是微軟開發(fā)的 一個(gè)庫,可以完成仏如、如客戶端的工作,讓程序員從復(fù)雜的協(xié)議中節(jié)省大量精 力。獲得上述頁面的源代碼后,對(duì)網(wǎng)頁源代碼進(jìn)行解析,可以獲取該問題相關(guān)性最 高的答案所在頁面的網(wǎng)址。第二步、再次調(diào)用11=1=61接口抓取第一步獲得的問題答案所在頁面的源代碼, 對(duì)該源代碼進(jìn)行解析,獲取到相應(yīng)的問題的答案。需要注意的是,有的網(wǎng)頁的源代 碼的編碼格式是機(jī)?-8,所以在解析時(shí)要先進(jìn)行編碼的轉(zhuǎn)換,轉(zhuǎn)換成#仏0舊下默 認(rèn)的X編碼方式,然后再進(jìn)行處理,否則會(huì)顯示亂碼。:地 1 過玩 案好 答些 取哪I 1 答安 101蒙度新 搜一步、獲得問題搜索頁面的網(wǎng)頁地址:&0 11511(111-0I1/3651%11?VI01%(1=x5x6x89/5x8x8I)x26x90x89x25x93xx24x8x98227x8249x67x9 只 284乂 25x9(80x26x96x89步得到間題答案所在頁面網(wǎng)址:七0 2 111(10 丨 11611(111 0011/(111631: 100/187424375 丨知七111I靜雛特明渡 得山1;?4 世 I 那山包樂4辦6湖湖8 置!11 11點(diǎn)趣山5第興蓬戈1 辦晶王點(diǎn)址景晶籠洞地I袁神是江I麗表管!|江I特明渡;山崖|;?4 世. 丫山包樂8圖七:百度問答服務(wù)模塊的執(zhí)行過程 用評(píng)1=161接口完成一個(gè)仏如下載需要以下步驟: 1丨1社6;6丨0口60使用11=16丨的程序進(jìn)行必要的初始化工作; 2丨1社6;6比0=6巧0關(guān)聯(lián)目標(biāo)地址或者域名以及服務(wù)1口;3丨價(jià)如0口6故6叫68丨0關(guān)聯(lián)要下載的內(nèi)容名字;4價(jià)如56。服6叫68七0將價(jià)如0口6故6叫68丨的返回值發(fā)送給目標(biāo)服務(wù)器;5丨價(jià)如如6171社0 0查詢返回值,不參與網(wǎng)絡(luò)操作,可以查詢服務(wù)器的返回信 息,比如目標(biāo)文件的大小,該文件是否存在等等;6.1=161=6找63證116 0很普通的讀函數(shù),就是下載文件;7.1=161=6比1086他仏16 0釋放資源。對(duì)于將百度問答服務(wù)云作為語義識(shí)別的語料庫,有一點(diǎn)不足在于,針對(duì)于機(jī)器 人所提的問題,百度問答上沒有相應(yīng)的答案,比如“你是誰”、“你叫什么名字”等 問題,由于這些問題有限,因此我們可以通過建立小型本地語料庫的方式來解決。 這樣本地語料庫和訊飛語音云結(jié)合使用,會(huì)得到更好的效果。三、系統(tǒng)性能分析我們測試了系統(tǒng)的性能,主要從訊飛語音識(shí)別成功率、獲取到答案的相關(guān)率兩 方面。我們隨機(jī)找來十個(gè)人,每個(gè)人隨機(jī)提問十個(gè)問題,要求盡量使用普通話。實(shí) 驗(yàn)結(jié)果如表一所示:表一、系統(tǒng)性能試驗(yàn)結(jié)果性能方面語音識(shí)別答案相關(guān)成功率0.910.95對(duì)于這樣的結(jié)果,我們是感到滿意的,當(dāng)然這是在網(wǎng)絡(luò)順暢、提問人普通話較 為標(biāo)準(zhǔn)、以及所提問題比較合理的基礎(chǔ)上的結(jié)果,如果提問題的人普通話不標(biāo)準(zhǔn), 或者語速過快,比如讓小孩來提問題,訊飛語音云的識(shí)別效率會(huì)大大降低。之前我們使用過趣答網(wǎng)站作為問答服務(wù)云的網(wǎng)站,趣答網(wǎng)站是清華大學(xué)研發(fā)的 在線搜索問題答案的網(wǎng)站,但是其問題覆蓋面不夠廣泛,許多比較偏的問題無法獲 得答案,我們也將趣答網(wǎng)站和百度知道網(wǎng)站進(jìn)行了對(duì)比,隨機(jī)獲取一百個(gè)問題,分 別在兩個(gè)網(wǎng)站上搜索答案,實(shí)驗(yàn)結(jié)果是如表二所示:表二、問答云性能比較問答服務(wù)云趣答網(wǎng)站百度知道成功率0.700.97相關(guān)性0.970.95通過實(shí)驗(yàn)結(jié)果我們看出趣答網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論