



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 語音控制無人機(jī)初探 朱立鑫 崔韞鑫摘要:隨著無人機(jī)技術(shù)的迅猛發(fā)展,控制無人機(jī)的方式也在不斷革新。研究在開源地面站上實(shí)現(xiàn)無人機(jī)語音指令控制技術(shù),可使操作更加便捷。通過簡潔、友好的語音界面就可與控制系統(tǒng)進(jìn)行深入信息交互,完成語音指令所代表復(fù)雜控制內(nèi)容。由于本文僅為語音控制無人機(jī)初探,主要介紹通過特定的一種方式實(shí)現(xiàn)語音控制。本文以開源地面站mission planner作為基礎(chǔ)進(jìn)行軟件開發(fā),利用windows自帶的語音識別模塊進(jìn)行識別及其在無人機(jī)控制中的應(yīng)用為研究內(nèi)容,借此來簡化無人機(jī)控制流程、提供一種簡潔的語音指令控制界面,重點(diǎn)研究了語音識別技
2、術(shù)在無人機(jī)控制上的應(yīng)用。關(guān)鍵詞:語音識別;無人機(jī);地面站語音識別技術(shù)是一種人機(jī)交互技術(shù)。語言作為信息溝通的最主要方式,可為人機(jī)交互使用時提供其它方式不可替代的直接和便利。因此,將語音識別這種人機(jī)交互手段應(yīng)用于無人機(jī)控制方面,可以為操作人員提供一種簡便的語音指令控制界面,使操作更加便捷。一、語音控制無人機(jī)研究現(xiàn)狀2001年,美國斯坦福大學(xué)研制出witas多模態(tài)對話系統(tǒng)用于控制無人機(jī)設(shè)備。隨后,語音控制技術(shù)高速發(fā)展。目前,我國民用無人機(jī)領(lǐng)域內(nèi),語音控制無人機(jī)已成為下一發(fā)展階段。二、語音控制無人機(jī)總體設(shè)計(jì)本人主要從三個方面介紹語音控制無人機(jī),即語音識別技術(shù)、指令控制及地面站軟件開發(fā)。三、無人機(jī)語音識
3、別技術(shù)本文主要介紹通過使用c#和speech sdk來進(jìn)行語音識別。本文介紹的語音識別功能,其實(shí)就是利用windows的語音引擎,它包含在speech sdk開發(fā)包中。我們就是使用此開發(fā)包根據(jù)自己的需要開發(fā)程序。speech sdk包含語音識別sr引擎和語音合成ss引擎兩種語音引擎。語音識別引擎用于識別語音命令,調(diào)用接口完成某個功能,實(shí)現(xiàn)語音控制。語音合成引擎用于將文字轉(zhuǎn)換成語音輸出。語音識別引擎分兩種模式識別:文本識別模式和命令識別模式。此兩種模式的主要區(qū)別在于識別過程中使用的匹配字典不同。前者使用的是通用字典,特點(diǎn)是覆蓋的詞匯量大,因?yàn)樵~匯量大直接導(dǎo)致識別的精度降低,識別速度較慢。后者的字
4、典需要開發(fā)者自己編寫,這種方式由開發(fā)者定義詞匯的數(shù)量,大大降低匹配過程中需要檢索的詞匯量,提高了識別速度,同時因?yàn)楹蜻x項(xiàng)極少,所以一般不會識別錯誤。由于控制無人機(jī)飛行僅需要幾個特定的指令,而且對識別率要求較高,所以選用命令識別模式進(jìn)行語音識別開發(fā)。四、無人機(jī)飛行協(xié)議及控制指令(一)mavlink簡介mavlink協(xié)議是在串口通訊基礎(chǔ)上的一種更高層的開源通訊協(xié)議,主要應(yīng)用在微型飛行器(micro aerial vehicle)的通訊上。mavlink是為小型飛行器和地面站通訊時常常用到的那些數(shù)據(jù)制定一種發(fā)送和接收的規(guī)則并加入了校驗(yàn)(checksum)功能。如圖所示,每個消息幀都是上述的結(jié)構(gòu),除了
5、灰色外,其他的格子都代表了一個字節(jié)的數(shù)據(jù)?;疑褡永锩娴臄?shù)據(jù)長度是不固定的。紅色的是起始標(biāo)志位(stx)。這個標(biāo)志位用于mavlink消息幀接收端進(jìn)行消息解碼。第二個格子代表的是payload的字節(jié)長度(len),范圍從0255。第三個格子代表的是本次消息幀的序號(seq),每次發(fā)完一個消息,這個字節(jié)的內(nèi)容會加1,加到255后會從0重新開始。這個序號用于mavlink消息幀接收端計(jì)算消息丟失比例。第四個格子代表發(fā)送本條消息幀的設(shè)備的系統(tǒng)編號(sys)。第五個格子代表了發(fā)送本條消息幀的設(shè)備的單元編號(comp)。第六個格子代表了有效載荷中消息包的編號(msg),mavlink消息幀接收端根據(jù)這個
6、編號來確定有效載荷里的消息包并根據(jù)編號選擇對應(yīng)的方式來處理有效載荷里的信息包。最后兩個字節(jié)是16位校驗(yàn)位,ckb是高八位,cka是低八位。校驗(yàn)碼由crc16算法得到。(二)地面站和飛控的通訊流程無人機(jī)連接好mp地面站后,都會主動向地面站發(fā)送心跳包、飛行器姿態(tài)、系統(tǒng)狀態(tài)等組成的數(shù)據(jù)流。地面站會在剛連接上飛控時發(fā)送命令,請求飛控傳回所有參數(shù),飛控根據(jù)自己的情況判斷是否接受地面站的請求,并根據(jù)不同的命令執(zhí)行相應(yīng)的操作。mp地面站比較成熟,在軟件內(nèi)已經(jīng)預(yù)設(shè)了無人機(jī)飛行所需的各種指令。這些指令通過mavlink協(xié)議傳遞給飛控,從而實(shí)現(xiàn)對無人機(jī)的控制。我們只需在地面站中找到這些指令,將語音識別結(jié)果與這些指
7、令相對應(yīng)就可以實(shí)現(xiàn)對無人機(jī)的語音控制。五、地面站軟件開發(fā)mission planner是一個功能齊全的開源地面站應(yīng)用程序。本人在此軟件的基礎(chǔ)上進(jìn)行二次開發(fā),加入語音識別模塊,將識別結(jié)果與無人機(jī)飛行命令相對應(yīng),從而實(shí)現(xiàn)對無人機(jī)的語音控制。實(shí)現(xiàn)語音控制用到的mp地面站內(nèi)的飛行指令,主要是導(dǎo)航命令。導(dǎo)航命令是用于控制無人機(jī)的運(yùn)動,包括起飛、航路點(diǎn)和移動至周圍和著陸。本人用到的導(dǎo)航命令:mav_cmd_nav_takeoff:從地面起飛(發(fā)射)。實(shí)現(xiàn)“起飛”指令。mav_cmd_nav_return_to_launch:返回home位置或就近的集結(jié)點(diǎn)。home的位置是飛行器解鎖位置。實(shí)現(xiàn)“返航”指令。mav_cmd_nav_land:在當(dāng)前或指定位置降落。實(shí)現(xiàn)“降落”指令。mav_cmd_nav_guided_enable:啟用引導(dǎo)控制模式切換到外部控制器。在guided模式下,在預(yù)先建立的三維坐標(biāo)系中,引導(dǎo)無人機(jī)在空間中實(shí)現(xiàn)“前進(jìn)”、“后退”、“向左”、“向右”、“上升”、“下降”等指令。六、總結(jié)本文以開源地面站mission planner作為基礎(chǔ)進(jìn)行軟件開發(fā),利用windows自帶的語音識別模塊進(jìn)行識別及其在無人機(jī)控制中的應(yīng)用為研究內(nèi)容,借此簡化無人機(jī)控制流程、提供一種簡潔的語音指令控制界面,實(shí)現(xiàn)了語音控制無人機(jī)功能。本文僅為語音控制無人機(jī)初探,主要介紹通過特
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑安全與防護(hù)教學(xué)課件
- 小學(xué)一年級數(shù)學(xué)課件:快樂的水果排序
- 幼兒園小班課件-探索動物世界
- 農(nóng)村初中畢業(yè)典禮活動方案
- 高級審計(jì)師復(fù)習(xí)計(jì)劃的制定與執(zhí)行試題及答案
- 油氣輸送管道穿越工程設(shè)計(jì)規(guī)范
- 廣告創(chuàng)意與策略課件
- 2025年節(jié)能型空氣分離設(shè)備合作協(xié)議書
- 2024年黑龍江省雞西市城子河區(qū)數(shù)學(xué)三上期末學(xué)業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 2024年河北省秦皇島市盧龍縣數(shù)學(xué)三上期末學(xué)業(yè)質(zhì)量監(jiān)測模擬試題含解析
- 初二下學(xué)期期中家長會發(fā)言稿
- 福建省福州市2025年初中畢業(yè)班教學(xué)質(zhì)量檢測二生物學(xué)試卷(無答案)
- 山東省濟(jì)南市東南片區(qū)2024-2025學(xué)年七年級下學(xué)期期中考試英語試題
- 四川省資陽市樂至縣2025年三年級數(shù)學(xué)第二學(xué)期期末達(dá)標(biāo)檢測試題含解析
- 2025-2030中國城市規(guī)劃行業(yè)深度分析及發(fā)展前景與發(fā)展戰(zhàn)略研究報告
- 2025年全國焊工作業(yè)人員職業(yè)技能理論考試練習(xí)題庫(900題)含答案
- 道岔區(qū)無砟軌道我國高速鐵路道岔區(qū)采用的無砟軌道主要有長枕埋
- 《行政法與行政訴訟法》課件各章節(jié)內(nèi)容-第二十六章 行政賠償及訴訟
- 【9物一模】2025年安徽省合肥市45中(橡樹灣)中考一模物理試卷
- 計(jì)算機(jī)系統(tǒng)規(guī)劃與管理考試內(nèi)容試題及答案
- 藥店質(zhì)量負(fù)責(zé)人聘用合同范例二零二五年
評論
0/150
提交評論