機器人工程專業(yè)導論 課件 第6章 服務(wù)機器人研究熱點問題_第1頁
機器人工程專業(yè)導論 課件 第6章 服務(wù)機器人研究熱點問題_第2頁
機器人工程專業(yè)導論 課件 第6章 服務(wù)機器人研究熱點問題_第3頁
機器人工程專業(yè)導論 課件 第6章 服務(wù)機器人研究熱點問題_第4頁
機器人工程專業(yè)導論 課件 第6章 服務(wù)機器人研究熱點問題_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

6.1服務(wù)機器人的發(fā)展

6.2服務(wù)機器人的定義與劃分標準

6.3服務(wù)機器人行業(yè)的產(chǎn)業(yè)鏈組成

6.4服務(wù)機器人的核心技術(shù)

6.5服務(wù)機器人的發(fā)展趨勢與展望6.1服務(wù)機器人的發(fā)展6.1服務(wù)機器人的發(fā)展服務(wù)機器人起源于機器替代人工。服務(wù)機器人的發(fā)展本質(zhì)上是機器替代人工的結(jié)果。服務(wù)機器人替代人工表現(xiàn)在兩個方面:一是比人工更加經(jīng)濟;二是實現(xiàn)人工所不能??梢哉f機器替代人工將是歷史的發(fā)展必然,服務(wù)機器人的發(fā)展順應(yīng)歷史潮流。服務(wù)機器人發(fā)展過程如圖6-1所示。服務(wù)機器人發(fā)展的驅(qū)動因素主要有以下幾個方面:(1)勞動力成本上升。由于發(fā)達國家的勞動力價格日趨上漲,而且人們越來越不愿意從事自己不喜歡干的工作,類似于清潔、導購、保安等工作在發(fā)達國家從事的人越來越少。這種簡單勞動力的不足使服務(wù)機器人有著巨大的市場。(2)經(jīng)濟水平的提高。隨著經(jīng)濟水平的上升,人們可支配收入的增加,使得人們有能力購買服務(wù)機器人來解放簡單的重復勞動,或者購買服務(wù)機器人進行娛樂、教育,從而提高生活質(zhì)量。(3)技術(shù)的發(fā)展。進入互聯(lián)網(wǎng)時代后,人類的科學技術(shù)迅猛發(fā)展,這得益于計算機和微芯片的發(fā)展,智能機器人更新?lián)Q代的速度越來越快,服務(wù)機器人發(fā)展的技術(shù)支撐越來越強。(4)國家政策的大力支撐。除了需求的提升和技術(shù)的積累,服務(wù)機器人的快速發(fā)展也脫離不了國家政策的支撐。作為行業(yè)和社會經(jīng)濟發(fā)展的新支點,服務(wù)機器人發(fā)展的政策扶植力度越來越大。進入21世紀,全球服務(wù)機器人行業(yè)也進入了高速發(fā)展的黃金時代。根據(jù)中國電子學會報告,2013—2021年平均負荷增速為12%。其中,服務(wù)機器人占比約131.4億美元。受益于人工智能技術(shù)的不斷發(fā)展和下游應(yīng)用需求的持續(xù)旺盛,服務(wù)機器人行業(yè)應(yīng)用場景和服務(wù)模式不斷拓展,帶動行業(yè)規(guī)模高速增長,全球服務(wù)機器人在全球機器人市場中的結(jié)構(gòu)占比逐年提高。在服務(wù)機器人體系中,物流機器人又是全球?qū)I(yè)服務(wù)機器人最大的細分市場,在新零售、電子商務(wù)等發(fā)展助推下,開始廣泛應(yīng)用于寫字樓、醫(yī)院等室內(nèi)場景和社區(qū)、工業(yè)園區(qū)等室外場景,市場熱度逐步提升。在應(yīng)用需求的拉動下,我國服務(wù)機器人市場快速增長,行業(yè)發(fā)展整體接近國際水平。6.2服務(wù)機器人的定義與劃分標準1.服務(wù)機器人的定義國際機器人聯(lián)合會(IFR)將服務(wù)機器人定義為一種半自主或全自主工作的機器人,它能完成有益于人類健康的服務(wù)工作,區(qū)別于從事工業(yè)生產(chǎn)的設(shè)備。按照此項定義,工業(yè)機械臂如果應(yīng)用于非制造業(yè),也可被認為是服務(wù)機器人。2.服務(wù)機器人的劃分標準服務(wù)機器人的分類標準主要有三種:實體形態(tài)、應(yīng)用領(lǐng)域、外體形態(tài)。1)按照實體形態(tài)劃分按照實體形態(tài)的不同,服務(wù)機器人可分為虛擬服務(wù)機器人和實體服務(wù)機器人。虛擬服務(wù)機器人已經(jīng)廣泛商業(yè)化,例如銀行、電信系統(tǒng)的自動客服應(yīng)答系統(tǒng),蘋果的Siri、微軟的小冰等都是虛擬服務(wù)機器人。實體服務(wù)機器人就是通常意義下的具備實物的機器人,包括導購、送餐、陪護、教育機器人等,實體服務(wù)機器人主要用于基于功能性需求的場景。2)按照應(yīng)用領(lǐng)域劃分我國國家標準化管理委員會2020年重新修訂的機器人分類標準GB/T39405—2020將服務(wù)機器人從應(yīng)用領(lǐng)域進行了劃分,即個人/家用服務(wù)機器人(Personal/Household

Service

Robot)和公共服務(wù)機器人(PublicServiceRobot),前者是指在居家換環(huán)境或類似環(huán)境下使用的,以滿足使用者生活需求為目的的服務(wù)機器人,主要用于家務(wù)、娛樂、陪伴、康復等;后者是指在住宿、餐飲、金融、清潔、物流、教育、文化和娛樂等領(lǐng)域的公共場合為人類提供一般服務(wù)的商用機器人。幾種典型的服務(wù)機器人如圖6-2所示。3)按照外體形態(tài)劃分根據(jù)外體形態(tài)的不同以及是否具有類人特征,服務(wù)機器人可劃分為人形機器人和非人形機器人。前者不僅包含頭、軀干、四肢,其行為、決策和感知的方式也類似于人。6.3服務(wù)機器人行業(yè)的產(chǎn)業(yè)鏈組成服務(wù)機器人行業(yè)的產(chǎn)業(yè)鏈可分為上游、中游和下游。其行業(yè)體系如圖6-3所示。上游企業(yè)是指生產(chǎn)各種服務(wù)機器人所需零部件的零部件供應(yīng)商或材料供應(yīng)商。其中,主要零件包括電子器件、微處理器、機器人用伺服電機、高精度減速器、傳感器、電池、單片機、舵機等,歸屬于標準零部件、電子設(shè)備以及電子元器件等。我國處于上游的服務(wù)機器人企業(yè)以致力于圖形識別、芯片環(huán)節(jié)的企業(yè)居多,例如新松機器人和科沃斯機器人。新松機器人公司深耕工業(yè)機器人和移動機器人領(lǐng)域多年,主要為服務(wù)機器人產(chǎn)品提供硬件、移動、導航等方面的技術(shù)支撐;科沃斯機器人公司掌握代碼實現(xiàn)和芯片燒錄等核心環(huán)節(jié),在路徑規(guī)劃和全局規(guī)劃技術(shù)方面也處于行業(yè)領(lǐng)先地位,產(chǎn)品中以智能清掃機器人最為突出。中游制造環(huán)節(jié)包括總裝廠、操作系統(tǒng)提供商、云系統(tǒng)提供商等,例如優(yōu)必選科技、克路德、康力優(yōu)藍和云跡科技。優(yōu)必選科技的核心技術(shù)為人形機器人驅(qū)動伺服舵機、步態(tài)規(guī)劃和運動控制,產(chǎn)品矩陣豐富;克路德主要專注于場景定制化,包括銀行、商場、幼兒園、商業(yè)展廳、智能家居等;康力優(yōu)藍產(chǎn)品線較廣,優(yōu)勢技術(shù)為AI、語音識別和智能感應(yīng)等;云跡科技主要專注于室內(nèi)的定位導航技術(shù),在10~100m距離的酒店場景,其酒店定制服務(wù)機器人行業(yè)技術(shù)領(lǐng)先。下游則主要是醫(yī)療、家用、農(nóng)用、軍事等行業(yè)和領(lǐng)域的消費和流通環(huán)節(jié),銷售渠道分為線上和線下。線下渠道分為直營和分銷兩種形式,具有產(chǎn)品體驗和品牌展示等功能,有利于產(chǎn)品的品牌建設(shè);線上渠道包括線上B2C、電商平臺入倉和線上分銷商等形式,相比線下渠道價格優(yōu)勢明顯,是家務(wù)機器人主要銷售渠道。6.4服務(wù)機器人的核心技術(shù)6.4.1智能機器人的核心技術(shù)模塊劃分整個服務(wù)機器人產(chǎn)業(yè)主要建立在三大核心技術(shù)模塊之上:人機交互及識別模塊、環(huán)境感知模塊、運動控制模塊。人機交互及識別模塊主要包括語音識別、語義識別、語音合成、圖像識別等,相當于人的大腦;環(huán)境感知模塊借助于各種傳感器、陀螺儀、激光雷達、相機、攝像頭等,相當于人的眼、耳、鼻、皮膚等;運動控制模塊包括舵機、電機、芯片等。依托于三大模塊,整合基礎(chǔ)硬件、系統(tǒng)、算法、控制元件,形成滿足具有一定行走能力和交互能力的服務(wù)機器人整機,并在此基礎(chǔ)上形成各種基礎(chǔ)應(yīng)用開發(fā),進而催生出行業(yè)可共用的龐大數(shù)據(jù)群體服務(wù),如群組服務(wù)、云服務(wù)、大數(shù)據(jù)服務(wù)等。服務(wù)機器人核心模塊與技術(shù)如圖6-4所示。服務(wù)機器人三大模塊可以繼續(xù)細分為語音模塊、語義模塊、圖像模塊、感知模塊、運控模塊、芯片模塊。重要性排序依次為:語音模塊、語義模塊、芯片模塊、圖像模塊、感知模塊、運控模塊。成熟度排序依次為:語音模塊、圖像模塊、運控模塊、感知模塊、語義模塊、芯片模塊。在服務(wù)機器人的各個細分模塊中,語音模塊的重要性和成熟度均最高,語義模塊則是目前突破重點,而運控模塊的重要性相對最低。從第一代以鼠標和鍵盤的交互方式為特點的PC互聯(lián)網(wǎng),到第二代以觸屏、GPS等交互方式為特點的移動互聯(lián)網(wǎng),再到今天以多模態(tài)人機交互方式為特點的第三代互聯(lián)網(wǎng),服務(wù)機器人產(chǎn)業(yè)底層的邏輯就是人機交互方式的發(fā)展和演變。隨著語音交互、視覺圖像交互、動作交互、腦電波交互等多模態(tài)人機交互技術(shù)的逐步發(fā)展和成熟,這些第三代人機交互方式將會深層次地改變我們?nèi)粘I畹膽?yīng)用場景。同時,一場第三代互聯(lián)網(wǎng)的主流終端模式和服務(wù)內(nèi)容入口的競爭也在同步進行。人機交互是服務(wù)機器人場景化不可或缺的環(huán)節(jié)。在傳統(tǒng)的交互模式中,使用的大多是單一單向的交互方式。在人機對話中,尤其是多輪人機對話,涉及語音理解、語義分析、情感分析、動作捕捉等多個維度。為了進一步提高服務(wù)機器人對所處環(huán)境的動態(tài)“解讀”能力,單一模態(tài)感知技術(shù)顯然已不再適應(yīng)機器人的高速發(fā)展需求,因此多模態(tài)交互技術(shù)應(yīng)運而生。多模態(tài)融合了視覺、聽覺、觸覺、嗅覺等交互方式,其表達效率和表達的信息完整度要優(yōu)于傳統(tǒng)單一的交互模式。6.4.2環(huán)境感知模塊1.感知系統(tǒng)感知系統(tǒng)主要由能夠感知不同信息的傳感器構(gòu)成,這些傳感器屬于硬件部分,包括視覺、聽覺、觸覺、味覺、嗅覺等傳感器。如在視覺方面,目前多是利用攝像機作為視覺傳感器,它與計算機相結(jié)合,并采用電視技術(shù),使機器人具有視覺功能,可以“看到”外界的景物,經(jīng)過計算機對圖像的處理,就可對機器人下達如何動作的命令。感知系統(tǒng)中的傳感器可細分為內(nèi)部傳感器和外部傳感器。(1)內(nèi)部傳感器。內(nèi)部傳感器是指用來檢測機器人本身狀態(tài)(如手臂間的角度)的傳感器,多為檢測位置和角度的傳感器,具體包括位置傳感器、角度傳感器等。(2)外部傳感器。外部傳感器是指用來檢測機器人所處環(huán)境(如檢測物體及距物體的距離)、狀況(如檢測抓取的物體是否滑落)的傳感器,具體包括距離傳感器、視覺傳感器、力覺傳感器等。多傳感融合技術(shù)已成為服務(wù)機器人感知環(huán)境的主要技術(shù),其中應(yīng)用最為廣泛且相對成熟度較高的當屬激光雷達+SLAM的自主定位導航技術(shù),已被廣泛應(yīng)用于商場導購、自動送餐、智能倉儲、安全巡邏、病床看護、除塵清掃等。SLAM(SimultaneousLocalizationAndMapping)的含義是即時定位與地圖構(gòu)建,指的是機器人在自身位置不確定的條件下,在完全未知的環(huán)境中創(chuàng)建地圖,同時利用地圖進行自主定位和導航。SLAM問題可以描述為:機器人在未知環(huán)境中從一個未知位置開始移動,在移動過程中根據(jù)位置估計和傳感器數(shù)據(jù)進行自身定位,同時建造增量式地圖。2.自主定位導航系統(tǒng)成熟的自主定位導航系統(tǒng)需具備三大特征。(1)實時定位。實時定位不僅需要更為精準的距離精度,其對狀態(tài)的更新頻率要求也更高,而目前常用的GPS只能實現(xiàn)半米的精度,其實時位置更新頻率也無法滿足要求。定位包括相對定位和絕對定位。相對定位主要依靠內(nèi)部本體感受傳感器如里程計、陀螺儀等,通過給定初始位姿,測量相對于機器人初始位姿的距離和方向來確定當前機器人的位姿,也叫做航跡推算(DeadReckoning,DR);絕對定位主要采用主動或被動標識、地圖匹配、GPS、導航信標進行定位。位置的計算方法包括三角測量法、三邊測量法和模型匹配算法等。(2)繪制地圖。車載導航的地圖是由專人繪制的,但在家庭、商場、建筑工地等環(huán)境中,結(jié)構(gòu)環(huán)境更替無規(guī)則,很難通過人為操作來繪制實時地圖,所以需要機器人能在沒有人工干預的情況下對所處環(huán)境的結(jié)構(gòu)進行繪制。(3)路徑規(guī)劃。導航儀與機器人自主導航的核心都是路徑規(guī)劃,不同之處在于導航儀的路徑規(guī)劃是由人來決定的,而機器人則是用算法決定的,如谷歌的無人駕駛汽車,主要的工作量都在導航算法上。從原理上來講,機器人繪制的地圖是任何方向都可以走的,但現(xiàn)實并非如此,所以機器人需要通過進一步的路徑規(guī)劃來避障或控制越障行為。激光雷達是一種傳感器,在自主定位導航系統(tǒng)中,激光雷達作為SLAM的重要入口,其性能以及對監(jiān)測信息的提取與整合也是整個技術(shù)的難點所在。服務(wù)機器人如果要實現(xiàn)精確的服務(wù),滿足復雜場景下的用戶需求,除了精準的定位,還需要結(jié)合定位信息對環(huán)境進行識別。目前在任何具有精準高效要求的自主定位場合,應(yīng)用激光雷達都是主流的技術(shù)方案。表6-3展示了激光雷達和視覺定位方式的對比。激光雷達是“機器之眼”,能夠獲得周邊環(huán)境的點云數(shù)據(jù)模型,現(xiàn)在多用于在測量中有一定精度要求的領(lǐng)域,或需要測量自身與人體距離的智能裝備,在測量與人的距離這一功能上尚無完美替代方案。然而,激光雷達的缺點也同樣明顯,其在大雨、大雪等惡劣天氣中的使用效果會受到影響。相對于激光雷達,毫米波雷達雖然精度不高、視場小,但測量距離遠,可以達到200m,剛好彌補了激光雷達的短板。因此,目前具有移動功能的智能設(shè)備都是采用激光雷達、攝像頭、毫米波雷達、超聲波傳感器、GPS這五類傳感器或其中某幾個的組合來實現(xiàn)自主移動功能。這五種傳感器各具特征,各自有所側(cè)重,一般在復雜系統(tǒng)中組合使用,同時還需要加載深度圖像識別與其配合,共同完成對環(huán)境的感知。激光雷達“眼”中的世界如圖6-5所示。3.五類傳感器1)激光雷達激光雷達通過發(fā)射n條激光,利用三角測距原理(低成本方案)或TOF(TimeofFlight,飛行時間)(高成本方案)來測量周圍物體與自身的距離,獲得精度較高的距離信息——點云數(shù)據(jù)。激光雷達按照激光束的數(shù)量可以分為1線、4線、8線、16線、32線、64線激光雷達。多個激光束排列在一個豎直的平面呈不同角度發(fā)射出去,經(jīng)高速旋轉(zhuǎn)或電子方式形成了對于空間的三維掃描,n線激光雷達就相當于一次性打出了n個平面,激光束的數(shù)量決定了三維空間的覆蓋面和點云數(shù)據(jù)的密度。2)攝像頭攝像頭獲得觀察畫面,對每一幀畫面進行算法處理,能夠識別物體、判斷位置。攝像頭必須先識別再測距,如果無法識別則無法測距。優(yōu)點在于攝像頭是目前唯一能夠辨別物體的傳感器。但是攝像頭同時具有三個缺點:(1)在逆光或光影復雜的地方難以使用;(2)依賴算法,能否辨別物體完全依賴樣本的訓練,樣本未覆蓋的物體將無法辨別;(3)攝像頭對于行人的識別具有不穩(wěn)定性,如穿著吉祥物套裝或著裝顏色與背景相似的人或搬運東西的人極有可能無法識別。3)毫米波雷達毫米波雷達可發(fā)射波長為1~10mm的電磁波,根據(jù)反射波的時間差及強度等來測量距離,如汽車毫米波雷達的頻段主要為24GHz和77GHz。毫米波雷達的優(yōu)點在于性價比較高;缺點是行人的反射波容易被其他物體的反射波埋沒,難以分辨,無法識別行人。因此,毫米波雷達在測距領(lǐng)域具有較高性價比,但是其無法探測行人是一個致命弱點,只能應(yīng)用于自適應(yīng)巡航系統(tǒng)等,如ADAS系統(tǒng)。4)超聲波傳感器超聲波傳感器可發(fā)射振動頻率高于聲波的機械波,根據(jù)反射波測量距離。其優(yōu)點在于探測物體范圍極廣,能夠探測絕大部分物體,且具有較高的穩(wěn)定性;缺點是一般只能探測10m以內(nèi)的距離,無法進行遠距離探測。5)GPSGPS可以獲得自身相對于全局的位置信息。其優(yōu)點在于技術(shù)較為成熟,能夠?qū)崿F(xiàn)在全局視角的定位功能;缺點在于無法獲得周圍障礙物的位置信息。具備定位功能的GPS與前幾個探障類傳感器往往需要搭配使用。6.4.3人機交互及識別模塊1.自動語音識別技術(shù)自動語音識別技術(shù)(AutomaticSpeechRecognition)是一種將人的語音轉(zhuǎn)換為文本的技術(shù)。由于語音信號的多樣性和復雜性,語音識別系統(tǒng)只能在一定的限制條件下獲得令人滿意的性能,或者說只能應(yīng)用于某些特定的場合。自動語音識別的總體過程是:語音輸入,然后前處理得到數(shù)字信號,再進行聲學特征的提取,進行模式匹配,處理后得到結(jié)果。技術(shù)過程是:先對語音切除,再進行聲學特征提取,然后對其進行分幀,得到多維向量表達的若干幀,再把幀識別為狀態(tài)(難點),每三個狀態(tài)合組合為1個語素,再把語素組合為單詞。語音語義識別流程如圖6-11所示。語音識別發(fā)展歷史可細分為三階段:規(guī)則階段、統(tǒng)計階段以及深度學習階段。規(guī)則階段主要是指20世紀50年代到20世紀70年代,語音技術(shù)整體受制于硬性規(guī)則主導,發(fā)展緩慢,以IBM公司為例,區(qū)區(qū)幾百個單詞的正確識別率不及70%;統(tǒng)計階段主要指20世紀70年代到20世紀末,語音語義技術(shù)發(fā)展進入高速期,統(tǒng)計與規(guī)則并行,語音識別、詞性分析、句法分析等問題均得到了較好的解決;21世紀初,由于計算能力增強,語音技術(shù)有了重大突破,基于深度學習的語音語義識別技術(shù)得到大力推廣,識別精度也大幅度提升。語音語義技術(shù)的發(fā)展進程如圖6-12所示。自動語音識別從規(guī)則到統(tǒng)計再到深度學習,目前錯誤率已達到了商用門檻。以國際上公認衡量自動語音水平的參數(shù)語音識別錯誤率(WER)為標準,國際上占據(jù)全球市場60%份額的第一大語音公司Nuance為包括蘋果在內(nèi)的財富100強公司中的三分之二提供語音技術(shù)服務(wù),其WER在10%左右。Google依靠強大的深度學習,在2015年率先將WER降低至8%。國內(nèi)語音實力最強的科大訊飛也達到了15%的使用門檻,針對會議演講等場景達到5%以上的識別率,特別針對中文的部分方言也達到了實用門檻。2.自然語言處理技術(shù)自然語言處理技術(shù)(NLP)是用于處理人類自然語言中詞法和句法的高效識別技術(shù),其大致分為三個層面:詞法分析、句法分析和語義分析。雖然目前NLP對詞法與句法處理已經(jīng)取得了不錯效果,但對語義的理解還僅僅停留在表層。自然語言處理技術(shù)結(jié)構(gòu)如圖6-13所示。1)詞法分析詞法分析包括分詞、詞性標注、命名實體識別和詞義消歧。分詞和詞性標注好理解。命名實體識別的任務(wù)是識別句子中的人名、地名和機構(gòu)名稱等命名實體。每一個命名實體都是由一個或多個詞語構(gòu)成的。詞義消歧是指要根據(jù)句子上下文語境來判斷出詞語的真實意思。2)句法分析句法分析是將輸入的句子從序列形式變成樹狀結(jié)構(gòu),從而可以捕捉到句子內(nèi)部詞語之間的搭配或者修飾關(guān)系,這一步是NLP中關(guān)鍵的一步。目前研究界存在兩種主流的句法分析方法體系:短語結(jié)構(gòu)句法體系和依存結(jié)構(gòu)句法體系。其中依存結(jié)構(gòu)句法體系現(xiàn)在已經(jīng)成為研究句法分析的熱點。依存結(jié)構(gòu)句法體系表示形式簡潔,易于理解和標注,可以很容易地表示詞語之間的語義關(guān)系,比如句子成分之間可以構(gòu)成施事、受事、時間等關(guān)系。這種語義關(guān)系可以很方便地應(yīng)用于語義分析和信息抽取等方面。依存結(jié)構(gòu)句法體系還可以更高效地實現(xiàn)解碼算法。句法分析得到的句法結(jié)構(gòu)可以幫助上層進行語義分析以及一些應(yīng)用。3)語義分析語義分析的最終目的是理解句子表達的真實語義,但是用什么形式來表示語義一直沒有能夠很好地解決。語義角色標注是比較成熟的淺層語義分析技術(shù)。給定句子中的一個謂詞,語義角色標注的任務(wù)就是從句子中標注出這個謂詞的施事、受事、時間、地點等參數(shù)。語義角色標注一般都在句法分析的基礎(chǔ)上完成,句法結(jié)構(gòu)對于語義角色標注的性能至關(guān)重要。在自然語言處理中,詞義消歧仍然是技術(shù)的瓶頸所在,且中文相比于英文更難。自然語言處理的基本流程如下:(1)切詞,就是把輸入的字符串分解成為詞匯單位,這是自然語言處理的先行環(huán)節(jié);(2)詞類標注;(3)語法理論;(4)詞義消歧。隨著計算科學的發(fā)展,自然語言未來的處理方式仍要依靠深度學習技術(shù)。自然語言處理流程及難點如圖6-14所示。3.圖像識別技術(shù)人類感覺信息中的80%都是視覺信息。圖像識別是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)。識別過程包括圖像預處理、圖像分割、特征提取和判斷匹配。簡單來說,圖像識別就是計算機如何像人一樣讀懂圖片的內(nèi)容。借助圖像識別技術(shù),我們不僅可以通過圖片搜索更快地獲取信息,還可以產(chǎn)生一種新的與外部世界交互的方式,甚至會讓外部世界更加智能地運行。圖像識別過程如圖6-15所示。圖像識別的應(yīng)用領(lǐng)域非常廣泛。從工業(yè)視覺到人機交互,從視覺導航到虛擬現(xiàn)實,從安全領(lǐng)域到醫(yī)學圖像,從自動解釋到遙感分析,這些功能在未來的服務(wù)機器人上都非常重要。然而,到目前為止,圖像識別技術(shù)并不完善,仍然面臨許多困難。從目前的技術(shù)演變來看,未來圖像識別的突破同樣將依靠深度技術(shù),具體體現(xiàn)在以下三方面:(1)計算能力??赏ㄟ^CPU、GPU、分布式架構(gòu)等提高計算能力。(2)大數(shù)據(jù)。數(shù)據(jù)量越多,一般來說越有利于機器學習。(3)算法。目前主流的算法是深度學習的CNN算法和RNN算法。圖像識別發(fā)展新方向如圖6-16所示。6.4.4運動控制模塊1.服務(wù)機器人常用作動器服務(wù)機器人本體通常并非是固定不動的,動態(tài)的存在形式能夠給人們提供更好的便捷體驗。從目前來看,應(yīng)用于服務(wù)機器人的驅(qū)動形式主要有兩種:液壓驅(qū)動和電機驅(qū)動。在液壓驅(qū)動陣營中,最有代表性的當屬美國波士頓動力機器人公司研發(fā)的Atlas。2016年2月,工程師利用3D打印技術(shù)將液壓元件嵌入到了Atlas身體,通過液壓控制并采用力矩控制的算法,實現(xiàn)了雪地行走和摔倒爬起等動作,技術(shù)復雜但是非常成功;電機驅(qū)動陣營中,最有代表性的為本田公司的Asimo,其自2000年第一次亮相至今,經(jīng)過不斷發(fā)展已經(jīng)實現(xiàn)了基本的彎腰、握手、跳舞等功能,但是在控制精度和穩(wěn)定性方面仍然有待提高。雖然液壓驅(qū)動具有功/重比高、響應(yīng)速度快、逆驅(qū)性好等優(yōu)勢,但由于液壓驅(qū)動體積大、能效低、系統(tǒng)復雜等原因,盡管在軍事應(yīng)用方面前景較好,但是在家庭應(yīng)用領(lǐng)域,電機控制將是主流。Atlas與Asimo機器人如圖6-19所示。從移動形式角度來看,可將服務(wù)機器人細分為兩種:滾動行進式和步態(tài)行走式。滾動行進式即機器人與地面接觸的為輪子或履帶,且這種接觸是持續(xù)性的;步態(tài)行走式即機器人與地面相對運動的完成主要依靠機器人肢體部分有規(guī)律地間歇性擺動,機器人與地面的接觸點是離散的,一般不具規(guī)律性。鑒于自身運動特性限制,滾動行進式服務(wù)機器人的移動驅(qū)動多采用電機,被驅(qū)動滾動體多采用麥克納姆輪,不僅成本低而且移動更為靈活,缺點是無法在非結(jié)構(gòu)環(huán)境中使用;步態(tài)行走式服務(wù)機器人一般采用關(guān)節(jié)驅(qū)動,即作動器直接與關(guān)節(jié)同軸安裝,或?qū)Ⅱ?qū)動不同關(guān)節(jié)的作動器集中安裝在某一關(guān)節(jié)處。相比于滾動行進式,步態(tài)行走式的驅(qū)動形式除了電機與液壓缸之外,還有一種較為常用的作動器——舵機,因其體積精巧、扭矩合適,故非常適用于服務(wù)機器人的關(guān)節(jié)驅(qū)動。典型帶有舵機驅(qū)動的機器人包括國外的Nao機器人、Asimo機器人,國內(nèi)的優(yōu)必選等。舵機是步態(tài)服務(wù)機器人的核心部件,也叫伺服電機,包含了電機、傳感器和控制器,是一個簡單而完整的伺服電機系統(tǒng),最早用于船舶以實現(xiàn)其轉(zhuǎn)向功能。由于舵機可以通過程序連續(xù)控制其轉(zhuǎn)角,得到比較精準的位置、速度或力矩輸出,因而廣泛用于機器人各類關(guān)節(jié)運動中。但由于步態(tài)機器人自由度眾多,因此步態(tài)機器人的舵機價格相對比較敏感。服務(wù)機器人用舵機如圖6-21所示。2.服務(wù)機器人常用運動控制算法在運動控制上,服務(wù)機器人主要涉及定位導航和平衡性兩方面。在定位導航方面,服務(wù)機器人需要完成定位、建圖和路徑規(guī)劃。在平衡性方面,縱觀市面上的服務(wù)機器人,九成以上都是輪式或履帶式,足式機器人相當少見。相比于足式,輪式和履帶式底盤的確具有更強的穩(wěn)定性、可靠性和耐用性,從當前市場來看,這兩種底盤是最適宜的選擇。然而,從長遠的角度來講,足式機器人才是未來趨勢。輪式和履帶式底盤將服務(wù)機器人的運動范圍局限在了平地和一點點坡度的地面,而在未來,服務(wù)機器人的服務(wù)范圍必將擴大,行走環(huán)境也將變得多樣化,比如樓梯,因而其底盤也必須得到改變。服務(wù)機器人如需完成一種確定的運動或工作,一般需經(jīng)歷兩個過程:規(guī)劃與執(zhí)行。其中在規(guī)劃階段根據(jù)目的與方法的不同又可細分為運動規(guī)劃、路徑規(guī)劃和軌跡規(guī)劃。(1)運動規(guī)劃(Motionplanning)。運動規(guī)劃是指在給定的位置A與位置B之間為機器人找到一條符合約束條件的路徑,包括行進的路徑以及行進的方式。運動規(guī)劃通常又稱運動插補,插補就是按給定曲線生成相應(yīng)逼近軌跡的方法,其實質(zhì)是對給定曲線進行“數(shù)據(jù)點的密化”。常用的運動規(guī)劃方法有逐點比較插補法、時間分割法。(2)路徑規(guī)劃(Pathplanning)。連接起點位置和終點位置的序列點或曲線稱為路徑,構(gòu)成路徑的策略稱為路徑規(guī)劃,其目標是使路徑與障礙物的距離盡量遠,同時使路徑的長度盡量短。路徑規(guī)劃只有幾何屬性,與時間無關(guān),只關(guān)心位置,通常應(yīng)用在任務(wù)層級的規(guī)劃或者平面移動機器人的運動規(guī)劃中。(3)軌跡規(guī)劃(Trajectoryplanning)。軌跡規(guī)劃是指規(guī)劃機器人執(zhí)行運動時的速度及加速度,即在路徑規(guī)劃的基礎(chǔ)上加入時間序列信息,對機器人執(zhí)行任務(wù)時的速度與加速度進行規(guī)劃,目的是使軌跡曲線更加平順或使運動速度可控等。軌跡規(guī)劃具有時間屬性,每個時刻對應(yīng)有位置、速度、加速度等屬性,兩點之間還要涉及速度、加速度插值,常用算法包括梯形速度曲線等底層的軌跡插值算法。不管是運動規(guī)劃、路徑規(guī)劃還是軌跡規(guī)劃,三者都離不開環(huán)境交互系統(tǒng)的檢測信息引導。執(zhí)行,即基于機器人自身各種運動檢測傳感器及與環(huán)境交互傳感信息的反饋,有序地通過本體的協(xié)調(diào)控制完成在線或是離線規(guī)劃的運動任務(wù)。機器人作為一種復雜的自動化系統(tǒng),其自身具有非線性、強耦合、多變量時變等特性,高速運動時各關(guān)節(jié)慣量變化較大、耦合強烈,低速時摩擦、飽和等非線性效應(yīng)明顯,這都給機器人的穩(wěn)定運動控制帶來了極大的挑戰(zhàn)。根據(jù)是否考慮機器人的動態(tài)特性,控制算法可分為無模型控制算法和基于模型控制算法兩類。在無模型控制算法中,PID(ProportionalIntegralDerivative)控制是應(yīng)用最廣的也是最經(jīng)典的控制算法之一,被廣泛應(yīng)用于各類機器人的控制當中。但PID控制通常針對定常系統(tǒng),控制參數(shù)的保守限制了增益帶寬,導致存在較大的時滯誤差,難以滿足機器人系統(tǒng)的非線性時變需求,因此現(xiàn)在較常用的很多都是基于PID的改進控制算法,例如非線性PID、模糊PID、滑膜PID以及神經(jīng)網(wǎng)絡(luò)PID等。為了更為貼合機器人的分線性要求,近年來各種適用于非線性強耦合系統(tǒng)的控制算法被相繼提出,其控制效果也在包括服務(wù)機器人在內(nèi)的各類機器人上得到了很好的驗證,例如自抗擾控制、魯棒控制和自適應(yīng)控制等。3.補充知識點1)自抗擾控制自抗擾控制由我國學者韓京清提出,并由后續(xù)眾多學者不斷進行完善,其核心思想在于:如果擾動可以被精確地估計及補償,則被控對象理論上可看成是無干擾模型,便可使用簡單的控制方法輕松實現(xiàn)其運動控制。自抗擾控制由跟蹤微分器(TD)、擴張狀態(tài)觀測器(ESO)和非線性反饋三部分組成。由于自抗擾控制器結(jié)構(gòu)簡單、計算效率高、抵抗不確定外界擾動能量強,因此自抗擾控制是一種使用性很強的控制算法。2)自適應(yīng)控制自適應(yīng)控制是指通過測量被控對象狀態(tài)和軌跡跟蹤誤差等信息,實時掌握受控對象的不確定性,用來更新主控制結(jié)構(gòu)參數(shù),以提高控制性能。自適應(yīng)控制是一種帶參在線實時評估系統(tǒng),其本質(zhì)是從閉環(huán)誤差反饋模型中提取系統(tǒng)狀態(tài)信息,通過自適應(yīng)算法調(diào)節(jié)控制器參數(shù),以實現(xiàn)對系統(tǒng)的實時補償。缺點在于系統(tǒng)參數(shù)在線識別計算量大,難以保證高速應(yīng)用中的控制實時性。此外,受控模型突變或外界擾動較大時,預估系統(tǒng)參數(shù)無法收斂于真實值,系統(tǒng)穩(wěn)定性保障困難。自適應(yīng)控制算法結(jié)構(gòu)多樣且復雜,包括了自適應(yīng)迭代控制、自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制、全狀態(tài)模糊自適應(yīng)反饋控制、切換學習PI控制、基于多層神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制等。3)基于動力學模型的控制方法近年來,基于動力學模型的控制方法越來越受到重視,并被認為是能提高機器人動態(tài)特性和跟蹤精度最為有效的方法。通常,基于模型控制的方案有兩種:一種是機器人模型動態(tài)補償控制,另一種是機器人動力學模型前饋控制。模型動態(tài)補償控制算法實際是在系統(tǒng)內(nèi)控制回路中引入了一個模型動態(tài)補償控制器,目的是根據(jù)機器人動力學實際特性對動態(tài)變化進行補償,使得經(jīng)內(nèi)控制回路作用后的機器人系統(tǒng)可以簡化為一個易控系統(tǒng)。如果機器人的動力學模型足夠精確,通過反饋補償這種方式,能較好地解決非線性時變問題,同時提高控制器的動態(tài)響應(yīng)和對軌跡跟蹤的控制性能。模型動態(tài)補償控制包括連續(xù)有限時間控制、自適應(yīng)魯棒控制、滑膜變結(jié)構(gòu)控制等。但這種方式也存在諸多難點:(1)多數(shù)機器人的動力學模型復雜,參數(shù)隨位姿時變,且存在強耦合,導致精確獲取動力學參數(shù)困難。(2)多數(shù)方法需要實時計算機器人動力學參數(shù),存在計算復雜等問題,且復雜計算難以滿足高帶寬力矩環(huán)控制要求。(3)計算控制律時,需要實時獲取關(guān)節(jié)的加速度信息,加速度一般由速度差分而來,這便使得加速度信號帶有大量噪聲,嚴重影響控制性能。4)基于動力學前饋的控制方法基于動力學前饋的控制方法主要由前饋通道和反饋通道組成。前饋通道主要用于機器人動力學特性的補償,反饋通道用于解決系統(tǒng)不確定性擾動的問題。與模型動態(tài)補償控制不同的是,動力學模型前饋控制輸入為關(guān)節(jié)期望運動指令,在信號品質(zhì)上遠高于實際采用值;另外,雖然動力學模型前饋控制計算復雜度高,但可通過預存儲或設(shè)置背景程序來解決動力學前饋實時性問題,有利于控制算法的具體實施。因此,機器人動力學前饋控制技術(shù)成為當前工業(yè)上實現(xiàn)機器人高品質(zhì)運動性能的核心技術(shù)之一。6.4.5其他關(guān)鍵技術(shù)模塊1.智能芯片技術(shù)芯片是指內(nèi)含集成電路的硅片,是機器人的大腦。芯片包括通用芯片和專用芯片,通用芯片不限使用領(lǐng)域,而專用芯片一般專門為服務(wù)機器人定制。通用芯片向深度神經(jīng)網(wǎng)絡(luò)方向發(fā)展如火如荼。傳統(tǒng)的CPU是計算機的核心,在圖形處理和深度神經(jīng)網(wǎng)絡(luò)的計算上,GPU表現(xiàn)出更強的性能,而2015年Intel收購Altera的主要產(chǎn)品FPGA使現(xiàn)場可編程門陣列性能更加優(yōu)異。中端FPGA能夠?qū)崿F(xiàn)375GFLOPS的性能,功耗僅為10~20W,與CPU和GPU相比,F(xiàn)PGA在深度神經(jīng)網(wǎng)絡(luò)(DNN)預測系統(tǒng)中的性能更加出色。DNN系統(tǒng)用于語言識別、圖像搜索、OCR、面部識別、網(wǎng)頁搜索以及自然語言處理等。相同功率時,在32線程下,F(xiàn)PGA的速度/功耗比約為CPU的42倍,約為GPU的25倍。專用芯片以智能算法和仿生兩條主線并行。專用芯片又稱為“人工智能芯片”“神經(jīng)網(wǎng)絡(luò)芯片”等,目前專用芯片有兩種思路:以智能算法為主線和以仿生為主線,兩者的典型代表分別為寒武紀1號、IBMTureNorth。寒武紀1號的主頻可以達到0.98GHz,處理速度相當于同等面積下CPU的100倍。即便與最先進的GPU相比,寒武紀1號的人工神經(jīng)網(wǎng)絡(luò)處理速度也不落下風,而其面積和功耗遠低于GPU的1/100。IBMTrueNorth在復雜性和使用性方面取得了突破:4096個內(nèi)核,100萬個“神經(jīng)元”、2.56億個“突觸”集成在直徑只有幾厘米的芯片上,能耗不到70mW。通用芯片與專用芯片對比如表6-4所示。對于機器人來說,由于涉及深度神經(jīng)網(wǎng)絡(luò),故在計算量上將會更大。通用芯片中GPU和FPGA在解決這個問題上優(yōu)于傳統(tǒng)CPU,且擴展性和移植性較好,但是軟件復雜度較高,開發(fā)周期較長。相比之下,專用芯片能實現(xiàn)更高的效率和更低的功耗,但是目前整體處于研發(fā)階段,根據(jù)目前的資料,雖然其擴展性和軟件移植性不如通用芯片,但是軟件復雜度和開發(fā)周期優(yōu)于通用芯片。兩種芯片各有千秋,未來預計會呈現(xiàn)二者并存的局面。2.操作系統(tǒng)全球機器人主流操作系統(tǒng)是安卓和ROS,兩者均基于Linux內(nèi)核。安卓由Google公司開發(fā),在商用領(lǐng)域有廣泛應(yīng)用,占據(jù)智能手機和平板電腦的絕大部分市場份額。實現(xiàn)了手機平臺的爆發(fā)后,安卓又被廣泛用在不同設(shè)備上。鑒于安卓開源和定制化的特性,在手機上得到廣泛應(yīng)用后,在電子書、智能電視、智能機器人、智能眼鏡、智能手表、智能耳機等領(lǐng)域,安卓不斷地攻城略地,截至2015年底,安卓被用在24093種不同的設(shè)備上,比上年增長了28%。ROS系統(tǒng)2007年誕生于斯坦福人工智能實驗室,當時是為了支持一個名為STAIR的項目,在項目之初,機器人平臺集合了所有的AI方法,包括機器學習、視覺、導航、計劃、推理、語音和語言處理。2008年到2013年,WillowGarage與超過20家研究機構(gòu)的工程師一起合作開發(fā)ROS系統(tǒng)。2013年2月,ROS的管理工作轉(zhuǎn)移到OpenSourceRoboticsFoundation。2013年8月,WillowGarage公司被它的創(chuàng)立者轉(zhuǎn)為另一家創(chuàng)立者成立的公司SuitableTechnologies的子公司,WillowGarage對PR2的支持工作隨后交給了ClearpathRobotics。2010年至今,搭載ROS系統(tǒng)的機器人類型數(shù)從0起步增加至目前的106種,應(yīng)用主要偏向于工業(yè)機器人和工業(yè)控制領(lǐng)域,以移動機器人和智能交互機器人為主,包括著名的Pepper和NAO。目前已經(jīng)有很多機器人公司采用了ROS系統(tǒng)來開發(fā)一些應(yīng)用于全新市場的產(chǎn)品,如ClearPath、Rethink、Unbounded、Neurala、BlueRiver等,最典型的就是WillowGarage的PR2機器人。幾種機器人操作系統(tǒng)對比如表6-5所示。國產(chǎn)操作系統(tǒng)也在孕育發(fā)展。TuringOS是中國首批人工智能級可商用的機器人操作系統(tǒng)之一,是具備情感和思維能力的機器人操作系統(tǒng),商業(yè)應(yīng)用前景廣闊。TuringOS擁有情感、思維、自學習三大引擎,情感計算引擎已支持25種語言類情感識別,識別準確率達95.1%,而在情感表達方面,TuringOS支持468類情感語言表達,88套表情動作表達組合,120種聲音語調(diào),能夠讓機器人模擬人類80%的情感表達模式。據(jù)圖靈機器人后臺數(shù)據(jù)顯示,在近一年時間內(nèi)其與超過13萬的合作伙伴和開發(fā)者達成長期合作,共享知識庫達到15億項,應(yīng)用領(lǐng)域累計覆蓋用戶超過3億人次,進而每天可收集和積累億級的用戶大數(shù)據(jù),在中文語言處理方面處于領(lǐng)先地位。3.仿生材料與結(jié)構(gòu)自然界中生物經(jīng)過億萬年長期進化,其結(jié)構(gòu)與功能已達到近乎完美的程度,實現(xiàn)了機構(gòu)與功能,局部與整體的協(xié)調(diào)和統(tǒng)一。服務(wù)機器人作為機器人的一個重要分支,從仿生學角度出發(fā),吸收借鑒生物系統(tǒng)的結(jié)構(gòu)、性狀、原理、行為以及相互作用,能夠為機器人的功能實現(xiàn)提供必要的技術(shù)支撐,其中仿生皮膚、人工肌肉及結(jié)構(gòu)驅(qū)動一體化設(shè)計是當前及未來服務(wù)機器人發(fā)展的重要課題。當然,仿生材料與機構(gòu)能夠為未來機器人實現(xiàn)多功能高效率發(fā)展提供必要的技術(shù)儲備。一個很重要的問題是,必須具備相應(yīng)的光機電微納加工工藝及傳感驅(qū)動執(zhí)行一體化設(shè)計能力,這對于仿生結(jié)構(gòu)材料的未來應(yīng)用至關(guān)重要。4.模塊化自重構(gòu)模塊化自重構(gòu)機器人通過對多個單一的模塊化智能單元進行可變構(gòu)形設(shè)計、運動規(guī)劃及控制,以達到提升機器人運動能力、負載能力及對環(huán)境適應(yīng)能力的效果。自重構(gòu)機器人的核心問題主要體現(xiàn)在模塊的幾何拓撲分布及相應(yīng)的整體剛度。從自重構(gòu)機器人發(fā)展的初衷來看,未來自重構(gòu)機器人面臨著大規(guī)模機載并行計算及結(jié)構(gòu)化或是非結(jié)構(gòu)化環(huán)境下長時間完全自主能力實現(xiàn)的挑戰(zhàn)。5.納米系統(tǒng)服務(wù)機器人的一個重要應(yīng)用是希望其能夠在狹小空間里開展探測或是執(zhí)行任務(wù)。目前,微納型醫(yī)療機器人及軍用偵察機器人正成為服務(wù)機器人研究的一個熱點,而其核心技術(shù)在于創(chuàng)新并集成多功能低功耗傳感及驅(qū)動模塊。6.5服務(wù)機器人的發(fā)展趨勢與展望在世界范圍內(nèi),機器人技術(shù)屬于戰(zhàn)略高技術(shù),除了國防軍事、智能制造裝備、資源開發(fā)以外,美國、日本、歐洲等國家和地區(qū)對于發(fā)展未來服務(wù)機器

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論