下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
精品文檔-下載后可編輯D掃描世界蓄勢待發(fā)當(dāng)年微軟開發(fā)Kinect3D傳感器的時候,其中一個關(guān)鍵性的任務(wù)就是校準(zhǔn)算法,以便迅速、準(zhǔn)確地識別人體各部位,尤其是手部,以確保Kinect適用于任何家庭環(huán)境,任何年齡的人群,任何穿著和任何背景物。使用基于計算機的方法做校準(zhǔn)具有其局限性,原因在于在Kinect生成的圖像中電腦可能無法識別手部,或錯誤地識別了手部的存在。因此,微軟此前宣布要向全人類求助,借助亞馬遜的土耳其機器人完成圖像標(biāo)記識別。這是一個在線的服務(wù),公眾通過執(zhí)行簡單但計算機不擅長的任務(wù)而獲得報酬。結(jié)果,Kinect現(xiàn)在能識別所有(或大多數(shù))樣子的手。這實在太棒了!
當(dāng)然,如果你唯一關(guān)心的只是基于手部動作的游戲,你會認(rèn)為這是一個天大的好消息,但是從商業(yè)機器人角度看,手部只是我們需要機器識別的成千上萬的“東西”之一。試想一下,如果一個機器人能迅速地識別家里、辦公室或工廠里的任何對象:機器人看到或接觸的任何東西都能被馬上識別出來。這才是個真正偉大的進步。
所以問題是:我們能不能實現(xiàn)這一目標(biāo)?我們可以用某種方式自動識別或依靠公眾識別一切潛在的對象嗎?
這種類型的數(shù)據(jù)收集涉及到一個先有雞還是先有蛋的問題:如果你有一個對象均被恰當(dāng)標(biāo)記的數(shù)據(jù)庫,基于存儲在數(shù)據(jù)庫的“知識系統(tǒng)”,你便可以開始構(gòu)建各類應(yīng)用程序,而這些應(yīng)用程序反過來又可以生成更多的數(shù)據(jù),讓你進一步完善數(shù)據(jù)庫的“知識系統(tǒng)”。問題是,你第一步需要一個數(shù)據(jù)庫!有時候,企業(yè)會認(rèn)為建立這套數(shù)據(jù)庫是很有價值的。比如Kinect之于微軟。另一個例子是谷歌的“語音指令”,通過語音讓系統(tǒng)執(zhí)行搜索、發(fā)電子郵件以及其他任務(wù)。每次你說出一個詞,你的Android手機就會問:“你的意思是……嗎?”然后提供一個字詞列表供你選擇想要表達的意思,在這個過程中,你幫助完善了谷歌得語音識別系統(tǒng)。隨著時間的推移,不同人講話模式的變化和細節(jié)都會作為語音數(shù)據(jù)被捕獲,使數(shù)據(jù)庫更貼近實際的語言使用習(xí)慣。沒有這種持續(xù)改進,語音到文本將永遠不會成為一個智能便利的應(yīng)用。
現(xiàn)在回到機器人技術(shù)的問題上。我認(rèn)為機器人研究團體應(yīng)更加關(guān)注數(shù)據(jù)的重要性。機器人技術(shù)涉及的很多東西都需要一個大規(guī)模的數(shù)據(jù)庫(需要強調(diào)大規(guī)模),以實現(xiàn)技術(shù)上的可行性(譬如對象識別),因此這項功能不能依賴純理論研究、機器人專家或算法,而必須掌握“切向技術(shù)”的市場趨勢,例如網(wǎng)絡(luò)或智能手機。因此,為了讓機器人技術(shù)能有實現(xiàn)的一天,我們需要關(guān)注具有收集海量數(shù)據(jù)能力的技術(shù),為了機器人技術(shù)以外的需求,也為了在技術(shù)成熟的時候把它應(yīng)用在機器人技術(shù)上。
其實,我們最需要的數(shù)據(jù)類型是3D數(shù)據(jù)。那么,我們該如何收集每一個潛在對象的3D數(shù)據(jù)呢?幸運的是,一個大規(guī)模的關(guān)于Kinect感應(yīng)器的駭客社區(qū),以及像MatterPort這樣的創(chuàng)業(yè)公司正在實現(xiàn)快速3D渲染技術(shù),只需要使用Kinect從幾個角度拍攝對象不同的圖像就可以實現(xiàn)。這項技術(shù)現(xiàn)在還不成熟,不過隨著傳感器和算法的改進,你能預(yù)見用3D技術(shù)再現(xiàn)一個場景就會像拍一張照片般容易。其他能夠同時補抓光的強度和角度、允許用戶在已經(jīng)拍好的照片重新調(diào)焦的技術(shù),如Lytro和其他“計算機攝像頭”,同樣可以實現(xiàn)3D圖像的生成。
正如我在上文提到,機器人專家不可能單獨完成所有的3D掃描。我們希望其他技術(shù)能推動這一趨勢的發(fā)展。因此,這里是一個想法。如果在線零售商看到通過展示商品細致3D模型帶動銷售的商業(yè)價值(而不是過去我們在網(wǎng)站看到的二維圖像),并為圖像標(biāo)記諸如顏色、重量、功能的描述,那么成千上萬的物品原則上都能被機器搜索。Google在2022年的IEEE機器人與仿生學(xué)國際會議上提出過一個相似的想法,并在去年五月的GoogleI/O開發(fā)者大會重申了這個見解。也許不僅網(wǎng)絡(luò)零售商能供應(yīng)3D掃描,消費者也可以,只要他們意識到在eBay上傳3D圖像進行銷售是更有效的生財之道。
如果這種情況成為現(xiàn)實,那么所有的3D圖像將可以聚合成一個的數(shù)據(jù)庫,讓機器人可以便捷地使用它作為參考。一個機器人將收集眼前一個物體的3D傳感數(shù)據(jù),然后與參考圖像進行匹配。隨著時間的推移和反饋數(shù)據(jù)(譬如“是的,羅西,這是一個盤子”)的累積,機器人的目標(biāo)識別能力將不斷提高。
所以,如果你想要更智能的機器人,你應(yīng)該開始要求
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年普通整流管芯片項目可行性研究報告
- 2025至2031年中國帶棚架松式絡(luò)筒機行業(yè)投資前景及策略咨詢研究報告
- 2025年室內(nèi)型電子顯示屏幕項目可行性研究報告
- 2025年噸包裝機項目可行性研究報告
- 2025至2031年中國丁維鈣粉行業(yè)投資前景及策略咨詢研究報告
- 2025年三氯乙基磷酸酯項目可行性研究報告
- 2025至2030年香水木大雙龍船項目投資價值分析報告
- 2025至2030年中國鋁條插角件數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年線性增壓內(nèi)壓力試驗機項目投資價值分析報告
- 2025至2030年環(huán)氧樹脂地坪面層涂料項目投資價值分析報告
- 2024-2025學(xué)年深圳市南山區(qū)六年級數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)水平測試試題含解析
- 2024-2030年中國免疫細胞存儲行業(yè)市場發(fā)展分析及競爭形勢與投資戰(zhàn)略研究報告
- 工貿(mào)行業(yè)企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化建設(shè)實施指南
- 機械基礎(chǔ)(少學(xué)時)(第三版) 課件全套 第0-15章 緒論、帶傳動-氣壓傳動
- T-CACM 1560.6-2023 中醫(yī)養(yǎng)生保健服務(wù)(非醫(yī)療)技術(shù)操作規(guī)范穴位貼敷
- 07J912-1變配電所建筑構(gòu)造
- 鋰離子電池串并聯(lián)成組優(yōu)化研究
- 人教版小學(xué)數(shù)學(xué)一年級下冊第1-4單元教材分析
- JTS-215-2018碼頭結(jié)構(gòu)施工規(guī)范
- 大酒店風(fēng)險分級管控和隱患排查治理雙體系文件
- 財務(wù)實習(xí)生合同
評論
0/150
提交評論