鞭牛士報(bào)道 隨著機(jī)器人技術(shù)的不斷演進(jìn),在經(jīng)歷過程序控制機(jī)器人、自適應(yīng)機(jī)器人、智能機(jī)器人三代明顯的進(jìn)化過程后,機(jī)器人發(fā)展的整體方向和路徑也呈現(xiàn)出了明確的態(tài)勢,從“自動(dòng)化”向“智能化”的演進(jìn)成為必然的要求。
(相關(guān)資料圖)
眾所周知,作為人工智能多項(xiàng)技術(shù)和智慧的“集合體”,機(jī)器人幾乎可以代表了當(dāng)下人工智能技術(shù)的“最高成就”。近來,隨著ChatGPT等大語音模型等人工智能應(yīng)用的持續(xù)火熱,AI大模型受到了行業(yè)內(nèi)外空前的關(guān)注度,那么AI大模型+人形機(jī)器人會(huì)帶來怎樣的效果呢。
行業(yè)相關(guān)專家認(rèn)為,人形機(jī)器人作為人工智能的物理載體,相當(dāng)于為AI大模型打造的物理的身體,從這個(gè)角度來看,人形機(jī)器人起到了打破虛擬與現(xiàn)實(shí)之間邊界的效果;此外,人形機(jī)器人還將持續(xù)拓展AI大模型的“實(shí)操”度,提升人工智能的“智能系數(shù)”。
人形機(jī)器人與人工智能 日漸共生、相互促進(jìn)
相較于工業(yè)機(jī)器人,人形機(jī)器人硬件要求更為復(fù)雜和多元,例如特斯拉采用的電驅(qū)方案具備商業(yè)化的應(yīng)用基礎(chǔ),預(yù)計(jì)全身共40個(gè)執(zhí)行器;而機(jī)械手采用微型電機(jī)+腱繩驅(qū)動(dòng)傳動(dòng)結(jié)構(gòu),單手6個(gè)電機(jī),11個(gè)自由度,空心杯電機(jī)結(jié)構(gòu)緊湊、能量密度高、能耗低,和人形機(jī)器人機(jī)械手需求契合度高。
正是AI大模型與人形機(jī)器人的互相依賴和相互促進(jìn),讓整個(gè)人工智能技術(shù)邁出了通向通用人工智能的一大步——這也正是將機(jī)器人做成人形的終極考慮:為了使機(jī)器人的執(zhí)行能力更加通用。據(jù)了解,AI大模型將從語音、視覺、決策、控制等多方面實(shí)現(xiàn)同人形機(jī)器人的結(jié)合,形成感知、決策、控制閉環(huán),使機(jī)器人具備常識(shí)。
在語音層面,語言大模型為機(jī)器人的自主語音交互提供了解決方案,包括上下文理解、多語種識(shí)別、多輪對(duì)話、情緒識(shí)別、模糊語義識(shí)別等通用語言任務(wù)上,ChatGPT顯著由于深度學(xué)習(xí),表現(xiàn)出了不亞于人類的理解力和語言生成能力。
在視覺層面,通用視覺大模型的All in One 的多任務(wù)訓(xùn)練方案能使得機(jī)器人更好地適應(yīng)人類生活場景:大模型的強(qiáng)擬合能力使人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語義分割等任務(wù)時(shí),具備更高的精確度;通用視覺大模型通過大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知識(shí)完備性,提升場景泛化效果。
而在決策層面,基于多模態(tài)的預(yù)訓(xùn)練大模型將增強(qiáng)機(jī)器人可完成任務(wù)的多樣性與通用性,讓其不局限于文本和圖像等單個(gè)部分,而是多應(yīng)用相容,拓展單一智能為融合智能,使機(jī)器人能結(jié)合其感知到的多模態(tài)數(shù)據(jù)實(shí)現(xiàn)自動(dòng)化決策。
AI大模型強(qiáng)勢發(fā)力之下 人形機(jī)器人未來倍具想象空間
近日,英偉達(dá)創(chuàng)始人黃仁勛在2023年ITF世界大會(huì)上發(fā)表演講并提出,人工智能和加速計(jì)算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng),將“具身智能”的概念瞬間提升到了風(fēng)口浪尖。
所謂“具身智能”,則指在機(jī)器智能領(lǐng)域中,通過將智能算法與物理實(shí)體的感知、行動(dòng)和環(huán)境交互相結(jié)合,使機(jī)器能夠以更自然、更智能的方式與環(huán)境進(jìn)行交互和解決問題的能力。因此,也有不少行業(yè)內(nèi)外人士認(rèn)為,具身智能正是AI的終極形態(tài)。
在真實(shí)的物理環(huán)境下執(zhí)行任務(wù)、解決問題——人形機(jī)器人自誕生起,其實(shí)就正是具身智能的一種物理承載。換而言之,人形機(jī)器人的逐步完善也為具身智能的落地提供了方向,是具身智能的重要應(yīng)用場景,也將為具身智能的迭代優(yōu)化提供方向和空間。
從AI到人形機(jī)器人,再到具身智能,究竟帶動(dòng)了多大的市場和科研熱度呢?從專利數(shù)層面或可窺知一二。天眼查數(shù)據(jù)顯示,機(jī)器人專利保持穩(wěn)定增長,2022年申請(qǐng)專利2.3萬余項(xiàng);從類型上來看,發(fā)明專利與實(shí)用新型占比較高,兩者之和占總數(shù)的9成。
與此同時(shí),在AI大模型層面,單從“敲門磚”層面的自然語言處理領(lǐng)域來看,天眼查數(shù)據(jù)顯示,從近年來專利申請(qǐng)的數(shù)量來看,還是保持了較為穩(wěn)定快速的增長,自2018以來,其申請(qǐng)量的復(fù)合增長率達(dá)到61.2%;從類型上來看,發(fā)明專利占據(jù)絕對(duì)的領(lǐng)先地位,占比近98%。
逐年增長的研發(fā)熱情,為人形機(jī)器人和具身智能帶來了相當(dāng)充足的發(fā)展想象空間。
行業(yè)人士認(rèn)為,具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界,用擬人化的思維路徑去學(xué)習(xí),從而做出人類期待的行為反饋,而不是被動(dòng)的等待數(shù)據(jù)投喂;人形機(jī)器人提供了各種基于人類行為的學(xué)習(xí)和反饋系統(tǒng),為實(shí)現(xiàn)更復(fù)雜行為語義提供了迭代的基礎(chǔ)和試驗(yàn)場,因此,人形機(jī)器人或?qū)⒙氏瘸休d具身智能的能力。
誠然,在整個(gè)過程中,最重要的是AI的大腦,而AI的軀體從屬于智慧大腦,按照這樣的邏輯去打通人機(jī)之間的交互方式,讓AI能夠主動(dòng)感知物理世界,擬人化的思維路徑才能做到人類期待的行為反饋。而在當(dāng)下,機(jī)器人還遠(yuǎn)沒有人類期待的那般智能,但隨著人工智能技術(shù)的進(jìn)一步發(fā)展更迭,在AI大模型的持續(xù)加持之下,具身智能或?qū)⒁愿斓乃俣韧度胧袌?、走進(jìn)人們的生活。
標(biāo)簽:
鞭牛士報(bào)道 隨著機(jī)器人技術(shù)的不斷演進(jìn),在經(jīng)歷過程序控制機(jī)器人、
為加快推動(dòng)解決群眾“健身去哪兒”的難題,近日,體育總局辦公廳會(huì)...
2023年6月5日亞華電子融資凈償還29 68萬元,融資余額2879 38萬元
如何才能領(lǐng)到失業(yè)補(bǔ)助金?需要提交什么材料?條件是什么?隨社保網(wǎng)小編
立方風(fēng)控鳥& 183;早報(bào)(6月6日)
6月6日,生意社異丁醛基準(zhǔn)價(jià)為7166 67元 噸,與本月初(7533 33元 噸)相
來為大家解答以上的問題。植物大戰(zhàn)畺尸修改器,4399植物大戰(zhàn)畺尸無敵版
對(duì)于港股后市投資機(jī)會(huì),基金人士建議關(guān)注互聯(lián)網(wǎng)龍頭、“中特估”、...
家沒了!這是天津市津南區(qū)八里臺(tái)鎮(zhèn)碧桂園鳳錦庭院幾千名業(yè)主無法接受,
西媒:塞巴略斯預(yù)計(jì)留隊(duì),門迪、巴列霍、奧利奧被放入轉(zhuǎn)會(huì)市場,西媒,巴
1、答案如下:阿凡達(dá)取景處在袁家界,是張家界的核心景區(qū),景區(qū)內(nèi)有百
海通證券表示,對(duì)國內(nèi)經(jīng)濟(jì)復(fù)蘇和對(duì)海外流動(dòng)性寬松的敏感性是港股彈性的
6月5日,合景泰富集團(tuán)控股有限公司(簡稱“合景泰富”)發(fā)布2023年5...
格隆匯6月5日丨吉利汽車(00175 HK)發(fā)布公告,集團(tuán)于2023年5月的總銷量
在全國愛眼日來臨之際,6月5日,石家莊市第三十五中學(xué)組織高一、二部分
Access數(shù)據(jù)庫密碼破解Access數(shù)據(jù)庫是微軟公司出品的一款非常有用的工具
大家好,小石來為大家解答以上問題?!兜赖陆?jīng)》中的德是什么意思?,道
(記者 梁婷)湖北推動(dòng)聲環(huán)境功能區(qū)自動(dòng)監(jiān)測站點(diǎn)建設(shè)。目前,該省
表示聲音的abab成語,表示聲音的abab式詞語這個(gè)很多人還不知道,現(xiàn)在讓
現(xiàn)在商家想要開通抖音小店,需要上傳營業(yè)執(zhí)照,不然的話無法在抖音上帶
1、你好給你個(gè)簡單解決方法在電腦安裝打開《驅(qū)動(dòng)人生2012》點(diǎn)驅(qū)動(dòng)-驅(qū)動(dòng)
1、回眸的釋義:指回轉(zhuǎn)眼睛,回過頭看,向后看,轉(zhuǎn)頭看。2、拼音:huí
滯怎么讀,滯釋義很多人還不知道,現(xiàn)在讓我們一起來看看吧!1、拼音:z
福特汽車近期宣布將在美國市場召回142734輛林肯MKC汽車。福特表示,召
以下是拓新藥業(yè)在北京時(shí)間6月5日13:06分盤口異動(dòng)快照:6月5日,拓新藥
惠水縣氣象臺(tái)6月5日8時(shí)28分發(fā)布暴雨黃色預(yù)警信號(hào):預(yù)計(jì)未來6小時(shí)我縣崗
中國女排在4日的世界女排聯(lián)賽中以3:0戰(zhàn)勝東道主日本隊(duì),取得四連勝???/p>
北京平谷舉辦益谷高峰論壇助力食品營養(yǎng)產(chǎn)業(yè)高質(zhì)量發(fā)展人民網(wǎng)北京6月5日
2023年一季度針織行業(yè)經(jīng)濟(jì)運(yùn)行簡析:內(nèi)銷形勢逐步向好, 今年以來,
《塔瑞斯世界》是一款由PerfectWorldGames開發(fā)的3D大型多人在線互動(dòng)角
廣告
X 關(guān)閉
廣告
X 關(guān)閉