當(dāng)?shù)貢r間3月18日,在美國圣何塞舉行的英偉達(dá)GTC人工智能大會上,英偉達(dá)發(fā)布了人形機器人通用基礎(chǔ)模型Project GR00T,這一平臺是對英偉達(dá)Isaac 機器人平臺的重大升級。
為了幫助機器人更好地感知所處環(huán)境,英偉達(dá)還發(fā)布了 Isaac Perceptor 軟件開發(fā)工具包,該工具包具有最先進的多攝像頭視覺里程計、3D 重建和占用地圖,以及深度感知功能。
▲ 黃仁勛介紹迪士尼的小型機器人,其透露,這兩款機器人正是在Isaac“健身房”中學(xué)會了走路。
GR00T驅(qū)動的機器人(代表通用機器人00技術(shù))將能夠理解自然語言,并通過觀察人類行為來模仿動作——快速學(xué)習(xí)協(xié)調(diào)、靈活性和其它技能,以便導(dǎo)航、適應(yīng)現(xiàn)實世界并與之互動。在GTC大會的主題演講中,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛展示了數(shù)臺這樣的機器人是如何完成各種任務(wù)的。
黃仁勛表示:“開發(fā)通用人形機器人基礎(chǔ)模型是當(dāng)今AI領(lǐng)域中最令人興奮的課題之一。世界各地的機器人技術(shù)領(lǐng)導(dǎo)者正在匯集各種賦能技術(shù),致力于在人工通用機器人領(lǐng)域?qū)崿F(xiàn)突破。”
同時,為了支持Project GR00T,英偉達(dá)還推出了一款用于人形機器人的新型計算平臺 Jetson Thor,它基于英偉達(dá) Thor 系統(tǒng)級芯片,采用了英偉達(dá)Blackwell 架構(gòu),可提供每秒 800 萬億次8位浮點運算 AI 性能,以運行 GR00T等多模態(tài)生成式 AI 模型。
好,到這里,大家可能還是沒看懂這個Project GR00T是干嘛的,那我們來給大家舉個例子。
舉例對象:loona娛樂教育機器人(戳視頻↓)
就拿視頻里的這個loona機器人來說,如大家所見,現(xiàn)在想和它互動是需要下達(dá)明確的指令的(可語音對話也可APP直接點擊下達(dá)),也就是說,在指令范圍內(nèi)有的內(nèi)容就可操作,再進一步說,也就是loona能做什么是由loona“自己決定的”。
而Project GR00T這個平臺要做的是讓機器人“擁有一個更聰明的大腦”。按照英偉達(dá)的說法,Project GR00T里會有無數(shù)還原現(xiàn)實的虛擬場景,比如家庭住宅、工廠、商場等不同的空間環(huán)境,而loona最大的使用場景大概率會出現(xiàn)在家庭住宅。
為了讓loona在實際應(yīng)用環(huán)境中能第一時間匹配不同的住宅戶型,我們可以把loona的3D模型放到平臺里提前學(xué)習(xí)所有可能會出現(xiàn)的戶型,比如有落地窗和無落地窗,有門檻和無門檻,家里有否嬰兒、有否寵物等各種可能會出現(xiàn)的住家差異。在進行過這一學(xué)習(xí)過程之后,再將這個學(xué)習(xí)好的模型植入到loona的芯片也就是腦子里,這樣loona在出廠時就已經(jīng)具備了適配市面上大多數(shù)可能會出現(xiàn)的家庭住宅差異。
這樣做的好處是什么呢?
當(dāng)你拿到這個經(jīng)過仿真模擬訓(xùn)練過程的loona,就會發(fā)現(xiàn),它來到你家里之后,不再需要你再去“教”,它識別到馬桶就知道是浴室,識別到操作臺就知道是廚房,再進一步,如果有剛會走路的小嬰兒向它走來,它也會知道不能停留在小嬰兒腳下,以免被絆倒,簡單來說,它不需要人為設(shè)置,便清晰地知道在這個家哪些是它的“行動禁區(qū)”。
再舉個具體的例子,還是用loona來看,loona帶有監(jiān)控功能,在開啟活潑模式的狀態(tài)下,它會自己滿屋子溜達(dá),也就是說,如果此時的loona打開監(jiān)控的話,就會將所有經(jīng)過的場景拍下。
這時候,如果家里有女士穿裙子或其他人在換衣服、洗浴,隱私安全就不被保證了。
而如果loona在Project GR00T這樣的平臺學(xué)習(xí)過的話,它在出廠進入家庭后,就能避免出現(xiàn)這樣的情況,因為它已經(jīng)被提前告知,什么樣的場景下它是需要回避或遠(yuǎn)離的。
到這里,大家應(yīng)該能明白Project GR00T是干嘛的了,那有人可能會疑惑,以上所說的這種“學(xué)習(xí)”現(xiàn)在不能實現(xiàn)嗎?
可以實現(xiàn),但非常繁雜且費成本。就比如戶型住宅來說,如果在現(xiàn)實生活中,想讓機器人學(xué)習(xí)到大部分的戶型,那就意味著,需要不停重復(fù)布景,因為不可能帶著機器人實際到各個家庭中去。
這個過程,耗時耗人耗錢,而且布景所使用的物料,不一定是會重復(fù)使用的,但是在數(shù)字世界里,也就是Project GR00T這樣的平臺里,是不需要考慮的,可以理解為,機器學(xué)習(xí)想要的訓(xùn)練場景未來都可以在Project GR00T被滿足。
當(dāng)然要想實現(xiàn)Project GR00T的未來,也需要擁有足夠龐大的用戶群體去支撐平臺的運營,這可能會是一個漫長的過程,就像以設(shè)計智核芯片組為主的英偉達(dá)公司用了8年才等到了AI 的爆發(fā)。
資料來源 | 紅星新聞、中關(guān)村在線、澎湃新聞 ? 未來2%、每日經(jīng)濟新聞