標題:清華星動紀元開源首個AIGC機器人大模型引領AI新潮流
隨著人工智能技術的飛速發(fā)展,我們正處在一個前所未有的時代。清華星動紀元開源首個AIGC機器人大模型VPP入選ICML2025 Spotlight,無疑是這個領域的一大亮點。VPP的開源,不僅為學術界和產(chǎn)業(yè)界提供了寶貴的資源,也為機器人技術的發(fā)展開辟了新的道路。
首先,VPP的成功開發(fā),得益于清華大學叉院的ISRLab和星動紀元合作開發(fā)的創(chuàng)新性思路。VPP利用了大量互聯(lián)網(wǎng)視頻數(shù)據(jù)進行訓練,直接學習人類動作,減輕了對于高質(zhì)量機器人真機數(shù)據(jù)的依賴。這種創(chuàng)新的做法,不僅降低了數(shù)據(jù)獲取的難度,也使得機器人的學習過程更加高效。
VPP模型的成功,也得益于其強大的泛化能力。它將視頻擴散模型的泛化能力轉移到了通用機器人操作策略中,解決了diffusion推理速度的問題,讓機器人實時進行未來預測和動作執(zhí)行。這種創(chuàng)新性的技術,大大提升了機器人策略泛化性,使得機器人能夠更好地適應不同的環(huán)境和任務。
更值得一提的是,VPP模型的成功,也離不開其跨本體學習的優(yōu)勢。VPP能夠直接學習各種形態(tài)機器人的視頻數(shù)據(jù),不存在維度不同的問題。這種跨本體學習的模式,不僅拓寬了機器人的學習范圍,也提高了機器人的泛化能力。
在基準測試中,VPP也展現(xiàn)出了卓越的性能。在Calvin ABC-D基準測試中,VPP實現(xiàn)了4.33的任務完成平均長度,已經(jīng)接近任務的滿分5.0。相較于先前技術,VPP實現(xiàn)了41.5%的提升。這樣的表現(xiàn),無疑證明了VPP的優(yōu)越性和先進性。
而在真實世界的測試中,VPP模型也展現(xiàn)出了良好的多任務學習能力和泛化能力。在星動紀元單臂+仿人五指靈巧手靈巧手XHAND平臺,VPP能夠完成100+種復雜靈巧操作任務,例如抓取、放置、堆疊、倒水、工具使用等,在雙臂人形機器人平臺能完成50+種復雜靈巧操作任務。這樣的能力,無疑讓人對未來的人形機器人應用充滿了期待。
此外,VPP模型的預測視覺表示在一定程度上是可解釋的,這使得開發(fā)者在不通過real-world測試情況下,能夠通過預測的視頻來提前發(fā)現(xiàn)失敗的場景和任務,進行針對性的調(diào)試和優(yōu)化。這種可解釋性的特點,無疑增強了VPP的透明度和可控性,也為機器人的調(diào)試和優(yōu)化提供了新的可能。
總的來說,清華星動紀元開源首個AIGC機器人大模型VPP的成功,是人工智能領域的一次重大突破。它的開源,不僅為學術界和產(chǎn)業(yè)界提供了寶貴的資源,也為機器人技術的發(fā)展開辟了新的道路。我們期待著,VPP以及更多類似的技術,能夠引領人工智能的新潮流,推動機器人技術的進一步發(fā)展。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )