總會有這一天,但我們沒想到來的居然這么快。
北京時間 8 月 6 日晚,硅谷著名具身智能創業公司 Figure 正式發布了自己的新一代人形機器人 Figure 02。
除了樣子夠科幻,這種機器人也有著足夠通用的智能,它可以與人類實時對話,自動學習如何裝配零件。事實上,Figure 02 正在寶馬位于 Spartanburg 的工廠實習工作,我們仿佛已經進入了未來。
Figure 工程和設計團隊完成了對 Figure 02 硬件和軟件的徹底重新設計。在人工智能、視覺、電池、電子設備、傳感器和執行器等關鍵技術上均取得了重大進步。
具體來說,Figure 02 主要包括以下特點:
實時語音對話:Figure 02 能夠通過連接到定制?OpenAI?大模型的內置麥克風和揚聲器與人對話;
攝像頭:由 6 個 RGB?攝像頭驅動的 AI 視覺系統;
機械手:具有 16 個自由度和與人類同等力量的第四代機械手;
內置 VLM:支持機器人攝像頭進行快速常識性視覺推理;
大容量電池:機器人軀干中的 2.25 KWh 定制電池組可提供 50% 以上的電量;
CPU/GPU:與上一代相比,機載計算和 AI 推理能力提高了 3 倍。
01?
全面改進:
通用 + 人形 + 實用化
這回升級,最大的變化可能是 Figure 02 真的準備好回應語音指令了。
去年那支驚艷科技圈 demo 里,站在 Figure 01 前的人類向這位機器人提問:「可以拿點東西給我吃嗎?」它不僅識別出面前的物體是蘋果,它更懂得蘋果可以直接食用,于是它把蘋果遞給了面前的人,說道:「當然,拿去吃吧。」
今年 3 月,OpenAI 宣布與 Figure 合作開發具身智能,讓人形機器人擁有了實時有效的對話能力。背靠 OpenAI,Figure 能夠快速迭代機器人語音到語音的能力。Figure 表示,由于 Figure 02 的端側算力大幅提升,已經可以完全自主地在現實世界中執行各種任務。
在 Figure 02 上,機器人語音推理的實現主要得益于內置的麥克風和揚聲器連接到與 OpenAI 合作訓練的定制 AI 模型上。
Figure 02 的導航系統使用了 VLM(視覺語言模型),這使得機器人上的攝像頭能夠進行語義基礎研究和快速常識性視覺推理。VLM 是當前眾多造車新勢力正在研究的智能駕駛新方向,在機器人領域,這種方法顯然也可以在很多任務上實現突破性的效果。
續航能力可以說是人形機器人實用化面臨的最大挑戰之一。Figure 02 機器人軀干內定制有容量為 2.25 KWh 的電池組,可以比 Figure 01 多提供 50% 以上的能量,從而最大程度地延長機器人的運行時間。Figure AI 的創始人、CEO Brett Adcock 表示,他們希望 Figure 02 每天能夠實現約 20 小時以上的有效工作。
我們可以看到,Figure 02 的外觀變得更加具有整體性,這是因為它采用了全新的外骨骼結構。相比于 Figure 01,機器人的外形設計轉變較為徹底。另外它也采用了集成布線的設計。集成布線具有以下好處:
可靠性更高
隱藏電線?
更緊密的封裝?
從 Figure 01 到 Figure 02,外形上有很大改觀。
除了更好的布線,Figure 02 還設計了定制的電線端子和連接器,以提高機器人的可靠性。
為了能像人類一樣理解世界,Figure 02 通過多攝像頭 + AI 驅動的視覺系統來進行感知與推理。其在頭部、前軀干和后軀干共有 6 個板載 RGB 攝像頭,使得機器人具有超越人類的視覺能力。
最后還有靈巧的手指。Figure 02 搭載了第四代機械手,有 16 個自由度,并具有與人類相當的力量,可以勝任各種復雜任務,整個手包含了機械、電氣、控制和傳感器等技術。
Brett Adcock 表示,隨著機器人的不斷運行,AI 數據引擎將收集并整理數據用于訓練模型,不斷提升性能。
看到 Figure 02 這么精彩的亮相,讓人不禁想起了馬斯克家的擎天柱,兩者相比,不知道誰更勝一籌。
還有網友表示「Figure 02 預示著一個新時代的開始,這是目前世界上最先進的機器人,未來已來。」
02?
創業公司 Figure:
半個硅谷都在投
Figure 由 Brett Adcock 于 2022 年創立,是一家總部位于美國的機器人公司,專門開發人形機器人。該公司的目標是開發通用人形機器人,為人類帶來積極影響,為后代創造更美好的生活。
在生成式 AI 技術爆發后,很多以具身智能為目標的機器人公司不斷出現,而 Figure 在其中顯得尤為亮眼。2023 年 3 月,Figure 走出隱身模式,推出了原型機器人 Figure 01,其外觀和動作都與人類相似。這是一款專為體力勞動設計的雙足機器人,最初針對的是物流和倉儲行業。
2023 年 5 月,該公司從 Parkway Venture Capital 領投的投資者手中籌集了 7000 萬美元。
同年 10 月,Figure 放出 Figure 01 雙足機器人行走視頻。
很快到了今年 1 月,Figure 01 已經學會了煮咖啡。
2024 年 1 月 18 日,Figure 宣布與寶馬合作,在汽車制造工廠部署人形機器人。此時的 Figure 01 號稱已經可以自主完成現實世界中的任務了。
Figure 01 在寶馬工廠里工作。
今年 3 月,Figure 宣布完成驚人的 6.75 億美元 B 輪融資,公司估值達到 26 億美元。投資者包括微軟、英特爾、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英偉達、貝索斯、「木頭姐」的方舟投資、Parkway Venture Capital、Align Ventures 等。
與此同時,Figure 還宣布與 OpenAI 建立合作伙伴關系,包括 OpenAI 為 Figure 的人形機器人構建專門的 AI 模型,使其機器人能夠處理和推理語言。
3 月 13 日,借助 OpenAI 技術,Figure 01 可以與人類進行全面對話。
從直立行走,完成復雜任務到與人自然交互。這些技術亮點也是 Figure 和一直希望回歸機器人領域的 OpenAI 達成合作協議的重要原因之一 —— 將 OpenAI 的研究與 Figure 的機器人經驗結合起來,為人形機器人開發下一代 AI 模型。
在今天 Figure 02 發布后,高度集成的硬件與 VLM 等新一代 AI 技術結合,讓我們距離真正具有通用能力的人形機器人更近了一步。
很快,物理世界也要迎來 AI 帶來的變革了?
來源:機器之心