揭秘特斯拉人形機(jī)器人訓(xùn)練:員工身心俱疲,感覺像小白鼠
關(guān)鍵詞: Optimus Optimus訓(xùn)練過程 Optimus應(yīng)用場景 Optimus數(shù)據(jù)采集

Optimus
北京時間11月3日,《商業(yè)內(nèi)幕》周末發(fā)文,披露了特斯拉的人形機(jī)器人實(shí)驗(yàn)室,讓外界得以一窺特斯拉是如何把Optimus訓(xùn)練得像人一樣的。
在特斯拉工程總部一間玻璃圍墻實(shí)驗(yàn)室里,數(shù)十名員工正在模擬日常生活動作:舉起杯子、擦拭桌面、拉開窗簾。
他們在八小時輪班中要重復(fù)每個動作數(shù)百次,頭盔與厚重背包上安裝的五臺攝像機(jī)會全程記錄工作過程。特斯拉CEO埃隆·馬斯克(Elon Musk)偶爾會駐足觀看。特斯拉的投資者們也定期前來觀看演示。
“這種感覺就像‘顯微鏡下的小白鼠’。”一名前員工對《商業(yè)內(nèi)幕》表示。
這些員工的目標(biāo)很簡單:教會特斯拉人形機(jī)器人Optimus如何像人類一樣活動。
馬斯克已將Optimus視為公司業(yè)務(wù)的關(guān)鍵組成部分。在特斯拉第三季度財(cái)報(bào)電話會議上,馬斯克表示,這款機(jī)器人“有望成為有史以來最大的產(chǎn)品”,并稱公司最終每年將生產(chǎn)100萬臺。他還預(yù)測,Optimus未來可能占到特斯拉企業(yè)估值的大約80%。
特斯拉計(jì)劃讓Optimus執(zhí)行各種任務(wù),包括工廠工作、家務(wù)以及護(hù)理工作。上述“數(shù)據(jù)收集操作員”的工作就是為Optimus替代人力勞動鋪路。
《商業(yè)內(nèi)幕》采訪了五名現(xiàn)任和前任員工,了解Optimus的訓(xùn)練過程。他們表示,這份工作對體力要求高,有時看著可笑,但始終需要一絲不茍。員工需要完成沖刺、下蹲、跳舞。有員工透露,如果動作被判定“不夠擬人化”,還會被要求糾正改進(jìn)。
特斯拉只是眾多嘗試在機(jī)器人身上復(fù)制復(fù)雜人類行為的科技公司之一,其他公司還有Figure和1X。像AI產(chǎn)業(yè)的許多其他項(xiàng)目一樣,它的最終目標(biāo)可能是實(shí)現(xiàn)自主化,但眼下正是由血肉之軀的人類勞動者大軍,支撐著那些光鮮的演示場景與宏大的承諾藍(lán)圖。
教嬰兒
對于數(shù)據(jù)收集操作員來說,訓(xùn)練機(jī)器人學(xué)會人類動作這份工作并不光鮮。
大多數(shù)數(shù)據(jù)收集員一開始只是擦桌子,有時要連續(xù)做好幾周。一名前員工說:“你走一步,擦桌子,然后復(fù)位,再重復(fù)一遍。”整個過程就是“反復(fù)循環(huán),直到休息時間”。
三名員工透露,他們會收到詳細(xì)的任務(wù)執(zhí)行規(guī)范,并遵循一本不斷增補(bǔ)的厚實(shí)操作手冊。五名員工表示,每名員工都配有搭檔,確保每個動作精準(zhǔn)無誤。
“特斯拉對操作規(guī)范要求極為嚴(yán)苛,”一名員工坦言,“這對身心都是巨大考驗(yàn)。”
在數(shù)據(jù)采集啟動初期,員工主要依靠動作捕捉服遠(yuǎn)程操控機(jī)器人,通過人工動作完成教學(xué)。據(jù)《商業(yè)內(nèi)幕》此前報(bào)道,隨著項(xiàng)目總監(jiān)米蘭·科瓦奇(Milan Kovac)的離職,特斯拉在6月通知員工將轉(zhuǎn)變采集方式,逐步淘汰動作捕捉服與遠(yuǎn)程操控,轉(zhuǎn)向純視覺數(shù)據(jù)采集。

馬斯克
員工表示,自己佩戴的多角度攝像頭能精準(zhǔn)定位他們在環(huán)境中的行動軌跡。團(tuán)隊(duì)被告知,摒棄動作捕捉服將有助于快速擴(kuò)展數(shù)據(jù)采集規(guī)模。
三名員工證實(shí),自6月改變收集方式以來,公司已引入多項(xiàng)新型訓(xùn)練流程,包括在員工執(zhí)行任務(wù)時布置多機(jī)位進(jìn)行全景采集。
謝菲爾德大學(xué)機(jī)器人技術(shù)專家喬納森·艾特肯(Jonathan Aitke)對《商業(yè)內(nèi)幕》表示,這些攝像頭陣列陣能通過提供更廣闊的環(huán)境視角來補(bǔ)充數(shù)據(jù)采集。
據(jù)三名員工透露,工作人員有時會配備觸覺手套,用以追蹤手部的精細(xì)動作。馬斯克曾表示,特斯拉已投入大量精力為Optimus研發(fā)仿生手部,并稱這是“極其困難的工程挑戰(zhàn)”。
三名員工稱,員工還會錄制彼此模仿動作的影像。兩名員工透露,在特斯拉位于加州弗里蒙特的工廠里,數(shù)據(jù)采集員曾頭戴傳感設(shè)備、身負(fù)背包,執(zhí)行整理汽車零部件和在傳送帶旁作業(yè)等任務(wù)。接受采訪的專家表示,為同一任務(wù)采集多樣化數(shù)據(jù)點(diǎn),將有效促進(jìn)機(jī)器人的訓(xùn)練進(jìn)程。
某些任務(wù)則簡單得被前員工形容為“教嬰兒”。兩名數(shù)據(jù)采集員稱,他們曾錄制自己操作真實(shí)嬰幼兒啟智玩具的過程:按尺寸和顏色套圈圈,或?qū)⒎e木放入對應(yīng)形狀的凹槽中。
三名員工表示,特斯拉還開始使用AI生成的提示來訓(xùn)練機(jī)器人。在某些訓(xùn)練環(huán)節(jié)中,工作人員通過頭顯接收到一系列AI生成的提示,該頭顯通過電線與30到40磅重的背包相連。雖然他們通常佩戴背包,但有時背包會放在旁邊的椅子或桌子上。
員工們表示,訓(xùn)練動作包括深蹲、跳小雞舞、模仿大猩猩、模擬使用吸塵器、沖刺幾碼、模擬打高爾夫球以及跳電臀舞等。據(jù)透露,每個動作都需在3到5秒內(nèi)完成。有兩名員工回憶稱,部分任務(wù)令人感到不適,比如AI曾要求他們四肢著地爬行或脫去一件衣物。
艾特肯指出,這些看似隨機(jī)的訓(xùn)練內(nèi)容實(shí)際上有助于特斯拉明確需要改進(jìn)的技術(shù)短板。
“若不對各種可能性進(jìn)行測試,又如何能確信自己已經(jīng)涵蓋了機(jī)器人所需掌握的全部技能范圍?”他反問道。
身體傷害
四名員工表示,這份工作會對身體造成損傷。一名前員工形容稱,這幾乎是“整天在做有氧運(yùn)動”。
一名前員工透露,自己在訓(xùn)練機(jī)器人時背部受傷。由于背包重量不均,他們感覺自己像是“在一瘸一拐地走路”。因此,他們不得不請病假。
“我右腿失去知覺,背部劇烈疼痛。”他們說。
員工還表示,他們曾看到同事因?yàn)檫@項(xiàng)工作的性質(zhì)而造成背部和頸部受傷。
一些員工在涉及動作捕捉服與虛擬現(xiàn)實(shí)頭盔的遠(yuǎn)程操控環(huán)節(jié),出現(xiàn)了不適。三名員工表示,圖像清晰度欠佳加之長時間佩戴設(shè)備,引發(fā)了強(qiáng)烈的暈動癥。尤其當(dāng)機(jī)器人突然傾倒時,視覺與體感的錯位會令人產(chǎn)生嚴(yán)重的迷失感。
“明明自己站得筆直,但透過機(jī)器人視角看到的卻是天旋地轉(zhuǎn)的墜落景象。”一名員工這樣描述道。
表演
目前,遠(yuǎn)程操控演示主要保留給投資者參觀環(huán)節(jié)。
“投資者希望看到機(jī)器人流暢運(yùn)作的場景,”一位前員工透露,“當(dāng)我們穿上動作捕捉服操控時,機(jī)器人的動作會顯得更流暢。”
兩名前員工表示,馬斯克有時會帶著他5歲的兒子X陪同投資者觀看機(jī)器人演示。其中一位前員工將這類演示比作“精心編排的舞臺劇”。
“整個過程就像劇場表演。”這位前員工感慨道。
兩名員工表示,機(jī)器人在執(zhí)行需要彎腰或傾斜的任務(wù)時,有一半時間會跌倒,有時還會損壞昂貴設(shè)備。三名員工表示,除非機(jī)器人執(zhí)行需要移動幾英尺以上的任務(wù),否則通常會被固定在支架,后者是一種幫助機(jī)器人保持直立的支撐裝置。
艾特肯表示,在特斯拉辦公室這種可控環(huán)境下,機(jī)器人應(yīng)能輕松保持直立。“讓機(jī)器人站穩(wěn)并維持平衡應(yīng)該是技術(shù)開發(fā)最基礎(chǔ)的環(huán)節(jié)。”他強(qiáng)調(diào)。
馬斯克在特斯拉近期的財(cái)報(bào)電話會議上表示,Optimus在公司工程總部全天候待命,不僅能自由行走于辦公區(qū)域,還能引導(dǎo)訪客前往會議室。
功夫和糖塊只是表象
三名員工稱,數(shù)據(jù)采集團(tuán)隊(duì)規(guī)模一度超過百人。但在9月份的半年度績效評估后,特斯拉裁撤了數(shù)十名數(shù)據(jù)采集員。
五名員工表示,他們的工作表現(xiàn)會通過量化評分體系進(jìn)行評估,從身體角度到位置定位等所有細(xì)節(jié)都會收到反饋。數(shù)據(jù)采集員可通過在線儀表盤查看基于數(shù)據(jù)質(zhì)量和數(shù)量的評級結(jié)果。根據(jù)五名受訪者的說法,每人每班次需采集至少四小時合格視頻素材,若因定位偏差等問題導(dǎo)致素材不達(dá)標(biāo),將面臨相應(yīng)處罰。

Optimus發(fā)糖
然而,對于負(fù)責(zé)訓(xùn)練機(jī)器人的員工而言,Optimus的績效評估標(biāo)準(zhǔn)卻顯得模糊。在主要依賴遠(yuǎn)程操控的訓(xùn)練階段,操作員可通過按鈕測試機(jī)器人執(zhí)行任務(wù)的能力。三名員工表示,成功率并不理想。如今這類評估日益減少,員工們對機(jī)器人的進(jìn)展缺乏清晰認(rèn)知。
在特斯拉發(fā)布的視頻中,Optimus可以走路、疊衣服、在《創(chuàng):戰(zhàn)神》首映式上表演功夫動作,以及在時代廣場派發(fā)糖果。
俄勒岡州立大學(xué)AI與機(jī)器人專家艾倫·弗恩(Alan Fern)對《商業(yè)內(nèi)幕》指出:“機(jī)器人演示永遠(yuǎn)是他們能展示給你的最完美版本。”
“當(dāng)你看到它表演武術(shù)這類展示時,看似展現(xiàn)了智能行為,但這會誤導(dǎo)人們高估其實(shí)際能力,”弗恩解釋道,“那只是機(jī)器人對環(huán)境做出的條件反射,背后并不存在真正的認(rèn)知思維。”
與此同時,馬斯克繼續(xù)宣傳其宏大的愿景。他在10月對投資者表示:“Optimus甚至不會看起來像一臺機(jī)器人,更像是穿著機(jī)器人外殼的人類。”
目前,Optimus仍在通過重復(fù)、試錯以及無數(shù)小時的人力勞動進(jìn)行學(xué)習(xí)。