![]() 圖源:Unsplash / Possessed Photography 撰文|劉少山 過去一年里,我被問得最多的問題之一是:未來的機器人是否一定會走向人形?這一問題在科技界引發(fā)了大量討論,其背后其實對應著兩種截然不同的技術(shù)哲學,“創(chuàng)世論”與“進化論”。所謂“創(chuàng)世論”,是指只要把某一種機器人形態(tài)做到足夠強大、足夠全面,它最終就能解決所有類型的問題。在這種理念中,人形機器人被視為最接近“通用形態(tài)”的存在,因此許多公司試圖通過不斷增強一款人形機器人,讓它承擔從搬運、清潔到陪伴、護理的各種任務(wù),仿佛在“創(chuàng)造”一個萬能的技術(shù)生命體。 與之相對的“進化論”則認為,機器人應像自然界的生命一樣,根據(jù)場景需求不斷分化和演化為不同形態(tài),沒有任何一種形態(tài)是預設(shè)的終極答案,而是依靠大規(guī)模應用帶來的數(shù)據(jù)、成本、效率和場景適配度來決定成敗。從掃地機器人到倉儲機械臂,從室內(nèi)移動底盤到外骨骼,每一種形態(tài)都在市場競爭和現(xiàn)實約束中經(jīng)歷“物競天擇”:適應場景和經(jīng)濟性的形態(tài)得以規(guī)?;?,不具備場景價值或成本優(yōu)勢的形態(tài)則自然會被淘汰。在具身智能逐步走向大規(guī)模應用的過程中,我個人更相信“進化論”的道路,它更符合商業(yè)規(guī)律、技術(shù)演化的真實路徑,也更符合這個復雜世界的真實結(jié)構(gòu)。 01 如果從工程和商業(yè)的角度冷靜審視,試圖讓單一機器人形態(tài)適應所有場景,幾乎注定是一條線性且低效的演進路徑。假設(shè)我們希望一臺人形機器人同時勝任清潔、烹飪、護理、遞物、整理等完全不同的任務(wù),那么每新增一個場景,都意味著要額外構(gòu)建一整套動作庫、采集對應的數(shù)據(jù)、開發(fā)新的感知與決策模型,并通過大量安全與可靠性驗證。這類能力擴展本質(zhì)上是“串行累積”:每跨入一個新領(lǐng)域,都需要投入巨量工程資源,而且不同場景之間的技能遷移度有限,很難通過某一次突破帶來整體能力的指數(shù)級躍遷?,F(xiàn)實中,人形機器人在高自由度控制、精細力控和復雜視覺理解等方面仍存在大量技術(shù)難題,而在許多具體任務(wù)場景里,人形的結(jié)構(gòu)優(yōu)勢并不明顯,甚至不如專用機器人高效。這使得“讓一臺人形機器人包打天下”在實踐中往往陷入緩慢的線性演進:可以做的事越來越多,但每邁出一步都成本高昂、周期漫長。 反觀現(xiàn)實世界,許多機器人形態(tài)已經(jīng)在各自垂直場景中實現(xiàn)了大規(guī)模應用,并沿著自己的賽道高速進化。以掃地機器人為例,經(jīng)過十多年的發(fā)展,全球清潔機器人市場已經(jīng)形成“數(shù)億臺級別”的保有量,僅頭部廠商就累計出貨數(shù)千萬臺。在這樣的大規(guī)?;A(chǔ)上,導航、路徑規(guī)劃、避障、地面建模、纏繞處理等能力得到了持續(xù)優(yōu)化,背后依托的是每天在真實家庭環(huán)境中產(chǎn)生的海量運行數(shù)據(jù),而不是在實驗室中“設(shè)計出完美通用形態(tài)”。外賣配送和園區(qū)/校園配送機器人在中國等地已較為常見,它們在復雜道路結(jié)構(gòu)和高頻任務(wù)調(diào)度中,快速積累了導航策略、傳感器融合和異常場景處理的豐富經(jīng)驗。倉儲物流中的機械臂與 AGV 系統(tǒng),每天在電商和制造企業(yè)的倉庫里執(zhí)行上億次抓取與搬運操作,形成了極其龐大的動作樣本和失敗樣本,使得抓取策略、路徑規(guī)劃和系統(tǒng)魯棒性在幾年內(nèi)實現(xiàn)了跨越式迭代。 從這個角度看,多種機器人形態(tài)在各自高頻場景中并行演化,形成的是一種“生態(tài)式”的指數(shù)級能力增長。每一種形態(tài)都在自己最擅長、最高頻的場景里快速迭代,通過真實世界持續(xù)反饋推動算法和系統(tǒng)不斷優(yōu)化,而并不需要等到某個“終極形態(tài)”完善之后再統(tǒng)一賦能。這種結(jié)構(gòu)性的差異意味著,多形態(tài)并行演化比單形態(tài)通吃式通用化,更符合技術(shù)發(fā)展規(guī)律和商業(yè)規(guī)模化邏輯。即便未來不同形態(tài)之間會逐漸沉淀出一組“共性能力”,甚至在某些場景中自然收斂為類似人形的結(jié)構(gòu),那也應被視為規(guī)模化進化后的結(jié)果,而不是一開始就被寫死在技術(shù)藍圖上的答案。具身智能真正的效率和活力,來自一個多物種、多路徑的生態(tài),而不是來自某個單一形態(tài)的極限強化。 02 如果多形態(tài)并行演化是更高效的道路,那么一個自然的問題是:哪些形態(tài)更有資格在這條路上跑得更快?答案往往是那些已經(jīng)在市場上擁有大規(guī)模裝機量和穩(wěn)定需求的機器人形態(tài)。掃地機器人、各類服務(wù)機器人和移動底盤之所以發(fā)展迅速,并不是因為它們在結(jié)構(gòu)上多么“接近人形”,而是因為它們已經(jīng)擁有數(shù)百萬乃至數(shù)千萬級別的年度出貨規(guī)模,在這一基礎(chǔ)上形成了堅實的供應鏈體系和成本結(jié)構(gòu)。核心元件如電機、輪組、減速器、激光雷達、攝像頭、IMU、電池和主控芯片等,在大批量采購和持續(xù)優(yōu)化的過程中不斷降本增效。同時,這些設(shè)備長期運行在真實家庭、餐廳、酒店、園區(qū)和倉庫環(huán)境中,產(chǎn)生了遠超實驗室的感知數(shù)據(jù)、故障樣本和邊緣場景案例,使得算法、結(jié)構(gòu)設(shè)計與系統(tǒng)穩(wěn)定性都在“用中學、學中迭代”。 當一種形態(tài)已經(jīng)具備如此龐大的存量和增量基礎(chǔ)時,在其上做輕量級功能擴展,就能以非常高的性價比快速拓展應用邊界。例如,在成熟的掃地機器人平臺上加裝一個輕量機械臂,可以讓其從單一清掃任務(wù)擴展到拾取地面小物件、放回指定區(qū)域、做簡單的分類和歸位,甚至與家庭成員產(chǎn)生低風險的互動。這類“從地面到手部”的升級,由于底盤、導航、供電和控制等基礎(chǔ)設(shè)施已經(jīng)高度成熟,其邊際成本遠小于從零打造一套全新形態(tài)。類似的思路同樣適用于配送機器人、餐飲機器人、巡檢機器人等,通過在現(xiàn)有平臺上添加適當?shù)膱?zhí)行機構(gòu)、傳感器或軟件功能,就能顯著提升任務(wù)價值密度,進入更多高價值場景 在這種模式下,銷量越大,算法迭代越充分、故障場景覆蓋越全面、供應鏈成本越低,進而又提升了產(chǎn)品的性價比和可用性,吸引更多用戶和應用場景加入,形成正向反饋。這才是真正意義上的商業(yè)閉環(huán):技術(shù)能力和市場規(guī)?;ハ啻龠M,而不是靠單次融資或概念驅(qū)動“硬拽”出來的應用。從進化的角度看,具身智能的演化并不是從零開始設(shè)計某種“理想軀體”,而是在已有的高頻形態(tài)中不斷疊加能力,逐步向更多場景和更復雜生態(tài)擴散。就像智能手機的形態(tài)是在幾十億用戶的長期使用中演化出來,而不是在第一天就被完美設(shè)計好一樣,那些已經(jīng)在市場中證明自己、具備穩(wěn)定需求和規(guī)?;A(chǔ)的機器人形態(tài),更有可能成為具身智能演化的主干;而那些缺乏規(guī)?;A(chǔ)、難以形成成本優(yōu)勢或缺乏真實場景支撐的形態(tài),則很可能在商業(yè)競爭中逐漸被淘汰。 03 在討論人形機器人時,最大的現(xiàn)實掣肘往往不是“能不能做”,而是“值不值得做”,也就是成本結(jié)構(gòu)是否與任務(wù)價值匹配。當前一代人形機器人普遍采用高度復雜的機械和控制系統(tǒng):幾十個自由度的關(guān)節(jié)驅(qū)動器、價格不菲的精密減速器和高性能電機、多模態(tài)傳感器(包括多攝像頭、激光雷達、力矩傳感器、IMU 等)、大容量電池組以及高算力的計算平臺。這類系統(tǒng)即便在未來實現(xiàn)量產(chǎn),單機成本短期內(nèi)仍大概率處于數(shù)萬美元甚至更高的區(qū)間。與之對比,清潔機器人、餐飲服務(wù)機器人、AGV、協(xié)作機械臂等成熟形態(tài),其單機價格已經(jīng)壓縮到消費者可以接受、企業(yè)可以規(guī)模采購的水平。 問題在于,當一臺造價極高、結(jié)構(gòu)極其復雜的人形機器人被用來執(zhí)行“擦桌子、端水、疊衣服”這類中低復雜度任務(wù)時,其大部分硬件能力、冗余自由度和傳感配置在日常工作中很可能并未被真正用到,從而形成典型的“用火箭送快遞”的成本錯配。這并不是否認技術(shù)上的可行性,而是質(zhì)疑這種形態(tài)在當下大部分場景中的經(jīng)濟意義。相比之下,那些已經(jīng)大規(guī)模應用的專用或半通用機器人形態(tài),在成本與能力之間往往達成了相對合理的平衡:掃地機器人以百美元級的價格完成了絕大多數(shù)家庭難以堅持的日常清潔工作;商用服務(wù)機器人在幾萬元人民幣的價格帶上,支撐了餐廳、酒店和醫(yī)院等高頻場景中的穩(wěn)定運行;倉儲里的 AGV 和機械臂則通過針對性結(jié)構(gòu)設(shè)計,實現(xiàn)了在固定場景中的高效作業(yè),很少為了“可能有一天會需要”而預留大量閑置的自由度和傳感器。 從商業(yè)邏輯上看,如果一種機器人形態(tài)的總擁有成本明顯高于它所解決問題的經(jīng)濟價值,那么無論技術(shù)多么炫目,都難以實現(xiàn)真正的大規(guī)模部署。人形機器人如果被設(shè)想為“做所有事的唯一入口”,在絕大多數(shù)中低復雜度任務(wù)場景中,都會面臨嚴重的性價比壓力。而那些柔性機器人、模塊化移動平臺、低自由度輕量機械臂之所以成長迅速,正是因為它們圍繞特定任務(wù)做了結(jié)構(gòu)約束和成本約束,在安全性、可靠性與成本之間達成了工程上的平衡。換句話說,成本結(jié)構(gòu)本身就是具身智能生態(tài)中的一種“自然選擇機制”:那些在給定場景下用更低成本提供足夠價值的形態(tài),更容易被市場選中并獲得規(guī)?;婵臻g;而那些過度設(shè)計、難以匹配主流需求價格帶的形態(tài),即便短期因概念極具話題性,也往往難以跨過長期商業(yè)化的門檻。最終,哪些機器人形態(tài)會真正“活下來”,不是由某個技術(shù)路線拍板決定的,而是由成本、需求與規(guī)模效應共同完成的長期篩選。 04 當成本結(jié)構(gòu)完成第一輪“自然篩選”之后,幸存下來的多種機器人形態(tài),并不會彼此完全割裂,而是在長期規(guī)模部署中逐漸顯露出一組被反復重用的“共性功能”。無論是清潔機器人、倉儲機械臂、配送機器人,還是未來的護理機器人,它們在抓取、移動、視覺感知、姿態(tài)控制、環(huán)境建模等核心能力上,都會隨著數(shù)據(jù)和算法的沉淀而不斷趨同。現(xiàn)實中,物流倉庫里的機械臂和家庭中的掃地機器人雖然外形和工作條件完全不同,但在路徑規(guī)劃、障礙避讓、狀態(tài)估計這些底層算法上具有高度相似性;自動駕駛車輛與室內(nèi)移動機器人在 SLAM、目標檢測和軌跡優(yōu)化方面也共享了大量技術(shù)組件。隨著更多機器人進入真實環(huán)境,這種“技術(shù)內(nèi)核重疊”的現(xiàn)象只會愈發(fā)明顯,只是被封裝在不同的外形、任務(wù)接口與軟件棧之中。 在這一過程中,人形結(jié)構(gòu)有可能在某些特定場景中成為這些共性功能的“匯聚載體”,原因并不是人形在抽象意義上更高級,而是因為人類的物理世界在很大程度上是按人形設(shè)計的:樓梯高度、門把位置、工具形狀、操作臺和櫥柜的尺寸,都圍繞著一個雙足、雙臂、眼睛高度在一米五到一米八之間的生物來布局。在需要大規(guī)模使用現(xiàn)有工具、頻繁開門上下樓梯、搬箱子、穿行于狹窄通道和人類工作空間的場景中,具備與人類相近的身體比例、手部形態(tài)和視角高度,確實在適配性上具有明顯優(yōu)勢。許多面向工業(yè)共融和服務(wù)協(xié)作的人形機器人項目,都強調(diào)無需改造現(xiàn)有工廠和樓宇環(huán)境、可以直接使用人類工具、在“為人類設(shè)計的空間”中與人并肩工作,這從側(cè)面印證了人形在“復用既有物理基礎(chǔ)設(shè)施”方面的天然長處。 即便如此,這種向人形方向的潛在收斂,依然更像是一種“演化的結(jié)果”,而不是一開始就寫死在技術(shù)路線圖上的必然終點。從當前現(xiàn)實出發(fā),在工業(yè)場景中真正規(guī)模落地的是固定基座機械臂和各類輪式移動平臺,而不是雙足人形;在家庭場景中真正進入千家萬戶的,是掃地機器人、擦窗機器人以及若干簡單的服務(wù)機器人,而不是能夠獨立完成全部家務(wù)的全能人形。市場已經(jīng)通過“用腳投票”的方式,選擇了在成本、可靠性和場景適配度之間平衡得更好的形態(tài)。未來如果有一天,人形或半人形形態(tài)在某些領(lǐng)域自然成為主流,更大概率是因為抓取、導航、平衡控制、視覺理解、雙手協(xié)作等底層共性能力已經(jīng)在其他形態(tài)上充分成熟,最后在少數(shù)需要高度兼容人類工具與空間的高價值場景中,被“打包”進一個更接近人形的結(jié)構(gòu)中。 從這個意義上講,與其一開始就把人形當作唯一目標,不如讓不同形態(tài)在各自場景中充分競爭、充分演化,由市場和真實環(huán)境去篩選哪些共性能力是剛需,哪些身體結(jié)構(gòu)真正能提供凈收益。當這些共性能力不斷沉淀、在不同形態(tài)間反復重用時,人形有可能在部分關(guān)鍵領(lǐng)域里,作為一種高通用性的“匯集形態(tài)”自然出現(xiàn),但那是一種順應進化、順應成本和場景約束的結(jié)果,而不是先驗的信仰。具身智能領(lǐng)域真正值得追問的問題,已經(jīng)不再是“要不要人形”,而是“在哪些具體場景中,經(jīng)過充分演化之后,人形恰好是性價比最高、適配度最好的那個答案”。而這一答案,不會寫在某位工程師的白板上,而是會在成千上萬臺機器人與真實世界的長期互動之中,被緩慢而堅定地“選”出來。 05 如個人認為,真正決定具身智能未來形態(tài)的,從來不是誰畫出一個“終極人形”,而是無數(shù)機器人在真實世界里的長期博弈與優(yōu)勝劣汰。與其執(zhí)著于造一個萬能的技術(shù)“神”,不如擁抱多形態(tài)并行演化的生態(tài),讓成本、場景和規(guī)模去篩選最合適的答案。也許有一天,人形會在某些關(guān)鍵領(lǐng)域自然成為收斂形態(tài),但那是進化的結(jié)果。我們要做的,不是替未來下結(jié)論,而是把更多機器人盡快送進真實世界,讓時間和市場完成最后的選擇。 |
|
|