印度服務業,正在變成機器人學習的資料工廠
在物理 AI 加速競賽下,Human Archive 成為近期最受關注的新創之一。這家矽谷團隊宣布募得 **820 萬美元**,目標不是單純做軟體,而是把印度的真實服務業場景,整理成可供機器人訓練的高品質資料。
根據公開資訊,Human Archive 已在多個地點部署超過 **1,000 個頭戴式裝置**,用第一人稱視角記錄清潔、餐飲、宿舍等日常工作流程。這類資料的價值在於,它不是實驗室裡的模擬動作,而是更貼近現場的真實操作,能讓 AI 更理解人類如何在複雜環境中完成任務。
為什麼第一人稱資料比單純影片更值錢
多篇報導都指出,機器人訓練長期卡在一個核心瓶頸:缺乏高品質的現實世界示範資料。對人類來說看似簡單的整理、烹飪、搬運或照護,一旦交給機器人,就涉及空間感、觸覺、力度與動作協調等多種訊號。也因此,只有影片往往不夠,還需要同步的感測資料。
Human Archive 的做法正是從這裡切入。除了頭戴攝影裝置,團隊也在開發手套、動作服與攝影設備,嘗試收集同步的動作與力道資訊。這意味著它們販售的不只是影像,而是一整套可用來訓練 physical AI 的資料結構。TechCrunch 與相關報導都提到,這類多感測器資料,對機器人泛化能力的提升更具價值。
投資人看中的,不只是資料量,而是資料稀缺性
這輪融資由 Wing Venture Capital 與 NVP Capital 領投,並獲得來自 Y Combinator,以及 OpenAI、Nvidia、Google、Meta 等機構背景投資人的參與。這樣的股東組合,顯示市場對「機器人訓練資料」這條賽道的重視,已經不只是概念層面的想像,而是開始形成資本共識。
Human Archive 目前的敘事很清楚:當 AI 模型越來越強,真正稀缺的不是算力,而是能讓模型學會真實世界動作的資料。CoinDesk 的報導也提到,這家公司除了對外出售資料給 AI 實驗室,還在測試用自有資料微調模型,並用機器人執行任務來驗證資料品質。這種「資料採集—模型訓練—實機測試」的閉環,正是投資人願意下注的原因之一。
印度 gig 經濟的機會,與隨之而來的倫理壓力
Human Archive 將重心放在印度,也不是偶然。當地龐大的家務、外送與餐飲服務市場,提供了大量可被記錄的日常勞動情境。對新創來說,這代表可以在相對高密度的現場中,持續取得多樣化的工作樣本;但對外界而言,這也立刻引發隱私與同意機制的討論。
報導指出,Human Archive 表示其合約符合印度 DPDP(數位個人資料保護法)的要求,並提供隱私政策與資料用途說明;公司也聲稱資料會匿名化,臉部通常會被模糊處理。不過,印度電子與資訊科技部門也正檢視這類使用第一人稱資料的新創,關注點集中在 consent 機制與資料蒐集流程。也就是說,這條路雖然商業上有吸引力,但治理成本同樣不低。
從印度走向東南亞與美國:這門生意能否規模化
目前 Human Archive 的主要資料仍集中在印度,但公司已開始向東南亞與美國擴張,並測試讓更多人加入資料蒐集流程、以報酬換取錄製任務。另有報導提到,美國地區已出現早期試點,提供清潔或烹飪服務的同時,也同步收集工作者資料。這顯示該模式不只是一場區域實驗,而是朝跨市場供應鏈前進。
不過,規模化從來不只看地理擴張,更看資料是否足夠獨特、是否能被持續驗證,以及是否能建立穩定的合作關係。從更大的產業角度來看,Human Archive 的故事揭示了一個新現實:機器人革命的基礎設施,不一定建在機房裡,也可能建立在真實人類勞動的每一次手勢、每一段步伐、每一個動作之中。當服務業被重新定義為訓練資料來源,產業效率與個人隱私之間的平衡,也將成為下一階段最值得關注的問題。





