Anthropic 為何突然把 Recursive Self-Improvement 拉到檯面上?
近期,Anthropic 針對 recursive self-improvement 的最新警告,讓 AI 產業再次正視一個更具顛覆性的問題:如果 AI 不只是幫人寫程式,而是開始參與打造自己的下一代系統,未來的技術演進還能由人類完全掌控嗎?Anthropic 在 6 月 4 日發表的部落格文章《When AI Builds Itself》指出,AI 可能正逼近一個關鍵轉折點,也就是能以極少的人類介入,設計並建造自己的後繼者。
這種說法之所以受到關注,不只因為它聽起來像科幻情節,更因為 Anthropic 直接把風險拉回到現實治理層面。公司表示,若這種循環式自我改進真的出現,可能會提高人類失去對技術控制權的風險;因此,世界可能需要考慮是否要對前沿 AI 發展進行短暫放緩,讓社會制度與對齊研究能跟上技術速度。這也讓「加速」與「暫停」成為同一場辯論中的兩個核心詞。
從寫程式到寫更多程式:AI 參與自身開發的程度正在升高
Anthropic 這次最具說服力的部分,不是抽象推演,而是來自自家營運數據。公司表示,Claude 現在撰寫的程式碼已經超過其系統中合併程式碼的 80%,而在 2025 年初推出 Claude Code 後,這個比例從先前的低個位數快速上升。另一項被反覆提到的數字是:Anthropic 的工程師如今每季交付的程式碼量,大約是幾年前的 8 倍。這些變化被視為一種訊號:在 AI 開發 AI 的過程裡,人類的角色正在縮小。
Axios 的報導也沿著同一條線索指出,Claude 的能力已經從「輔助寫程式」擴展到可長時間自主完成任務的 coding agent,並逐步進入更完整的自主代理階段。換句話說,AI 不再只是生產工具的一部分,而是逐漸變成生產工具的共同設計者。這種轉變看似只是效率提升,但它真正的意義在於:AI 開始不只改變人怎麼工作,也開始改變 AI 自己是怎麼被建造出來的。
Recursive self-improvement 到底代表什麼?
所謂 recursive self-improvement,指的是 AI 系統能夠自己設計、測試、優化,甚至訓練更強的後繼模型,而人類只保留高層目標與監督角色。Anthropic 在文章中強調,目前「還沒有到那一步」,而且這件事也「不是必然會發生」;但它同時警告,這個時間點可能比多數機構準備得更早到來。換句話說,真正值得擔心的不是某一天 AI 突然覺醒,而是它在一連串日常工作中,逐步累積出足以改寫開發流程的能力。
支持這項判斷的,不只是一家公司的內部觀察。相關整理也提到,Claude 在研究與最佳化工作上,對某些任務帶來了約 52 倍 的速度提升;雖然這種數字只適用於明確定義的實驗,但它凸顯了 AI 在特定場景下已經接近「超人類」表現。當 AI 能更快完成研究、修正程式、迭代模型,下一步自然就是:它是否也能開始改良生成自己的方法論與架構?
效率狂飆之下,治理與對齊問題才剛開始
Anthropic 的主張並不只停留在技術層面。公司明確表示,希望接下來幾個月能與政府、研究者,以及競爭對手共同討論:是否存在一種可行的協調性放緩機制。這種提法很少見,因為它等於承認,前沿 AI 的風險可能已經不是單一公司能獨自解決,而是需要跨組織、跨國界的協作。若不同實驗室都在競速,卻沒有人願意先踩煞車,那麼安全研究可能永遠追不上模型能力的成長。
當然,這樣的警告也引來質疑。部分評論者認為,這類說法可能同時具有產業策略效果,也就是在持續前進的同時,將監管注意力引向前沿技術。無論這種解讀是否成立,至少可以確定的是:AI 公司不再只談更快、更強,而開始公開討論「何時該慢下來」。而這正是治理議題成熟的跡象之一——當速度已足以改變市場,社會就必須開始問:我們是否已經建立足夠的安全邊界?
真正的問題不是 AI 會不會自我改進,而是人類能否跟上
Anthropic 這次的提醒,最值得重視的地方並不在於它是否預言準確,而在於它迫使外界重新思考一個老問題:當技術開始加速生產技術本身,控制權究竟會如何分配?如果 AI 真的能逐步參與下一代模型的設計、編碼與訓練,那麼人類要扮演的角色,可能就不再是「主要執行者」,而會轉向「方向設定者」與「風險監督者」。
這也意味著,recursive self-improvement 不只是 AI 工程的專有名詞,更是整個社會必須及早理解的治理命題。它提醒我們,真正的競賽不只是模型性能,而是制度、共識與安全研究能否同步演化。未來若要在創新與控制之間取得平衡,或許最重要的不是一味追求更快,而是確保每一次加速,都仍然留得住人類的判斷與責任。





