Anthropic 警告 Recursive Self-Improvement 臨近：AI 可能開始打造自己的下一代模型

Anthropic 為何突然把 Recursive Self-Improvement 拉到檯面上？

近期，Anthropic 針對 recursive self-improvement 的最新警告，讓 AI 產業再次正視一個更具顛覆性的問題：如果 AI 不只是幫人寫程式，而是開始參與打造自己的下一代系統，未來的技術演進還能由人類完全掌控嗎？Anthropic 在 6 月 4 日發表的部落格文章《When AI Builds Itself》指出，AI 可能正逼近一個關鍵轉折點，也就是能以極少的人類介入，設計並建造自己的後繼者。

這種說法之所以受到關注，不只因為它聽起來像科幻情節，更因為 Anthropic 直接把風險拉回到現實治理層面。公司表示，若這種循環式自我改進真的出現，可能會提高人類失去對技術控制權的風險；因此，世界可能需要考慮是否要對前沿 AI 發展進行短暫放緩，讓社會制度與對齊研究能跟上技術速度。這也讓「加速」與「暫停」成為同一場辯論中的兩個核心詞。

從寫程式到寫更多程式：AI 參與自身開發的程度正在升高

Anthropic 這次最具說服力的部分，不是抽象推演，而是來自自家營運數據。公司表示，Claude 現在撰寫的程式碼已經超過其系統中合併程式碼的 80%，而在 2025 年初推出 Claude Code 後，這個比例從先前的低個位數快速上升。另一項被反覆提到的數字是：Anthropic 的工程師如今每季交付的程式碼量，大約是幾年前的 8 倍。這些變化被視為一種訊號：在 AI 開發 AI 的過程裡，人類的角色正在縮小。

Axios 的報導也沿著同一條線索指出，Claude 的能力已經從「輔助寫程式」擴展到可長時間自主完成任務的 coding agent，並逐步進入更完整的自主代理階段。換句話說，AI 不再只是生產工具的一部分，而是逐漸變成生產工具的共同設計者。這種轉變看似只是效率提升，但它真正的意義在於：AI 開始不只改變人怎麼工作，也開始改變 AI 自己是怎麼被建造出來的。

Recursive self-improvement 到底代表什麼？

所謂 recursive self-improvement，指的是 AI 系統能夠自己設計、測試、優化，甚至訓練更強的後繼模型，而人類只保留高層目標與監督角色。Anthropic 在文章中強調，目前「還沒有到那一步」，而且這件事也「不是必然會發生」；但它同時警告，這個時間點可能比多數機構準備得更早到來。換句話說，真正值得擔心的不是某一天 AI 突然覺醒，而是它在一連串日常工作中，逐步累積出足以改寫開發流程的能力。

支持這項判斷的，不只是一家公司的內部觀察。相關整理也提到，Claude 在研究與最佳化工作上，對某些任務帶來了約 52 倍 的速度提升；雖然這種數字只適用於明確定義的實驗，但它凸顯了 AI 在特定場景下已經接近「超人類」表現。當 AI 能更快完成研究、修正程式、迭代模型，下一步自然就是：它是否也能開始改良生成自己的方法論與架構？

效率狂飆之下，治理與對齊問題才剛開始

Anthropic 的主張並不只停留在技術層面。公司明確表示，希望接下來幾個月能與政府、研究者，以及競爭對手共同討論：是否存在一種可行的協調性放緩機制。這種提法很少見，因為它等於承認，前沿 AI 的風險可能已經不是單一公司能獨自解決，而是需要跨組織、跨國界的協作。若不同實驗室都在競速，卻沒有人願意先踩煞車，那麼安全研究可能永遠追不上模型能力的成長。

當然，這樣的警告也引來質疑。部分評論者認為，這類說法可能同時具有產業策略效果，也就是在持續前進的同時，將監管注意力引向前沿技術。無論這種解讀是否成立，至少可以確定的是：AI 公司不再只談更快、更強，而開始公開討論「何時該慢下來」。而這正是治理議題成熟的跡象之一——當速度已足以改變市場，社會就必須開始問：我們是否已經建立足夠的安全邊界？

真正的問題不是 AI 會不會自我改進，而是人類能否跟上

Anthropic 這次的提醒，最值得重視的地方並不在於它是否預言準確，而在於它迫使外界重新思考一個老問題：當技術開始加速生產技術本身，控制權究竟會如何分配？如果 AI 真的能逐步參與下一代模型的設計、編碼與訓練，那麼人類要扮演的角色，可能就不再是「主要執行者」，而會轉向「方向設定者」與「風險監督者」。

這也意味著，recursive self-improvement 不只是 AI 工程的專有名詞，更是整個社會必須及早理解的治理命題。它提醒我們，真正的競賽不只是模型性能，而是制度、共識與安全研究能否同步演化。未來若要在創新與控制之間取得平衡，或許最重要的不是一味追求更快，而是確保每一次加速，都仍然留得住人類的判斷與責任。