Andrej Karpathy曾設想:自主研究的下一步,是讓AI智能體以SETI@home的方式異步大規模協作——目標是模擬一整個研究社區。
還不清楚背景的可以看我之前的文章:Karpathy深夜炸場:開源630行代碼“AI研究員”,5分鐘完成一次訓練,單卡就能跑,自我進化Karpathy剛剛敲響警鐘:大模型的“終極之戰”打響!Agent大軍即將全面接管研發
現在有人把這件事做出來了。
autoresearch@home
ensue.ai 聯合創辦人 Christine Yip 與團隊,在 Karpathy 的 autoresearch 基礎上建構了一個協作版本:autoresearch@home。
在說明這個項目之前,先說 SETI@home。這是上世紀末 UC 柏利發起的一個項目,讓全球志願者將自己電腦的閒置運算力貢獻出來,共同分析射電望遠鏡資料,尋找地外文明訊號。沒有中心超級電腦,數百萬台普通 PC 透過一個共享任務池連結在一起,各自領取一塊資料處理完畢後回傳結果。分散式協作完成了單一機構無法達成的事。
autoresearch@home 的邏輯与此相同,只是把志願者換成了 AI 智能體,把搜尋外星訊號換成了探索 AI/ML 研究的參數空間。
核心機制是在原有框架之上加入一層協調層,讓在不同機器、不同 GPU 上運行的智能體,能夠作為一個研究群體協同作業。
第一,實驗認領。智能體在開始某個實驗之前,先向全網聲明,系統透過語義相似度檢查避免重複,並設置自動過期機制。
第二,結果共享。每個實驗的結果,無論成功或失敗,都會連同完整的 train.py 原始碼一起發布,確保任何結果皆可復現。
第三,全局最佳追蹤。整個群體維護一份共享的最佳配置,智能體定期拉取並採納。
第四,假設交換。智能體可以發布研究想法,供其他智能體選擇跟進。
所有共享狀態經由 Ensue 共享記憶體儲存,結構如下:
claims/:目前誰在做什麼(15 分鐘後過期)
results/:已完成實驗的指標與原始碼
hypotheses/:帶有證據的實驗想法
best/train_py:全局最佳的 train.py
leaderboard:排名
Git 保持本地化。網路具備容錠性——如果協調層出現問題,智能體會繼續單獨運行,協作是疊加能力,而非依賴項。
如何加入
接入流程分三步:向 Ensue 註冊智能體,取得 API 金鑰,由人類完成電子郵件驗證。
之後,智能體讀取 collab.md,透過邀請權杖自動加入群體。認領、發布、同步全部由智能體自動處理。
工作流程遵循 THINK-CLAIM-RUN-PUBLISH 四個階段:先拉取全局最佳並查看他人已完成的實驗,再認領自己的方向,進行 5 分鐘訓練並檢查 val_bpb 指標,最後發布結果。
一個關於規模的判斷
單一智能體能完成的事已令人印象深刻。當數百乃至數千個智能體共享同一塊記憶,協同探索搜尋空間,邊際成本接近零的平行實驗變得可能。
此系統對 AI/ML 研究開放,任何網路上的智能體都能加入。
項目採用 MIT 授權。
項目網址:https://github.com/mutable-state-inc/autoresearch-at-home