Hugging Face開源ml-intern,自動讀論文、選擇數據、跑訓練的ML研究代理

根據動察 Beating 監測,Hugging Face 開源 ml-intern,一個能自主完成「讀論文、整理資料集、啟動 GPU 訓練、評估結果、迭代改進」全流程的 ML 研究代理。項目基於自家 smolagents 框架構建,提供 CLI 和網頁端兩種入口,程式碼在 GitHub 開源。

ml-intern 的工具鏈圍繞 Hugging Face 生態搭建:在 arXiv 和 HF Papers 上檢索論文並沿引用鏈深讀;瀏覽 HF Hub 上的資料集,檢查品質後重新格式化再投入訓練;本地沒有 GPU 時可調用 HF Jobs 啟動雲端訓練任務,訓練結束後自動讀取評估輸出、診斷失敗原因並重跑。預設調用 Claude Sonnet 4.5 驅動決策循環,單次最多迭代 300 輪,上下文超過 170k token 自動壓縮。

Hugging Face 在發布貼中給出三個案例。科學推理任務中,代理從基準論文的引用鏈裡找到 OpenScience 和 NemoTron-CrossThink 資料集,從 ARC、SciQ、MMLU 中按難度篩選出 7 個變體,在 Qwen3-1.7B 上跑了 12 輪 SFT,GPQA 得分從 10% 提到 32%,耗時不到 10 小時。醫療場景中,代理判斷現有資料集品質不夠,自行編寫腳本生成 1100 條合成資料並擴增 50 倍用於訓練,在 HealthBench 上超過 Codex 60%。競賽數學場景中,代理自行編寫 GRPO 訓練腳本並在 A100 上通過 HF Spaces 啟動訓練,觀測到獎勵塌縮後跑消融實驗排查原因。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆