Tag: 强化学习
All the articles with the tag "强化学习".
- 7.7
- 8.7
AI Can Learn Scientific Taste:用社区反馈训练科学判断力
复旦提出 RLCF 范式,让 AI 学会判断和提出高影响力研究想法
- 8.0
- 8.2
AutoResearch 实战:一夜 151 次实验的自动化研究循环
Karpathy AutoResearch 在 Blackwell GB10 上的实践,展示了 AI Agent 如何通过自主循环优化发现硬件最优配置
- 7.8