Posts
All the articles I've posted.
- 6.5
- 7.0
JTPRO: A Joint Tool-Prompt Reflective Optimization Framework for Language Agents
JTPRO框架解决LLM Agent在工具数量庞大时的工具误选和槽位实例化错误问题。
- 6.5
Forage V2: Knowledge Evolution and Transfer in Autonomous Agent Organizations
Forage V2通过共进化和方法隔离实现自主Agent组织的知识演化和迁移。
- 6.5
EvoAgent: An Evolvable Agent Framework with Skill Learning and Multi-Agent Delegation
EvoAgent将技能建模为多文件结构化能力单元,支持触发机制和进化元数据。
- 7.5
Stateless Decision Memory for Enterprise AI Agents
揭示企业级Agent部署中RAG主导地位背后的四个隐藏系统工程约束。
- 6.5
FSFM: A Biologically-Inspired Framework for Selective Forgetting of Agent Memory
受海马体索引巩固理论和艾宾浩斯遗忘曲线启发的Agent选择性遗忘框架。
- 6.3
Measuring the Machine: Evaluating Generative AI as Pluralist Sociotechical Systems
从测量理论视角重新审视AI基准测试的本体论意义:基准不仅测量,更塑造了模型的显现形态。
- 6.5
Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure
预注册实验:7个主流LLM在欺诈检测上超越人类基准,但在已说服的投资者压力下会抑制警告。
- 6.3
Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization
通过文本参数图(TPG)优化实现多Agent系统的自改进,赋予优化器从经验中学习的能力。
- 7.7
SWE-chat: Coding Agent Interactions From Real Users in the Wild
SWE-chat:首个来自开源开发者的真实编码Agent使用大数据集,6000会话/355K工具调用。
- 6.5
Diagnosing CFG Interpretation in LLMs
RoboGrid框架:系统化解构LLM作为上下文文法解释器的语法/行为/语义三个维度能力。