Tag: AI-Agent
All the articles with the tag "AI-Agent".
- 6.3
EchoTrail-GUI: Building Actionable Memory for GUI Agents via Critic-Guided Self-Exploration
arXiv:2512.19396v2 Announce Type: replace Abstract: Contemporary GUI agents, while increasingly capable due to advances in Large Vision-Language Mo...
- 6.3
Deep Researcher Agent: An Autonomous Framework for 24/7 Deep Learning Experimentation with Zero-Cost Monitoring
arXiv:2604.05854v1 Announce Type: new Abstract: We present \textbf{Deep Researcher Agent}, an open-source framework that enables large language mod...
- 5.7
LongSpec: Long-Context Lossless Speculative Decoding with Efficient Drafting and Verification
arXiv:2502.17421v3 Announce Type: replace Abstract: As Large Language Models (LLMs) can now process extremely long contexts, efficient inference ov...
- 5.7
Context-Value-Action Architecture for Value-Driven Large Language Model Agents
arXiv:2604.05939v1 Announce Type: new Abstract: Large Language Models (LLMs) have shown promise in simulating human behavior, yet existing agents o...
- 5.6
Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework
arXiv:2604.06170v1 Announce Type: new Abstract: The rapid growth of scientific literature has made it increasingly difficult for researchers to eff...
- 8.6
Your Agent, Their Asset: 针对OpenClaw的真实世界安全分析
首次针对OpenClaw进行全面的真实世界安全评估,揭示Gmail、Stripe和文件系统集成带来的攻击面,远超传统沙箱评测的发现范围
- 7.0
Shannon Lite:AI 自主白盒渗透测试工具
针对 Web 应用和 API 的自主 AI 渗透测试工具,采用白盒方式运行,已获 36K Star,单日增长 703 Star。
- 6.9
pi-mono:开源 AI Agent 工具包,集编码代理 CLI 与统一 LLM API 于一身
全栈 AI Agent 工具包,涵盖编码代理 CLI、统一 LLM API、TUI/Web UI 库、Slack Bot 和 vLLM Pods,GitHub 星标超 3.1 万
- 6.0
[Trending] agentscope-ai/agentscope
AgentScope 是一个生产级、易用的 Agent 框架,提供适应不断增长的模型能力的核心抽象,并内置微调支持。设计理念是让越来越像 Agent 的 LLM 发挥最大价值。
- 6.7
Last30Days:跨 9 个平台的 AI Agent 研究技能,一键生成话题深度报告
支持 Reddit、X、YouTube、HN、Polymarket 等 9 个平台的 AI 研究技能,自动采集社区信号并综合生成带引用的深度摘要,GitHub 12K 星
- 8.0
杨植麟/张鹏/夏立雪/罗福莉/黄超,谈龙虾,谈Token经济学
中关村论坛OpenClaw圆桌:月之暗面杨植麟、智谱张鹏、小米罗福莉等五位中国AI一把手,因开源与Token齐聚一堂,探讨Agent时代的商业基础设施。
- 8.0
「龙虾」火热,硬件掘金——华强北的 OpenClaw 消费级硬件热潮
深圳华强北掀起 OpenClaw 硬件热潮,一体机「虾缸」从千元涨到两千;AI眼镜、录音笔、玩偶万物皆可适配龙虾,消费级 AI Agent 硬件生态加速成型。
- 7.0
当数据库的主要用户不再是人类:AI Agent 场景下的架构实践与思考
数据库正从服务人类开发者转向直接服务AI Agent,传统架构假设面临根本性挑战。本文分享AI Agent场景下的数据库架构实践经验与系统性思考。
- 7.0
前阿里千问负责人林俊旸离职首发长文:从推理式思考到智能体思考
原阿里通义千问技术负责人林俊旸辞职后首发长文,系统性复盘推理模型阶段特征,探讨AI未来方向:从训练模型转向训练智能体。
- 8.6
pycoClaw: Run OpenClaw-class agentic workflows locally with Claude Code
在本地运行OpenClaw级智能代理工作流的开源工具
- 8.6
pycoClaw: Run OpenClaw-class agentic workflows locally with Claude Code
在本地运行OpenClaw级智能代理工作流的开源工具
- 7.7
OpenClaw代码越改越崩?新研究EvoClaw揭示:Agents持续开发成功率仅13.37%
新研究EvoClaw揭示AI Agent持续开发成功率仅13.37%,代码库膨胀和早期隐患积累是核心障碍,真实软件开发是时间与复杂度的持久博弈
- 7.0
企业级 Agent 市场落地难:个人龙虾的热闹,为何转化不成采购订单?
Agent 热潮带动模型厂商 Token 消耗巨幅增长,但企业级生产力市场尚未形成规模化采购。核心差距在于安全可追责、流程打通和服务能力三道门槛。
- 7.7
Meta开源KernelEvolve:AI自动写GPU内核,性能提升17倍
Meta开源AI Agent自动生成高性能GPU内核框架,算子优化从2-8周缩短到自动完成
- 6.7
用 Claude 对跨平台移动应用执行 AI 驱动的 QA 测试
开发者记录了通过 Zabriskie 平台使用 Claude 作为 AI Agent 自主执行 Android/iOS 跨平台应用 QA 测试的完整工作流,展示了 AI Agent 理解界面、执行操作并验证结果的能力。