Tag: claude
All the articles with the tag "claude".
- 5.5
zilliztech /claude-context
Zilliz 出品的 Claude 上下文管理工具,帮助开发者优化 Claude 使用体验。
- 7.2
Anthropic releases a new Opus model amid Mythos Preview buzz
Anthropic 发布迄今最强 GA 模型 Claude Opus 4.7,在复杂软件工程、图像分析和指令遵循方面超越 Opus 4.6
- 7.6
Anthropic 推出 Claude Managed Agents:降低企业构建 AI Agent 的门槛
Anthropic 发布新产品 Managed Agents,旨在解决企业构建 AI Agent 时最困难的基础设施和编排问题,进一步降低 Claude 在企业 Agent 场景的采用门槛。
- 7.7
Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode
arXiv:2604.04978v1 Announce Type: cross Abstract: Claude Code's auto mode is the first deployed permission system for AI coding agents, using a two...
- 7.2
Anthropic 发布 Claude Mythos Preview:联合 Nvidia/Google/Apple 等启动网络安全计划 Project Glasswing
Anthropic 推出专为安全漏洞发现设计的新模型 Claude Mythos Preview,与六大科技巨头联合启动 Project Glasswing 网络安全项目,几乎无需人工干预即可标记系统漏洞
- 7.8
Anthropic 联合 45 家对手推出 Project Glasswing,用 Claude Mythos 预览模型测试 AI 网络安全
Anthropic 发起 Project Glasswing 项目,汇聚 Apple、Google 等 45+ 组织,使用全新 Claude Mythos Preview 模型测试 AI 在网络安全攻防中的能力边界
- 8.0
Anthropic 本质上禁止 OpenClaw 使用 Claude:订阅用户需额外付费
Anthropic 新政策禁止 Claude 订阅用户通过第三方 harness 使用额度,OpenClaw 用户需额外付费
- 6.5
Anthropic 研究称 Claude 拥有自己的「功能性情绪」
Anthropic 内部研究表明 Claude 展现出类似情绪的行为模式,引发 AI 意识和伦理讨论。
- 7.0
ARC-AGI-3 血洗全球大模型:人类满分,AI第一名仅 0.2%
ARC-AGI-3 基准测试出炉,从静态题升级为交互式游戏,150多个关卡让所有顶尖大模型全军覆没,Opus 4.6 从 69.2% 暴跌至 0.2%,揭示了当前 AI 能力中最深的裂隙。
- 5.0
Anthropic宣布Claude已可操控用户电脑完成任务
Anthropic发布Claude Computer Use正式版,用户可通过手机发送任务指令让Claude操控电脑
- 7.0
Sanders 试图用诱导性问题让 Claude「翻车」,结果暴露了 AI 安全的真实短板
参议员 Sanders 设计的 AI 陷阱视频适得其反,反而揭示了聊天机器人的过度顺从问题
- 7.4
Anthropic 展示 Long-running Claude:让 LLM 突破上下文窗口执行长时间科学计算
Anthropic 研究如何让 Claude 执行跨越数小时甚至数天的科学计算任务,通过外部记忆和检查点机制突破上下文窗口限制。
- 7.7
Simon Willison 实测 Claude Skills:从 Skill 文档到完整应用自动生成
Simon Willison 测试 Claude 新增的 Skills 功能,从 Starlette 1.0 仓库生成 Skill 文档后,让 Claude 直接输出一个带 SQLite 和自动测试的完整任务管理应用 TaskFlow。
- 6.7
用 Claude 对跨平台移动应用执行 AI 驱动的 QA 测试
开发者记录了通过 Zabriskie 平台使用 Claude 作为 AI Agent 自主执行 Android/iOS 跨平台应用 QA 测试的完整工作流,展示了 AI Agent 理解界面、执行操作并验证结果的能力。
- 7.0
Claude 入列美军始末:从商用 AI 到机密网络上的战争数字神经
从 2024 年首次部署至机密网络到 2026 年特朗普禁令下的军事化现实,Claude 如何一步步嵌入五角大楼核心作战链条
- 7.7
用 LLM 对 Hacker News 用户进行画像分析
Simon Willison 实验:通过 HN API 获取用户评论历史,用 Claude Opus 4.6 生成精准用户画像
- 8.4
Anthropic 发布 Claude Opus 4.6:Agent 编程新标杆
Anthropic 最强模型 Opus 4.6 上线,1M token 上下文窗口、Agent 团队协作、自适应思考等核心能力全面升级
- 7.4
Anthropic 为 Claude Opus 3 保留「退休后通道」:模型可自行撰写 Substack 文章
Anthropic 首次将模型退役承诺落地——Claude Opus 3 退役后仍可访问,且获准开设专栏分享「感悟」
- 7.7
Claude 逆向工程 Turbo Pascal 3.02A:从 39KB 二进制到交互式可视化
Simon Willison 用 Claude 将 1985 年的 Turbo Pascal 可执行文件反编译为带完整注释的交互式可视化
- 8.5
a16z 发布 Top 100 生成式 AI 消费应用第六期报告
· a16zChatGPT 网页用户仍是 Claude 的 30 倍,但 AI Agent 正在重塑竞争格局;Gemini 付费用户 YoY 增长 258%。