Tag: architecture
All the articles with the tag "architecture".
- 6.5
Nautile-370M: Spectral Memory Meets Attention in a Small Reasoning Model
370M 参数小语言模型,混合 SeqCond Attention 层与 transformer 层实现高效推理
- 8.0
Serving the For You feed
Bluesky For You Feed 架构揭秘:单 Go 进程 + SQLite 在客厅 PC 上服务 72,000 用户
- 8.0
The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents
OpenHands Software Agent SDK:生产级软件Agent的可组合可扩展基础架构,覆盖灵活性、安全执行和用户交互三大核心需求。
- 8.5
MCP 正在吃掉你的上下文窗口,CLI 是更简单的方案
Apideck 深度分析 MCP vs CLI 的 token 消耗,CLI 比 MCP 节省 4-32 倍 token
- 7.6
Mamba-3: Improved Sequence Modeling using State Space Principles
Mamba-3 advances performance-efficiency frontier with improved recurrence, complex-valued state updates, and MIMO formulation.
- 7.5
LLM Architecture Gallery——主流大模型架构可视化图谱
Sebastian Raschka 发布 LLM Architecture Gallery,用可视化图表系统梳理 GPT、Llama、Mistral、Gemma 等主流模型的架构差异,是 AI 开发者的高质量参考资源。
- 8.5
LLM 作为计算机——在 Transformer 内部执行程序,推理速度指数级提升
Percepta AI 提出全新架构:将程序直接编码进 Transformer 权重中执行,无需传统计算硬件,推理速度可达指数级加速。Hacker News 排名第一。