评分 7.0 · 来源:OpenBMB · 发布于 2026-03-22
评分依据:全双工多模态交互是 AI 交互的下一个前沿,9B 参数验证了小模型也能实现这一范式,开源可端侧部署增加了实用价值
要点
OpenBMB 发布 MiniCPM-o 4.5,仅 9B 参数实现了行业首个原生全双工全模态交互模型。与传统「对讲机模式」(用户说完→AI 才开始处理→输出)不同,该模型支持「边看、边听、主动说」——AI 可以在用户说话的同时实时处理视觉和听觉输入,并主动发起对话。
这一突破性的交互范式意味着 AI 助手可以像人类对话一样自然:用户展示一张图片的同时开始描述需求,AI 无需等待完整输入即可开始理解和响应。9B 参数的小体量使其可以在端侧设备部署,为实时多模态交互场景(如 AR 眼镜、智能助手硬件)提供了实用路径。
🤖 AI 点评
全双工多模态交互是当前 AI 交互的下一个前沿。大多数多模态模型仍然是 turn-based——你发一张图、等模型处理、拿结果。MiniCPM-o 4.5 的「边看边听边说」打破了这一限制,其意义不在于 9B 参数的性能有多强,而在于验证了小模型也能实现全双工交互。OpenBMB 团队一直擅长在极小参数量上做技术创新(之前的 MiniCPM-V 也是 8B 级别),这次的方向选择值得注意:不是追求 benchmark 分数,而是追求交互体验的质变。