评分 6.6 · 来源:TechCrunch · 发布于 2026-03-26
评分依据:开源可自托管的2B参数多语言转写模型,填补了轻量级本地部署的空白
要点
Cohere发布一款开源语音模型,专门针对语音转写任务设计。模型参数量仅20亿,相对轻量,可在消费级GPU上运行,适合需要自托管语音转写能力的开发者和企业。
该模型目前支持14种语言,填补了开源领域在多语言语音转写方面的空白。对于需要处理多语种音频数据但受限于预算或数据隐私要求的团队,这是一个实用的选择。
🤖 AI 点评
在Whisper统治开源语音转写领域许久之后,Cohere的加入增加了竞争选择。2B参数和消费级GPU的可部署性是关键卖点——对于需要在本地处理敏感音频(如医疗、法律场景)的团队,这比调用云端API更有吸引力。不过文章未提及基准测试数据,实际效果是否匹敌Whisper还有待验证。