印度 AI 公司 Sarvam AI 宣布开源两个推理模型:Sarvam 30B 和 Sarvam 105B,均从零开始训练,使用内部策划的大规模数据集,重点支持 22 种印度语言(含手写体、混合语码等)。
这是印度”主权 AI”战略的重要里程碑之一,也是目前最大规模的印地语系开源推理模型发布。
产品矩阵
除推理模型外,Sarvam AI 还拥有:
- Bulbul(TTS):支持 11 种印度语言、39 种发音人
- Saaras(STT):支持全部 22 种法定语言,含 8kHz 电话音频
- Vision(文档理解):支持 22+ 种印度语言手写文本
- osmAgent/osmAPI:基于 Sarvam 105B 的 Agent 框架
挑战
Inc42 的报道指出,早期开发者反馈显示工具链支持不足、与现有生态集成摩擦较大。面对来自 GPT/Gemini 生态的竞争压力,Sarvam 模型的差异化优势集中在本地语言和文化语境理解,而非通用能力。
这一动态值得关注——语言本土化正成为新一轮 AI 地缘政治竞争的关键维度。