Skip to content
星际流动

D-ID 发布 V4 表情化视觉 Agent,实时 LLM 对话延迟低至 0.5 秒

发布
采集
工程实践 7.2 分 — 企业级 AI 数字人技术突破,实时对话延迟达到 0.5 秒以下,成本优势明显,但应用场景相对垂直
原文: PR Newswire

评分 7.2 · 来源:PR Newswire · 发布于 2026-03-16

评分依据:企业级数字人技术在实时性和成本上取得突破,但属于垂直应用领域

要点

D-ID 发布 V4 Expressive Visual Agents,这是新一代超高保真数字人,专为实时 LLM 对话和企业长视频内容设计。

核心技术突破:

企业应用场景:

商业数据:

🤖 AI 点评

数字人技术从「生成短视频」进化到「实时对话界面」是个关键转折——这意味着 AI 不再只是内容生产工具,而是开始成为人机交互的视觉层。D-ID 的成本优势(70 倍差距)和企业客户基础让它在这个赛道上占据先机,尤其是培训、客服这类需要「人脸」但不需要真人的场景。

值得关注的是「情感自适应」能力——LLM 输出的情感标签能实时驱动表情变化,这比静态数字人更接近真实对话体验。但问题是:用户真的需要一个「有表情的 AI」吗?还是说文字/语音界面已经足够?这可能取决于具体场景——客服和培训可能需要,纯工具类交互可能不需要。


标签: