D-ID 发布 V4 表情化视觉 Agent，实时 LLM 对话延迟低至 0.5 秒

评分 7.2 · 来源：PR Newswire · 发布于 2026-03-16

评分依据：企业级数字人技术在实时性和成本上取得突破，但属于垂直应用领域

要点

D-ID 发布 V4 Expressive Visual Agents，这是新一代超高保真数字人，专为实时 LLM 对话和企业长视频内容设计。

核心技术突破：

企业应用场景：

商业数据：

数字人技术从「生成短视频」进化到「实时对话界面」是个关键转折——这意味着 AI 不再只是内容生产工具，而是开始成为人机交互的视觉层。D-ID 的成本优势（70 倍差距）和企业客户基础让它在这个赛道上占据先机，尤其是培训、客服这类需要「人脸」但不需要真人的场景。

值得关注的是「情感自适应」能力——LLM 输出的情感标签能实时驱动表情变化，这比静态数字人更接近真实对话体验。但问题是：用户真的需要一个「有表情的 AI」吗？还是说文字/语音界面已经足够？这可能取决于具体场景——客服和培训可能需要，纯工具类交互可能不需要。