Skip to content
星际流动

LumosX: 多身份一致性与属性对齐的个性化视频生成

发布
采集
学术前沿 6.8 分 — ICLR 2026 Camera Ready,解决个性化视频生成中身份-属性对齐的核心难题,新注意力机制有技术深度,附带开源代码和数据基准
原文: arXiv

评分 6.8 · 来源:arXiv · 发布于 2026-03-20

评分依据:ICLR 2026 Camera Ready,解决个性化视频生成中身份-属性对齐的核心难题,新注意力机制有技术深度,附带开源代码和数据基准

核心问题

扩散模型推动了个性化视频生成,但多主体场景中精确的面部-属性对齐仍然困难:现有方法缺乏显式机制确保群组内部一致性,不同主体间的身份特征和属性容易混淆。

方法:LumosX

LumosX 同时改进数据侧和模型侧:

数据侧

模型侧

效果

在自建基准上达到 SOTA,在细粒度、身份一致且语义对齐的多主体个性化视频生成任务上表现优异。

开源

代码和模型已公开:https://jiazheng-xing.github.io/lumosx-home/

收录:ICLR 2026 Camera Ready


标签: