🚀 创新设计: DocLLM采用分离的空间注意机制,专注于边界框信息,解决文本和空间模态交汇处的复杂语义问题。
阿里AI项目DreamTalk开源
据了解,Zara的这场直播一改传统直播间的紧凑,而是将整个秀场搬到了直播间,用户不仅可以看到Zara以T台走秀的形式演绎讲解多款Zara秋冬新品,还可以看到模特更换妆造、摄影师跟拍这些镜头外的场景,沉浸感拉满。
**划重点:**论文地址:https://aclanthology.org/2023.findings-emnlp.157.pdf
🚀 创新设计: DocLLM采用分离的空间注意机制,专注于边界框信息,解决文本和空间模态交汇处的复杂语义问题。
阿里AI项目DreamTalk开源
据了解,Zara的这场直播一改传统直播间的紧凑,而是将整个秀场搬到了直播间,用户不仅可以看到Zara以T台走秀的形式演绎讲解多款Zara秋冬新品,还可以看到模特更换妆造、摄影师跟拍这些镜头外的场景,沉浸感拉满。
**划重点:**论文地址:https://aclanthology.org/2023.findings-emnlp.157.pdf