DynamicFace – 小红书联合上海交大等推出的视频换脸技术-六六导航站

DynamicFace – 小红书联合上海交大等推出的视频换脸技术

2025-03-24 13:56:37 小编：六六导航站

DynamicFace是什么

DynamicFace是小红书团队推出新型的视频换脸技术，技术通过结合扩散模型和即插即用的时间层，基于3D面部先验知识，实现高质量和一致性的视频换脸效果。 DynamicFace的核心在于引入了四种精细的面部条件：背景、形状感知的法线图、表情相关的地标和去除身份信息的UV纹理图。这些条件相互独立，能提供精确的运动和身份信息。还采用了Face Former和ReferenceNet进行身份注入，确保在不同表情和姿态下保持身份一致性。

DynamicFace的主要功能

精细的面部条件分解：DynamicFace基于3D面部先验知识，将面部分解为四种精细的条件，包括背景、形状感知的法线图、表情相关的地标和去除身份信息的UV纹理图。能为换脸提供精确的指导。身份注入与一致性：通过Face Former和ReferenceNet模块，DynamicFace能在不同的表情和姿态下保持身份一致性，确保换脸后的人脸身份与源图像高度一致。时间一致性与视频换脸：引入了时间注意力层，能有效解决视频换脸中的时间一致性问题，使换脸后的视频在不同帧之间保持连贯。高质量图像生成：DynamicFace基于扩散模型（diffusion model），能生成高分辨率和高质量的换脸图像，同时保留目标图像的表情、姿态和背景等细节。广泛的适用性：DynamicFace适用于静态图像换脸，能扩展到视频领域，适用于人像重演、影视制作和虚拟现实等多种应用场景。

DynamicFace的技术原理

扩散模型与潜空间生成：DynamicFace基于扩散模型（Diffusion Model）来生成高质量的图像。扩散模型通过逐步逆转一个加噪过程来生成图像。3D面部先验与解耦条件：引入了四种基于3D面部先验的精细条件：背景、形状感知的法线图、表情相关的地标图和去除身份信息的UV纹理图。身份注入模块：DynamicFace采用Face Former和ReferenceNet进行身份注入。Face Former提供高层次的身份特征，ReferenceNet注入详细的纹理信息。两个模块确保在不同表情和姿态下保持身份一致性。时间一致性模块：为了实现视频换脸中的时间一致性，DynamicFace引入了时间注意力层。能确保生成的视频在不同帧之间保持连贯，避免出现跳变或不自然的过渡。多条件引导机制：DynamicFace通过多条件引导机制（Mixture-of-Guiders）来精确控制面部的运动和外观。能更好地保留目标面部的表情、姿态和光照等非身份属性。

DynamicFace的项目地址

项目官网：https://dynamic-face.github.ioarXiv技术论文：https://arxiv.org/pdf/2501.08553v1

DynamicFace的应用场景

影视制作：DynamicFace可用于影视后期制作，快速替换演员的面部表情或身份，节省重拍成本，提高制作效率。人像重演与虚拟现实：在人像重演领域，DynamicFace能将一个人的面部表情和姿态转移到另一个人的脸上，实现高度逼真的效果。社交媒体与内容创作：DynamicFace可以帮助创作者在社交媒体上制作有趣、个性化的短视频和图像内容。用户可以将自己的面部特征替换到明星或名人的图像上，生成有趣的创意视频。虚拟会议与直播：用户可以通过虚拟摄像头在直播或虚拟会议中实时替换面部，为观众带来全新的视觉体验。个人娱乐与创意：用户可以将自己的脸替换到各种有趣的情境中，生成个性化的表情包或创意视频。