DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架-六六导航站

DreamFit – 字节联合清华和中山大学推出的虚拟试衣框架

2025-05-15 13:58:27 小编：六六导航站

DreamFit是什么

DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架，专门用在轻量级服装为中心的人类图像生成。框架能显著减少模型复杂度和训练成本，基于优化文本提示和特征融合，提高生成图像的质量和一致性。DreamFit能泛化到各种服装、风格和提示指令，生成高质量的人物图像。DreamFit支持与社区控制插件的无缝集成，降低使用门槛。

DreamFit的主要功能

即插即用：易于与社区控制插件集成，降低使用门槛。高质量生成：基于大型多模态模型丰富提示，生成高一致性的图像。姿势控制：支持指定人物姿势，生成符合特定姿势的图像。多主题服装迁移：将多个服装元素组合到一张图像中，适用于电商服装展示等场景。

DreamFit的技术原理

轻量级编码器（Anything-Dressing Encoder）：基于 LoRA 层，将预训练的扩散模型（如 Stable Diffusion 的 UNet）扩展为轻量级的服装特征提取器。只训练 LoRA 层，而不是整个 UNet，大大减少模型复杂度和训练成本。自适应注意力（Adaptive Attention）：引入两个可训练的线性投影层，将参考图像特征与潜在噪声对齐。基于自适应注意力机制，将参考图像特征无缝注入 UNet，确保生成的图像与参考图像高度一致。预训练的多模态模型（LMMs）：在推理阶段，用 LMMs 重写用户输入的文本提示，增加对参考图像的细粒度描述，减少训练和推理阶段的文本提示差异。

DreamFit的项目地址

GitHub仓库：https://github.com/bytedance/DreamFitarXiv技术论文：https://arxiv.org/pdf/2412.17644

DreamFit的应用场景

虚拟试穿：消费者在线上虚拟试穿服装，节省时间和成本，提升购物体验。服装设计：设计师快速生成服装效果图，加速设计流程，提高工作效率。个性化广告：根据用户偏好生成定制化广告，提高广告吸引力和转化率。虚拟现实（VR）/增强现实（AR）：提供虚拟试穿体验，增强用户沉浸感和互动性。社交媒体内容创作：生成个性化图像，吸引更多关注，提升内容的多样性和吸引力。