GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架
2025-01-15 15:07:09 小编:六六导航站
GeneMAN是什么
GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,是用多源高质量人类数据集,包括3D扫描、多视角视频、单张照片和合成数据训练人类特定的2D和3D先验模型。GeneMAN基于几何初始化、雕刻流程和多空间纹理细化技术,实现从自然环境数据图像中提取高质量3D人体模型的目标,不论图像中的人体比例、姿势或服装如何变化。

GeneMAN的主要功能
处理多样化的人体比例:无论图片中的人物是全身、半身还是特写,GeneMAN都能重建出相应的3D模型。适应不同的服装和姿势:GeneMAN能处理各种服装和人体姿势,包括自然姿势和常见物品。处理野外图像:GeneMAN特别擅长处理自然环境下的图像,即所谓的“野外数据”,这些图像可能包含多种复杂背景和光照条件。生成高质量的纹理:基于多空间纹理细化流程,GeneMAN能生成细节丰富、与输入图像一致的3D人体纹理。GeneMAN的技术原理
2D和3D人类先验模型训练:文本到图像扩散模型:训练一个人类特定的文本到图像扩散模型,用在生成2D人类先验。视图条件扩散模型:训练一个视图条件扩散模型,用在生成3D人类先验。几何初始化与雕刻流程:无模板几何初始化:用NeRF(神经辐射场)技术初始化一个无模板的3D几何形状。结合先验与损失:结合GeneMAN的2D和3D先验及结构化差异损失(SDS损失)引导几何初始化。参考损失:用参考损失确保与输入图像的对齐。高分辨率细化:将NeRF转换为DMTet(深度多面体网格)进行高分辨率的几何细化,由预训练的人类特定的法线和深度适应扩散模型引导。多空间纹理细化流程:粗纹理生成:用多视图纹理技术生成粗略的纹理。潜在空间细化:在潜在空间中迭代细化纹理。像素空间细化:基于优化UV图在像素空间中获得详细纹理,用基于2D先验的ControlNet进行优化。GeneMAN的项目地址
项目官网:roooooz.github.io/GeneMANGitHub仓库:https://github.com/roooooz/GeneMAN(即将开源)arXiv技术论文:https://arxiv.org/pdf/2411.18624GeneMAN的应用场景
虚拟试衣:用户上传自己的全身照片,生成3D模型,用于在线试穿服装,提供更真实的试衣体验。游戏和娱乐:在游戏和电影制作中,创建或修改角色模型,提供更个性化和逼真的角色设计。增强现实(AR)和虚拟现实(VR):在AR和VR应用中,生成用户的3D化身,提高沉浸感和交互性。时尚设计:设计师快速将设计草图转换成3D模型,加速设计流程。健身和健康管理:基于分析用户的3D模型,提供个性化的健身指导和健康建议。- 猜你喜欢
-
词魂提示指令
-
ChatGPT Shortcut提示指令
-
Learning Prompt提示指令
-
-
PromptVine提示指令
-
-
-
MJ Prompt Tool提示指令
-
绘AI提示指令
- 相关AI应用
-
AIPRM提示指令
-
Snack Prompt提示指令
-
PublicPrompts提示指令
-
Generrated提示指令
-
LangGPT提示指令
-
AI Short提示指令
-
-
ClickPrompt提示指令
-
PromptHero提示指令
- 推荐AI教程资讯
- GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架
- MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法
- EfficientTAM – Meta AI推出的视频对象分割和跟踪模型
- Amazon Nova – 亚马逊推出的全新大模型系列,覆盖文本、图像、视频生成领域
- HunyuanVideo – 腾讯推出的开源视频生成模型,参数高达130亿
- Lobe Vidol – AI数字人交互平台,可与虚拟人和 3D 模型聊天互动
- GPT学术优化 – 专为学术研究和写作设计的多功能开源项目
- Vanna – 开源AI检索生成框架,自动生成精确的SQL查询
- PersonaCraft – 首尔国立大学推出的单参考图像生成多身份全身图像技术
- StableAnimator – 复旦联合微软等机构推出的端到端身份一致性视频扩散框架