Muse – 微软研究院推出的生成式AI模型
2025-03-17 10:01:20 小编:六六导航站
Muse是什么
Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的主要功能
生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。Muse的技术原理
VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。Muse的项目地址
项目官网:https://www.microsoft.com/en-us/research/blog/introducing-museHuggingFace模型库:https://huggingface.co/microsoft/wham技术论文:https://www.nature.com/articles/s41586-025-08600-3Muse的应用场景
游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。- 猜你喜欢
-
MusicTGA-HR提示指令
-
RappingAI提示指令
-
Boomy提示指令
-
TwoShot提示指令
-
Weet提示指令
-
Muzaic Studio提示指令
-
-
HookGen提示指令
-
DadaBots提示指令
- 相关AI应用
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
-
Cosonify提示指令
-
Musico提示指令
- 推荐AI教程资讯
- Muse – 微软研究院推出的生成式AI模型
- HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型
- PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型
- FlexTok – Apple 联合 EPFL 推出的图像处理技术
- Helix – Figure 推出的端到端通用控制模型
- BioEmu – 微软推出的生成式深度学习系统
- OSUM – 西北工业大学开源的语音理解模型
- Crawl4LLM – 清华和卡内基梅隆大学联合开源的智能爬虫系统
- AI co-scientist – 谷歌推出多智能体协作的 AI 科研助手
- 协和·太初 – 北京协和与中科院共同推出的罕见病领域AI大模型
- 精选推荐
-
元典智库2024-12-31法律助手
-
WiziShop2025-02-02法律助手
-
Endel2025-02-25提示指令
-
Voice.ai2025-02-14提示指令
-
Awesome ChatGPT Prompts2025-01-02提示指令
-
Co-Writer AI2025-02-12法律助手