Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Muse概述简介

Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的功能特色

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。

支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。

持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。

创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。

Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。

自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。

训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse项目介绍

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-muse

HuggingFace模型库:https://huggingface.co/microsoft/wham

技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse能做什么?

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。

自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。

内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。

玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。

AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • CV Blurb
    CV Blurb CV Blurb是一款由AI驱动的产品,帮助用户将简历转化为精炼而有吸引力的摘要。它能够帮助用户快速生成专业的简历摘要,减少招聘人员的时间成本,并确保...
  • keychain
    keychain KeyChain是一个尖端平台,将食品和饮料品牌与顶级制造商联系起来。通过利用AI驱动的数据,KeyChain有助于简化找到完美的制造合作伙伴的过程,...
  • GPTForm
    GPTForm GPTForm.ai是一个由ChatGPT驱动的即时在线表单和调查生成器。您可以在几秒钟内创建完全功能的表单,根据您的特定需求进行定制。GPTForm...
  • stack ai
    stack ai 引入堆栈AI,这是用于在几分钟内创建AI应用程序的无代码平台。有了保证的高速和可靠性,可以为直观的AI解决方案和应用程序构建提供自定义的大语言模型(L...
  • tryEmoji
    tryEmoji tryEmoji是一款基于AI技术的产品,能够将表情符号转换为惊人的艺术品。通过Lepton AI技术的支持,用户可以将普通的表情符号转化为令人惊叹的...
  • Chatmyer
    Chatmyer Chatmyer是一个轻量且快速的免费网站聊天工具,可与客户实时连接,提高转化率。它是一个全方位的375解决方案,通过在线实时聊天和智能聊天机器人,帮...
  • Social Scanner
    Social Scanner Social Scanner是一个扫描LinkedIn个人资料并根据资料详情提供即时见解和个性化消息建议的插件。它可以帮助销售人员、招聘人员和任何希望...
  • saga
    saga 用传奇(Saga)改造您的讲故事,这是电影制片人的最终生成的AI工具。制作专业电影脚本,并毫不费力地创建令人惊叹的故事板图像,从而增强您的讲故事。有了...