功能

首页 > 功能

BALROG是什么？一文让你看懂BALROG的技术原理、主要功能、应用场景

BALROG概述简介 BALROG是评估大型语言大模型（LLMs）和视觉语言大模型（VLMs）在游戏上的推理能力，特别是模型在动态环境中的规划、空间...
AutoVFX是什么？一文让你看懂AutoVFX的技术原理、主要功能、应用场景

AutoVFX概述简介 AutoVFX是先进的物理特效框架，是伊利诺伊大学香槟分校研究团队推出的，能根据自然语言指令自动创建真实感和动态的视觉特效（...
Markdown-to-Image是什么？一文让你看懂Markdown-to-Image的技术原理、主要功能、应用场景

Markdown-to-Image概述简介 Markdown-to-Image是开源的Markdown 转海报编辑器，作为React组件能将Mark...
TÜLU 3是什么？一文让你看懂TÜLU 3的技术原理、主要功能、应用场景

TÜLU 3概述简介 TÜLU 3是艾伦人工智能研究所（Ai2）推出的一系列开源指令遵循模型，包括8B和70B两个版本，未来计划推出405B版本。模...
EchoMimicV2是什么？一文让你看懂EchoMimicV2的技术原理、主要功能、应用场景

EchoMimicV2概述简介 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目，基于参考图片、音频剪辑和手部姿势序列生成高质量动画...
FlipSketch是什么？一文让你看懂FlipSketch的技术原理、主要功能、应用场景

FlipSketch概述简介 FlipSketch 是萨里大学推出的创新系统，能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现：微调草...
DELIFT是什么？一文让你看懂DELIFT的技术原理、主要功能、应用场景

DELIFT概述简介 DELIFT（Data Efficient Language model Instruction Fine-Tuning）是基...
HART是什么？一文让你看懂HART的技术原理、主要功能、应用场景

HART概述简介 HART（Hybrid Autoregressive Transformer）是麻省理工学院研究团队推出的自回归视觉生成模型。能直...
WebDreamer是什么？一文让你看懂WebDreamer的技术原理、主要功能、应用场景

WebDreamer概述简介 WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体，基于大型语言大模型（LLM...
Kandinsky-3是什么？一文让你看懂Kandinsky-3的技术原理、主要功能、应用场景

Kandinsky-3概述简介 Kandinsky-3是基于潜在扩散模型的文本到图像（T2I）生成框架，支持高质量和逼真度在图像合成。Kandins...
CAVIA是什么？一文让你看懂CAVIA的技术原理、主要功能、应用场景

CAVIA概述简介 CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架，能将单一输入图像转换成多个时空一致的视频序列。框...
Flex3D是什么？一文让你看懂Flex3D的技术原理、主要功能、应用场景

Flex3D概述简介 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架，能基于任意数量的高质量输入视图，解决从...
EvolveDirector是什么？一文让你看懂EvolveDirector的技术原理、主要功能、应用场景

EvolveDirector概述简介 EvolveDirector是阿里巴巴和南洋理工大学联合推出的创新框架，用公开资源和高级模型的API接口训练一...
MCP是什么？一文让你看懂MCP的技术原理、主要功能、应用场景

MCP概述简介 MCP（Model Context Protocol，模型上下文协议）是一个开放协议，是Anthropic开源的，能实现大型语言大模...
LazyGraphRAG是什么？一文让你看懂LazyGraphRAG的技术原理、主要功能、应用场景

LazyGraphRAG概述简介 LazyGraphRAG是微软研究院推出的图形增强生成增强检索（RAG）框架，是GraphRAG的迭代版本。Laz...
LEOPARD是什么？一文让你看懂LEOPARD的技术原理、主要功能、应用场景

LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型，专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
书生InternThinker是什么？一文让你看懂书生InternThinker的技术原理、主要功能、应用场景

书生InternThinker概述简介书生InternThinker是上海人工智能实验室推出的强推理模型，具备自主生成高智力密度数据和元动作思考能...
Pangea是什么？一文让你看懂Pangea的技术原理、主要功能、应用场景

Pangea概述简介 Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言大模型（LLM），能提升全球语言和文化多样性的覆盖。模型包含600万...
MobA是什么？一文让你看懂MobA的技术原理、主要功能、应用场景

MobA概述简介 MobA（Mobile Agent）是上海交通大学团队推出的新型移动智能体，基于多模态大型语言大模型（MLLMs）提升移动设备的自...
Frames是什么？一文让你看懂Frames的技术原理、主要功能、应用场景

Frames概述简介 Frames是Runway推出的最新AI图像生成模型，在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性，支...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL