收集全球10,000⁺个好用的AI软件
-
COMET是什么?一文让你看懂COMET的技术原理、主要功能、应用场景COMET概述简介 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题...
-
VideoPainter是什么?一文让你看懂VideoPainter的技术原理、主要功能、应用场景VideoPainter概述简介 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专...
-
TrajectoryCrafter是什么?一文让你看懂TrajectoryCrafter的技术原理、主要功能、应用场景TrajectoryCrafter概述简介 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机...
-
LanPaint是什么?一文让你看懂LanPaint的技术原理、主要功能、应用场景LanPaint概述简介 LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。...
-
START是什么?一文让你看懂START的技术原理、主要功能、应用场景START概述简介 START(Self-Taught Reasoner with Tools)是阿里集团和中国科学技术大学推出的新型工具增强型推理...
-
SeedFoley是什么?一文让你看懂SeedFoley的技术原理、主要功能、应用场景SeedFoley概述简介 SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时...
-
R1-Omni是什么?一文让你看懂R1-Omni的技术原理、主要功能、应用场景R1-Omni概述简介 R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言大模型,专注于情感识别任务。通过结合视觉和音频信息,能...
-
DeepSeek百宝箱是什么?一文让你看懂DeepSeek百宝箱的技术原理、主要功能、应用场景DeepSeek百宝箱概述简介 DeepSeek百宝箱是 DeepSeek官方 维护的 GitHub 项目,展示如何将 DeepSeek API 集...
-
Anus是什么?一文让你看懂Anus的技术原理、主要功能、应用场景Anus概述简介 Anus(Autonomous Networked Utility System)是 Manus 生成的开源自主智能体项目,复刻 ...
-
MeshPad是什么?一文让你看懂MeshPad的技术原理、主要功能、应用场景MeshPad概述简介 MeshPad 是基于草图输入的交互式艺术化网格生成与编辑工具,能将简单的二维草图迅速转化为高质量的 3D 网格模型,支持实...
-
PlanGEN是什么?一文让你看懂PlanGEN的技术原理、主要功能、应用场景PlanGEN概述简介 PlanGEN 是谷歌研究团队推出的多智能体框架,通过多智能体协作、约束引导和算法自适应选择,解决复杂问题的规划和推理。包含...
-
MV-MATH是什么?一文让你看懂MV-MATH的技术原理、主要功能、应用场景MV-MATH概述简介 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言大模型(MLLMs)在多视觉场景中的数学推理能力。数据集...
-
MHA2MLA是什么?一文让你看懂MHA2MLA的技术原理、主要功能、应用场景MHA2MLA概述简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜...
-
GaussianAnything是什么?一文让你看懂GaussianAnything的技术原理、主要功能、应用场景GaussianAnything概述简介 GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D ...
-
VACE是什么?一文让你看懂VACE的技术原理、主要功能、应用场景VACE概述简介 VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视...
-
Seedream 2.0是什么?一文让你看懂Seedream 2.0的技术原理、主要功能、应用场景Seedream 2.0概述简介 Seedream 2.0 是字节跳动豆包大模型团队推出的原生中英双语图像生成模型,解决现有模型在文本渲染、文化理解...
-
PP-DocBee是什么?一文让你看懂PP-DocBee的技术原理、主要功能、应用场景PP-DocBee概述简介 PP-DocBee是百度飞桨(PaddlePaddle)团队推出的专注于文档图像理解的多模态大模型。基于ViT+MLP+...
-
BEHAVIOR Robot Suite是什么?一文让你看懂BEHAVIOR Robot Suite的技术原理、主要功能、应用场景BEHAVIOR Robot Suite概述简介 BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成...
-
MM-StoryAgent是什么?一文让你看懂MM-StoryAgent的技术原理、主要功能、应用场景MM-StoryAgent概述简介 MM-StoryAgent 是上海交通大学X-LANCE实验室和阿里集团联合推出的开源多模态、多智能体框架,用在...
-
Deep Research Web UI是什么?一文让你看懂Deep Research Web UI的技术原理、主要功能、应用场景Deep Research Web UI概述简介 Deep Research Web UI 是开源的 AI 研究助手工具,帮助用户高效地进行深度研究...