收集全球10,000⁺个好用的AI软件
-
Step-Audio-TTS-3B是什么?一文让你看懂Step-Audio-TTS-3B的技术原理、主要功能、应用场景Step-Audio-TTS-3B概述简介 Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音(TTS)模型,...
-
CLaMP 3是什么?一文让你看懂CLaMP 3的技术原理、主要功能、应用场景CLaMP 3概述简介 CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习,将乐谱(如ABC符...
-
SWE-Lancer是什么?一文让你看懂SWE-Lancer的技术原理、主要功能、应用场景SWE-Lancer概述简介 SWE-Lancer 是 OpenAI 推出的大模型基准测试,评估前沿语言大模型(LLMs)在自由职业软件工程任务中的...
-
DynamicCity是什么?一文让你看懂DynamicCity的技术原理、主要功能、应用场景DynamicCity概述简介 DynamicCity 是上海AI Lab推出的大规模动态场景生成的4D生成框架。DynamicCity 专注于生成...
-
MoBA是什么?一文让你看懂MoBA的技术原理、主要功能、应用场景MoBA概述简介 MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力机制,提高大型语言大模...
-
ToddlerBot是什么?一文让你看懂ToddlerBot的技术原理、主要功能、应用场景ToddlerBot概述简介 ToddlerBot是斯坦福大学开源的用在运动操作的开源机器学习与人形机器人平台,为高效收集大规模、高质量的训练数据设...
-
Phantom是什么?一文让你看懂Phantom的技术原理、主要功能、应用场景Phantom概述简介 Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模...
-
Aider是什么?一文让你看懂Aider的技术原理、主要功能、应用场景Aider概述简介 Aider 是开源的AI辅助编程工具,基于终端与大型语言大模型(LLM)配合,实现高效代码编辑和开发。Aider支持多种编程语言...
-
TongGeometry是什么?一文让你看懂TongGeometry的技术原理、主要功能、应用场景TongGeometry概述简介 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解...
-
Magma是什么?一文让你看懂Magma的技术原理、主要功能、应用场景Magma概述简介 Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解...
-
流畅阅读是什么?一文让你看懂流畅阅读的技术原理、主要功能、应用场景流畅阅读概述简介 流畅阅读(FluentRead)是开源的浏览器翻译插件,致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术,支持多种翻...
-
Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景Muse概述简介 Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WH...
-
HealthGPT是什么?一文让你看懂HealthGPT的技术原理、主要功能、应用场景HealthGPT概述简介 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言大模型(Med-LVLM),...
-
PaliGemma 2 mix是什么?一文让你看懂PaliGemma 2 mix的技术原理、主要功能、应用场景PaliGemma 2 mix概述简介 PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言大模型(VLM)。集成了多种视觉...
-
FlexTok是什么?一文让你看懂FlexTok的技术原理、主要功能、应用场景FlexTok概述简介 FlexTok 是瑞士洛桑联邦理工学院(EPFL)和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列...
-
Helix是什么?一文让你看懂Helix的技术原理、主要功能、应用场景Helix概述简介 Helix 是 Figure 推出的通用视觉-语言-动作(VLA)模型,用于人形机器人的控制。Helix首创性地实现对机器人整个...
-
BioEmu是什么?一文让你看懂BioEmu的技术原理、主要功能、应用场景BioEmu概述简介 BioEmu是微软研究院推出的生成式深度学习系统,高效模拟蛋白质的动态结构和平衡态构象。能在单个GPU上每小时生成数千种蛋白质...
-
OSUM是什么?一文让你看懂OSUM的技术原理、主要功能、应用场景OSUM概述简介 OSUM(Open Speech Understanding Model)是西北工业大学计算机学院音频、语音与语言处理研究组推出的...
-
Crawl4LLM是什么?一文让你看懂Crawl4LLM的技术原理、主要功能、应用场景Crawl4LLM概述简介 Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的智能爬虫系统,提升大语言大模型(LLM)预训练效率。Crawl4...
-
AI co-scientist是什么?一文让你看懂AI co-scientist的技术原理、主要功能、应用场景AI co-scientist概述简介 AI co-scientist 是谷歌推出的多智能体AI系统,作为虚拟科研机器人,协助科研人员搞定各种繁琐的...