收集全球10,000⁺个好用的AI软件
-
PartEdit是什么?一文让你看懂PartEdit的技术原理、主要功能、应用场景PartEdit概述简介 PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记(称为“部分...
-
Agentic Object Detection是什么?一文让你看懂Agentic Object Detection的技术原理、主要功能、应用场景Agentic Object Detection概述简介 Agentic Object Detection 是吴恩达团队开发的新型目标检测技术,通过...
-
Agno是什么?一文让你看懂Agno的技术原理、主要功能、应用场景Agno概述简介 Agno是构建智能代理(Agents)的轻量级框架。Agno 支持多模态(文本、图像、音频、视频)和多代理协作,能快速创建代理,速...
-
Ola是什么?一文让你看懂Ola的技术原理、主要功能、应用场景Ola概述简介 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言大模型。通过渐进式模态对齐策略,逐...
-
AlphaGeometry2是什么?一文让你看懂AlphaGeometry2的技术原理、主要功能、应用场景AlphaGeometry2概述简介 AlphaGeometry2 是谷歌 DeepMind 推出的先进的人工智能系统,专门用于解决国际数学奥林匹克...
-
EliGen是什么?一文让你看懂EliGen的技术原理、主要功能、应用场景EliGen概述简介 EliGen是浙江大学和阿里集团联合开发的新型的实体级可控图像生成框架,通过引入区域注意力机制,无需额外参数即可将实体提示和任...
-
Hibiki是什么?一文让你看懂Hibiki的技术原理、主要功能、应用场景Hibiki概述简介 Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型,能实时将一种语言的语音翻译成另一种语言的语音或文本。H...
-
HMA是什么?一文让你看懂HMA的技术原理、主要功能、应用场景HMA概述简介 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的...
-
DeepRant 鲸喷是什么?一文让你看懂DeepRant 鲸喷的技术原理、主要功能、应用场景DeepRant 鲸喷概述简介 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交...
-
StochSync是什么?一文让你看懂StochSync的技术原理、主要功能、应用场景StochSync概述简介 StochSync(Stochastic Diffusion Synchronization)是创新的图像生成技术,专门...
-
Sonic是什么?一文让你看懂Sonic的技术原理、主要功能、应用场景Sonic概述简介 Sonic是腾讯和浙江大学推出的音频驱动肖像动画框架,基于全局音频感知生成逼真的面部表情和动作。Sonic基于上下文增强音频学习...
-
FireRedASR是什么?一文让你看懂FireRedASR的技术原理、主要功能、应用场景FireRedASR概述简介 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR...
-
MVoT是什么?一文让你看懂MVoT的技术原理、主要功能、应用场景MVoT概述简介 MVoT(Multimodal Visualization-of-Thought)是微软研究院、剑桥大学语言技术实验室、中国科学院...
-
DynVFX是什么?一文让你看懂DynVFX的技术原理、主要功能、应用场景DynVFX概述简介 DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉...
-
WorldSense是什么?一文让你看懂WorldSense的技术原理、主要功能、应用场景WorldSense概述简介 WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言大模型(MLLMs)在现实世界场景中对视觉、听...
-
Kiln AI是什么?一文让你看懂Kiln AI的技术原理、主要功能、应用场景Kiln AI概述简介 Kiln AI是开源的 AI 开发工具,能简化大型语言大模型(LLM)的微调、合成数据生成和数据集协作。Kiln AI提供直...
-
Airweave是什么?一文让你看懂Airweave的技术原理、主要功能、应用场景Airweave概述简介 Airweave 是开源工具,能将任何应用程序的数据(包括API、数据库、网站等)同步到图数据库和向量数据库中,让数据能基...
-
MotionCanvas是什么?一文让你看懂MotionCanvas的技术原理、主要功能、应用场景MotionCanvas概述简介 MotionCanvas是香港中文大学、Adobe 研究院和莫纳什大学推出的图像到视频(I2V)生成方法,能将静态...
-
MedRAX是什么?一文让你看懂MedRAX的技术原理、主要功能、应用场景MedRAX概述简介 MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理...
-
LangBot是什么?一文让你看懂LangBot的技术原理、主要功能、应用场景LangBot概述简介 LangBot 是开源的即时聊天机器人平台,支持多平台(如 QQ、微信、飞书、Discord 等)和多种大语言大模型(如 C...