收集全球10,000⁺个好用的AI软件
-
Mureka V6是什么?一文让你看懂Mureka V6的技术原理、主要功能、应用场景Mureka V6概述简介 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的IC...
-
Video-T1是什么?一文让你看懂Video-T1的技术原理、主要功能、应用场景Video-T1概述简介 Video-T1 是清华大学和腾讯的开发人员一起推出的视频生成技术,基于测试时扩展(Test-Time Scaling,T...
-
Fin-R1是什么?一文让你看懂Fin-R1的技术原理、主要功能、应用场景Fin-R1概述简介 Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct...
-
Oliva是什么?一文让你看懂Oliva的技术原理、主要功能、应用场景Oliva概述简介 Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强...
-
Qwen2.5-Omni是什么?一文让你看懂Qwen2.5-Omni的技术原理、主要功能、应用场景Qwen2.5-Omni概述简介 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备...
-
Cosmos-Reason1是什么?一文让你看懂Cosmos-Reason1的技术原理、主要功能、应用场景Cosmos-Reason1概述简介 Cosmos-Reason1 是 NVIDIA 推出的系列多模态大型语言大模型,基于物理常识和具身推理理解物理...
-
RF-DETR是什么?一文让你看懂RF-DETR的技术原理、主要功能、应用场景RF-DETR概述简介 RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值(mAP...
-
Bolt3D是什么?一文让你看懂Bolt3D的技术原理、主要功能、应用场景Bolt3D概述简介 Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型...
-
Piece it Together是什么?一文让你看懂Piece it Together的技术原理、主要功能、应用场景Piece it Together概述简介 Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部...
-
TripoSR是什么?一文让你看懂TripoSR的技术原理、主要功能、应用场景TripoSR概述简介 TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量...
-
ModelEngine是什么?一文让你看懂ModelEngine的技术原理、主要功能、应用场景ModelEngine概述简介 ModelEngine 是华为开源的全流程 AI 开发工具链,围绕数据使能、模型使能和应用使能三大核心功能展开,解决...
-
BizGen是什么?一文让你看懂BizGen的技术原理、主要功能、应用场景BizGen概述简介 BizGen是清华大学和微软研究院联合推出的AI信息图生成工具,专注于文章级别的视觉文本渲染。能一键将长篇文章内容转化为专业级...
-
Ideogram 3.0是什么?一文让你看懂Ideogram 3.0的技术原理、主要功能、应用场景Ideogram 3.0概述简介 Ideogram 3.0 是Ideogram推出的 AI 图像生成模型。Ideogram 3.0在图像生成质量上实...
-
QVQ-Max是什么?一文让你看懂QVQ-Max的技术原理、主要功能、应用场景QVQ-Max概述简介 QVQ-Max 是阿里通义推出的视觉推理模型,是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视...
-
TxGemma是什么?一文让你看懂TxGemma的技术原理、主要功能、应用场景TxGemma概述简介 TxGemma 是谷歌推出的用于药物发现的通用人工智能模型,通过 AI 技术加速药物研发进程。基于 Google 的 Gem...
-
TripoSG是什么?一文让你看懂TripoSG的技术原理、主要功能、应用场景TripoSG概述简介 TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型...
-
TripoSF是什么?一文让你看懂TripoSF的技术原理、主要功能、应用场景TripoSF概述简介 TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex...
-
DistilQwen2.5-R1是什么?一文让你看懂DistilQwen2.5-R1的技术原理、主要功能、应用场景DistilQwen2.5-R1概述简介 DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B...
-
PaddleSpeech是什么?一文让你看懂PaddleSpeech的技术原理、主要功能、应用场景PaddleSpeech概述简介 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识...
-
ChatAnyone是什么?一文让你看懂ChatAnyone的技术原理、主要功能、应用场景ChatAnyone概述简介 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的...