收集全球10,000⁺个好用的AI软件
-
SlideChat是什么?一文让你看懂SlideChat的技术原理、主要功能、应用场景SlideChat概述简介 SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的,首个能理解千兆像素级别全切片图像的视觉语言助手。...
-
Fugatto是什么?一文让你看懂Fugatto的技术原理、主要功能、应用场景Fugatto概述简介 Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为”Foundational Generative Au...
-
LongRAG是什么?一文让你看懂LongRAG的技术原理、主要功能、应用场景LongRAG概述简介 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架...
-
Illustrious是什么?一文让你看懂Illustrious的技术原理、主要功能、应用场景Illustrious概述简介 Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大...
-
aisuite是什么?一文让你看懂aisuite的技术原理、主要功能、应用场景aisuite概述简介 aisuite是开源的Python库,吴恩达(Andrew Ng)发布的,旨在提供一个统一的接口来调用多个大型语言大模型(L...
-
XGrammar是什么?一文让你看懂XGrammar的技术原理、主要功能、应用场景XGrammar概述简介 XGrammar是由陈天奇团队推出的开源软件库,能为大型语言大模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基...
-
Edify 3D是什么?一文让你看懂Edify 3D的技术原理、主要功能、应用场景Edify 3D概述简介 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify...
-
SongCreator是什么?一文让你看懂SongCreator的技术原理、主要功能、应用场景SongCreator概述简介 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐...
-
Teacher2Task是什么?一文让你看懂Teacher2Task的技术原理、主要功能、应用场景Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式...
-
DynaSaur是什么?一文让你看懂DynaSaur的技术原理、主要功能、应用场景DynaSaur概述简介 DynaSaur是Adobe Research推出的大型语言大模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动...
-
Takin AudioLLM是什么?一文让你看懂Takin AudioLLM的技术原理、主要功能、应用场景Takin AudioLLM概述简介 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin ...
-
AutoTrain是什么?一文让你看懂AutoTrain的技术原理、主要功能、应用场景AutoTrain概述简介 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模...
-
CAMPHOR是什么?一文让你看懂CAMPHOR的技术原理、主要功能、应用场景CAMPHOR概述简介 CAMPHOR是苹果团队推出的端侧小语言大模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地...
-
ACE是什么?一文让你看懂ACE的技术原理、主要功能、应用场景ACE概述简介 ACE(All-round Creator and Editor)是阿里集团Tongyi Lab推出的基于扩散变换器的全能图像生成和...
-
ViewExtrapolator是什么?一文让你看懂ViewExtrapolator的技术原理、主要功能、应用场景ViewExtrapolator概述简介 ViewExtrapolator是南洋理工大学、UCAS研究团队一起推出的新视角外推方法,基于稳定视频扩散...
-
OpenScholar是什么?一文让你看懂OpenScholar的技术原理、主要功能、应用场景OpenScholar概述简介 OpenScholar是华盛顿大学和艾伦AI研究所一起推出的检索增强型语言大模型(LM),能帮助科学家基于检索和综合...
-
SmolVLM是什么?一文让你看懂SmolVLM的技术原理、主要功能、应用场景SmolVLM概述简介 SmolVLM是Hugging Face推出的轻量级视觉语言大模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和...
-
LongAlign是什么?一文让你看懂LongAlign的技术原理、主要功能、应用场景LongAlign概述简介 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongA...
-
ebook2audiobookXTTS是什么?一文让你看懂ebook2audiobookXTTS的技术原理、主要功能、应用场景ebook2audiobookXTTS概述简介 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audi...
-
Optima是什么?一文让你看懂Optima的技术原理、主要功能、应用场景Optima概述简介 Optima是清华大学推出的优化基于大型语言大模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训...