功能

首页 > 功能

SlideChat是什么？一文让你看懂SlideChat的技术原理、主要功能、应用场景

SlideChat概述简介 SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的，首个能理解千兆像素级别全切片图像的视觉语言助手。...
Fugatto是什么？一文让你看懂Fugatto的技术原理、主要功能、应用场景

Fugatto概述简介 Fugatto是英伟达（NVIDIA）推出的音频合成和转换模型，全称为”Foundational Generative Au...
LongRAG是什么？一文让你看懂LongRAG的技术原理、主要功能、应用场景

LongRAG概述简介 LongRAG是清华大学、中国科学院和智谱的研究团队推出的，面向长文本问答（LCQA）的双视角鲁棒检索增强生成（RAG）框架...
Illustrious是什么？一文让你看懂Illustrious的技术原理、主要功能、应用场景

Illustrious概述简介 Illustrious是开源的文本到图像动漫图像生成模型，是Onoma AI Research推出的。基于优化批量大...
aisuite是什么？一文让你看懂aisuite的技术原理、主要功能、应用场景

aisuite概述简介 aisuite是开源的Python库，吴恩达（Andrew Ng）发布的，旨在提供一个统一的接口来调用多个大型语言大模型（L...
XGrammar是什么？一文让你看懂XGrammar的技术原理、主要功能、应用场景

XGrammar概述简介 XGrammar是由陈天奇团队推出的开源软件库，能为大型语言大模型（LLM）提供高效、灵活且可移植的结构化数据生成能力。基...
Edify 3D是什么？一文让你看懂Edify 3D的技术原理、主要功能、应用场景

Edify 3D概述简介 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案，能从文本提示或参考图像快速合成高质量的3D模型。Edify...
SongCreator是什么？一文让你看懂SongCreator的技术原理、主要功能、应用场景

SongCreator概述简介 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型，能从歌词出发生成包含声乐...
Teacher2Task是什么？一文让你看懂Teacher2Task的技术原理、主要功能、应用场景

Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架，引入教师特定的输入标记和重新构思训练过程，消除对手动聚合启发式...
DynaSaur是什么？一文让你看懂DynaSaur的技术原理、主要功能、应用场景

DynaSaur概述简介 DynaSaur是Adobe Research推出的大型语言大模型（LLM）代理框架，突破传统LLM代理系统受限于预定义动...
Takin AudioLLM是什么？一文让你看懂Takin AudioLLM的技术原理、主要功能、应用场景

Takin AudioLLM概述简介 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型，包括Takin ...
AutoTrain是什么？一文让你看懂AutoTrain的技术原理、主要功能、应用场景

AutoTrain概述简介 AutoTrain（AutoTrain Advanced）是Hugging Face推出的开源无代码平台，能简化最先进模...
CAMPHOR是什么？一文让你看懂CAMPHOR的技术原理、主要功能、应用场景

CAMPHOR概述简介 CAMPHOR是苹果团队推出的端侧小语言大模型（SLM）多智能体框架，能提升移动设备的隐私保护和响应速度。框架基于在设备本地...
ACE是什么？一文让你看懂ACE的技术原理、主要功能、应用场景

ACE概述简介 ACE（All-round Creator and Editor）是阿里集团Tongyi Lab推出的基于扩散变换器的全能图像生成和...
ViewExtrapolator是什么？一文让你看懂ViewExtrapolator的技术原理、主要功能、应用场景

ViewExtrapolator概述简介 ViewExtrapolator是南洋理工大学、UCAS研究团队一起推出的新视角外推方法，基于稳定视频扩散...
OpenScholar是什么？一文让你看懂OpenScholar的技术原理、主要功能、应用场景

OpenScholar概述简介 OpenScholar是华盛顿大学和艾伦AI研究所一起推出的检索增强型语言大模型（LM），能帮助科学家基于检索和综合...
SmolVLM是什么？一文让你看懂SmolVLM的技术原理、主要功能、应用场景

SmolVLM概述简介 SmolVLM是Hugging Face推出的轻量级视觉语言大模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和...
LongAlign是什么？一文让你看懂LongAlign的技术原理、主要功能、应用场景

LongAlign概述简介 LongAlign是香港大学研究团队推出的文本到图像（T2I）扩散模型的改进方法，能提升长文本输入的对齐精度。LongA...
ebook2audiobookXTTS是什么？一文让你看懂ebook2audiobookXTTS的技术原理、主要功能、应用场景

ebook2audiobookXTTS概述简介 ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audi...
Optima是什么？一文让你看懂Optima的技术原理、主要功能、应用场景

Optima概述简介 Optima是清华大学推出的优化基于大型语言大模型（LLM）的多智能体系统（MAS）的框架。基于一个迭代的生成、排名、选择和训...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL