收集全球10,000⁺个好用的AI软件
-
VideoRefer是什么?一文让你看懂VideoRefer的技术原理、主要功能、应用场景VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言大模型(V...
-
JoyCaption是什么?一文让你看懂JoyCaption的技术原理、主要功能、应用场景JoyCaption概述简介 JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种...
-
麦橘超然是什么?一文让你看懂麦橘超然的技术原理、主要功能、应用场景麦橘超然概述简介 麦橘超然(MajicFlus)是麦橘推出的基于Flux.1架构的AI大模型,专注于生成高质量的人像图像,擅长表现亚洲女性的细腻与美...
-
CHRONOS是什么?一文让你看懂CHRONOS的技术原理、主要功能、应用场景CHRONOS概述简介 CHRONOS是上海交通大学计算机科学与工程系、阿里集团通义实验室等机构联合推出的,用在新闻时间线摘要生成的新型框架,基于迭...
-
Edicho是什么?一文让你看懂Edicho的技术原理、主要功能、应用场景Edicho概述简介 Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑...
-
Mobile-Agent是什么?一文让你看懂Mobile-Agent的技术原理、主要功能、应用场景Mobile-Agent概述简介 Mobile-Agent 是具有移动性的智能代理软件实体,能在网络的各个节点之间移动,代表用户或其他代理进行工作。...
-
VideoRAG是什么?一文让你看懂VideoRAG的技术原理、主要功能、应用场景VideoRAG概述简介 VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提...
-
SPRIGHT是什么?一文让你看懂SPRIGHT的技术原理、主要功能、应用场景SPRIGHT概述简介 SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛...
-
LIGER是什么?一文让你看懂LIGER的技术原理、主要功能、应用场景LIGER概述简介 LIGER是Meta AI等机构推出的混合检索模型,结合生成式检索和密集检索的优点。LIGER用生成式检索模块生成有限的候选项目...
-
SeedVR是什么?一文让你看懂SeedVR的技术原理、主要功能、应用场景SeedVR概述简介 SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型,能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制,...
-
AutoDroid-V2是什么?一文让你看懂AutoDroid-V2的技术原理、主要功能、应用场景AutoDroid-V2概述简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言大模型(SLM)的移动端GUI自动化脚本代理...
-
EnerVerse是什么?一文让你看懂EnerVerse的技术原理、主要功能、应用场景EnerVerse概述简介 EnerVerse 是智元机器人团队开发的首个机器人4D世界模型,通过生成未来具身空间来指导机器人完成复杂任务。模型采用...
-
Seer是什么?一文让你看懂Seer的技术原理、主要功能、应用场景Seer概述简介 Seer是由上海AI实验室、北京大学计算机科学与技术学院、北京大学软件与微电子学院等机构联合推出的端到端操作模型,实现机器人视觉预...
-
ArtCrafter是什么?一文让你看懂ArtCrafter的技术原理、主要功能、应用场景ArtCrafter概述简介 ArtCrafter是清华大学、鹏城实验室和联想研究院一起推出的文本到图像风格迁移框架,基于扩散模型,解决传统方法在风...
-
Ingredients是什么?一文让你看懂Ingredients的技术原理、主要功能、应用场景Ingredients概述简介 Ingredients是强大的框架,基于将多个特定身份(ID)照片与视频扩散Transformer相结合,用在定制视...
-
MultiBooth是什么?一文让你看懂MultiBooth的技术原理、主要功能、应用场景MultiBooth概述简介 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成...
-
Aria-UI是什么?一文让你看懂Aria-UI的技术原理、主要功能、应用场景Aria-UI概述简介 Aria-UI是香港大学和Rhymes AI一起推出的为图形用户界面(GUI)定位任务设计的大型多模态模型。基于纯视觉方法,...
-
TransPixar是什么?一文让你看懂TransPixar的技术原理、主要功能、应用场景TransPixar概述简介 TransPixar是香港中文大学、Adobe研究院 、香港科技大学和智能摩尔联合开源的,先进的文本到视频生成方法,扩...
-
STAR是什么?一文让你看懂STAR的技术原理、主要功能、应用场景STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(...
-
星火人设是什么?一文让你看懂星火人设的技术原理、主要功能、应用场景星火人设概述简介 星火人设是科大讯飞推出的专为情感交互而设计的独立模型(角色模拟API),具备人物设定、剧情演绎与语言风格等控制选项,支持模型精调。...