功能

首页 > 功能

VideoRefer是什么？一文让你看懂VideoRefer的技术原理、主要功能、应用场景

VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的，专门用在视频中对象的感知和推理。基于增强视频大型语言大模型（V...
JoyCaption是什么？一文让你看懂JoyCaption的技术原理、主要功能、应用场景

JoyCaption概述简介 JoyCaption 是开源的图像提示词生成工具，用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种...
麦橘超然是什么？一文让你看懂麦橘超然的技术原理、主要功能、应用场景

麦橘超然概述简介麦橘超然（MajicFlus）是麦橘推出的基于Flux.1架构的AI大模型，专注于生成高质量的人像图像，擅长表现亚洲女性的细腻与美...
CHRONOS是什么？一文让你看懂CHRONOS的技术原理、主要功能、应用场景

CHRONOS概述简介 CHRONOS是上海交通大学计算机科学与工程系、阿里集团通义实验室等机构联合推出的，用在新闻时间线摘要生成的新型框架，基于迭...
Edicho是什么？一文让你看懂Edicho的技术原理、主要功能、应用场景

Edicho概述简介 Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的，基于扩散模型的图像编辑方法，能在多图像间实现一致性编辑...
Mobile-Agent是什么？一文让你看懂Mobile-Agent的技术原理、主要功能、应用场景

Mobile-Agent概述简介 Mobile-Agent 是具有移动性的智能代理软件实体，能在网络的各个节点之间移动，代表用户或其他代理进行工作。...
VideoRAG是什么？一文让你看懂VideoRAG的技术原理、主要功能、应用场景

VideoRAG概述简介 VideoRAG是用于长视频理解的检索增强生成（Retrieval-Augmented Generation）技术。通过提...
SPRIGHT是什么？一文让你看懂SPRIGHT的技术原理、主要功能、应用场景

SPRIGHT概述简介 SPRIGHT（SPatially RIGHT）是亚利桑那州立大学、Intel 实验室、Hugging Face 、华盛...
LIGER是什么？一文让你看懂LIGER的技术原理、主要功能、应用场景

LIGER概述简介 LIGER是Meta AI等机构推出的混合检索模型，结合生成式检索和密集检索的优点。LIGER用生成式检索模块生成有限的候选项目...
SeedVR是什么？一文让你看懂SeedVR的技术原理、主要功能、应用场景

SeedVR概述简介 SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型，能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制，...
AutoDroid-V2是什么？一文让你看懂AutoDroid-V2的技术原理、主要功能、应用场景

AutoDroid-V2概述简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言大模型（SLM）的移动端GUI自动化脚本代理...
EnerVerse是什么？一文让你看懂EnerVerse的技术原理、主要功能、应用场景

EnerVerse概述简介 EnerVerse 是智元机器人团队开发的首个机器人4D世界模型，通过生成未来具身空间来指导机器人完成复杂任务。模型采用...
Seer是什么？一文让你看懂Seer的技术原理、主要功能、应用场景

Seer概述简介 Seer是由上海AI实验室、北京大学计算机科学与技术学院、北京大学软件与微电子学院等机构联合推出的端到端操作模型，实现机器人视觉预...
ArtCrafter是什么？一文让你看懂ArtCrafter的技术原理、主要功能、应用场景

ArtCrafter概述简介 ArtCrafter是清华大学、鹏城实验室和联想研究院一起推出的文本到图像风格迁移框架，基于扩散模型，解决传统方法在风...
Ingredients是什么？一文让你看懂Ingredients的技术原理、主要功能、应用场景

Ingredients概述简介 Ingredients是强大的框架，基于将多个特定身份（ID）照片与视频扩散Transformer相结合，用在定制视...
MultiBooth是什么？一文让你看懂MultiBooth的技术原理、主要功能、应用场景

MultiBooth概述简介 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法，能从文本中生成...
Aria-UI是什么？一文让你看懂Aria-UI的技术原理、主要功能、应用场景

Aria-UI概述简介 Aria-UI是香港大学和Rhymes AI一起推出的为图形用户界面（GUI）定位任务设计的大型多模态模型。基于纯视觉方法，...
TransPixar是什么？一文让你看懂TransPixar的技术原理、主要功能、应用场景

TransPixar概述简介 TransPixar是香港中文大学、Adobe研究院、香港科技大学和智能摩尔联合开源的，先进的文本到视频生成方法，扩...
STAR是什么？一文让你看懂STAR的技术原理、主要功能、应用场景

STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的，创新的现实世界视频超分辨率（VSR）框架，能从低分辨率（LR）视频生成高分辨率（...
星火人设是什么？一文让你看懂星火人设的技术原理、主要功能、应用场景

星火人设概述简介星火人设是科大讯飞推出的专为情感交互而设计的独立模型（角色模拟API），具备人物设定、剧情演绎与语言风格等控制选项，支持模型精调。...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL