功能

首页 > 功能

LaTRO是什么？一文让你看懂LaTRO的技术原理、主要功能、应用场景

LaTRO概述简介 LaTRO（Latent Reasoning Optimization）是先进的框架，提升大型语言大模型（LLMs）在复杂推理任...
ReCapture是什么？一文让你看懂ReCapture的技术原理、主要功能、应用场景

ReCapture概述简介 ReCapture是谷歌和新加坡国立大学推出的视频处理技术，能从单一用户提供的视频中生成具有新相机轨迹的新视频。ReCa...
MagicClay是什么？一文让你看懂MagicClay的技术原理、主要功能、应用场景

MagicClay概述简介 MagicClay 是 Adobe 推出3D建模工具，结合网格和有向距离场（SDF）技术，支持艺术家基于文本提示对3D模...
StableV2V是什么？一文让你看懂StableV2V的技术原理、主要功能、应用场景

StableV2V概述简介 StableV2V是中国科技大学推出的开源视频编辑项目，基于文本、草图、图片等输入实现视频中物体的精准编辑和替换。项目用...
Halo是什么？一文让你看懂Halo的技术原理、主要功能、应用场景

Halo概述简介 Halo是开源的DIY健康追踪项目，基于低成本的智Halo – 开源的DIY健康追踪项目，构建私人健康检测应用能戒指和开源软件，让...
JoyVASA是什么？一文让你看懂JoyVASA的技术原理、主要功能、应用场景

JoyVASA概述简介 JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目，基于扩散模型技术，根据音频信号生成与音频同步的面部动态和头部运...
TIP-I2V是什么？一文让你看懂TIP-I2V的技术原理、主要功能、应用场景

TIP-I2V概述简介 TIP-I2V是大规模真实文V本和图像提示数据集，用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像...
FLUX Tools是什么？一文让你看懂FLUX Tools的技术原理、主要功能、应用场景

FLUX Tools概述简介 FLUX Tools是黑森林实验室推出的一套模型工具，能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX...
SmoothCache是什么？一文让你看懂SmoothCache的技术原理、主要功能、应用场景

SmoothCache概述简介 SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 R...
AutoConsis是什么？一文让你看懂AutoConsis的技术原理、主要功能、应用场景

AutoConsis概述简介 AutoConsis是UI内容一致性智能检测工具，是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言大模型...
OmniEdit是什么？一文让你看懂OmniEdit的技术原理、主要功能、应用场景

OmniEdit概述简介 OmniEdit是先进的图像编辑技术，通过结合多个专家模型的监督来训练一个通用模型，处理多种图像编辑任务。能处理不同纵横比...
In-Context LoRA是什么？一文让你看懂In-Context LoRA的技术原理、主要功能、应用场景

In-Context LoRA概述简介 In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器（DiTs）的图像生成框架，用模型的内...
Add-it是什么？一文让你看懂Add-it的技术原理、主要功能、应用场景

Add-it概述简介 Add-it是NVIDIA推出的无需训练的图像编辑技术，能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制，...
DINO-X是什么？一文让你看懂DINO-X的技术原理、主要功能、应用场景

DINO-X概述简介 DINO-X是IDEA研究院推出的通用视觉大模型，具备开放世界对象检测与理解能力。支持文本、视觉和定制提示，能识别图像中的任何...
The Matrix是什么？一文让你看懂The Matrix的技术原理、主要功能、应用场景

The Matrix概述简介 The Matrix是与电影同名的首个AI基础世界模拟器，是全华人团队推出的（作者分别来自阿里巴巴、香港大学、滑铁卢大...
DreamPolish是什么？一文让你看懂DreamPolish的技术原理、主要功能、应用场景

DreamPolish概述简介 DreamPolish是智谱 AI、清华大学和北京大学推出的文本到3D生成模型，基于两阶段方法改进复杂对象的精细几何...
OmniBooth是什么？一文让你看懂OmniBooth的技术原理、主要功能、应用场景

OmniBooth概述简介 OmniBooth是华为诺亚方舟实验室和港科大研究团队一起推出的图像生成框架，支持基于文本提示或图像参考进行空间控制和实...
DynaMem是什么？一文让你看懂DynaMem的技术原理、主要功能、应用场景

DynaMem概述简介 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统，专为开放世界中的移动操作设计。基于维护一个特征点...
MVPaint是什么？一文让你看懂MVPaint的技术原理、主要功能、应用场景

MVPaint概述简介 MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学一起推出的3D纹理生成框架，基于同步多视角扩...
LTX Video是什么？一文让你看懂LTX Video的技术原理、主要功能、应用场景

LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型，能在4秒内生成5秒的高质量视频，速度超过观看速度。基...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL