Video

首页 > Video

Free Video-LLM是什么？一文让你看懂Free Video-LLM的技术原理、主要功能、应用场景

Free Video-LLM概述简介 Free Video-LLM是创新的无需训练的高效视频语言大模型，基于提示引导的视觉感知技术，实现对视频内容的...
LTX Video是什么？一文让你看懂LTX Video的技术原理、主要功能、应用场景

LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型，能在4秒内生成5秒的高质量视频，速度超过观看速度。基...
HunyuanVideo是什么？一文让你看懂HunyuanVideo的技术原理、主要功能、应用场景

HunyuanVideo概述简介 HunyuanVideo是腾讯开源的视频生成模型，拥有130亿参数，是目前参数量最大的开源视频模型之一。Hunyu...
Enhance-A-Video是什么？一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景

Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
VideoPhy是什么？一文让你看懂VideoPhy的技术原理、主要功能、应用场景

VideoPhy概述简介 VideoPhy是UCLA和谷歌研究研究院联合推出的，首个评估视频生成模型物理常识能力的基准测试，能衡量模型生成的视频是否...
VideoVAE+是什么？一文让你看懂VideoVAE+的技术原理、主要功能、应用场景

VideoVAE+概述简介 VideoVAE+（VideoVAE Plus）是香港科技大学团队推出的先进的跨模态视频变分自编码器（Video VAE...
VideoMaker是什么？一文让你看懂VideoMaker的技术原理、主要功能、应用场景

VideoMaker概述简介 VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目，基于视频扩散模型（VDM）的零样本定制视频...
VideoAnydoor是什么？一文让你看懂VideoAnydoor的技术原理、主要功能、应用场景

VideoAnydoor概述简介 VideoAnydoor是香港大学、阿里集团达摩院、湖畔实验室、华中科技大学联合推出的零样本的视频对象插入框架，能...
VideoRefer是什么？一文让你看懂VideoRefer的技术原理、主要功能、应用场景

VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的，专门用在视频中对象的感知和推理。基于增强视频大型语言大模型（V...
VideoRAG是什么？一文让你看懂VideoRAG的技术原理、主要功能、应用场景

VideoRAG概述简介 VideoRAG是用于长视频理解的检索增强生成（Retrieval-Augmented Generation）技术。通过提...
CogVideoX-Flash是什么？一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景

CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频...
Video Alchemist是什么？一文让你看懂Video Alchemist的技术原理、主要功能、应用场景

Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型，具备多主体、开放集合个性化能力，能根据...
VideoWorld是什么？一文让你看懂VideoWorld的技术原理、主要功能、应用场景

VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目，探索深度生成模型是否能仅通过未标...
VideoChat-Flash是什么？一文让你看懂VideoChat-Flash的技术原理、主要功能、应用场景

VideoChat-Flash概述简介 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言大...
Step-Video V2是什么？一文让你看懂Step-Video V2的技术原理、主要功能、应用场景

Step-Video V2概述简介 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和...
CogVideoX-2是什么？一文让你看懂CogVideoX-2的技术原理、主要功能、应用场景

CogVideoX-2概述简介 CogVideoX-2是智谱 AI 推出的文本到视频生成模型，基于先进的 3D 变分自编码器（VAE），将视频数据压...
VideoLLaMA3是什么？一文让你看懂VideoLLaMA3的技术原理、主要功能、应用场景

VideoLLaMA3概述简介 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型，专注于图像和视频理解。基于 Qwen 2.5 架构，结合...
VideoReward是什么？一文让你看懂VideoReward的技术原理、主要功能、应用场景

VideoReward概述简介 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,00...
VideoJAM是什么？一文让你看懂VideoJAM的技术原理、主要功能、应用场景

VideoJAM概述简介 VideoJAM是Meta推出的，用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示，让模型在训练阶段同时学...
FlashVideo是什么？一文让你看懂FlashVideo的技术原理、主要功能、应用场景

FlashVideo概述简介 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架，通过两阶段方法解决了传统单阶段扩散模型在高分辨率视...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL