收集全球10,000⁺个好用的AI软件
-
Free Video-LLM是什么?一文让你看懂Free Video-LLM的技术原理、主要功能、应用场景Free Video-LLM概述简介 Free Video-LLM是创新的无需训练的高效视频语言大模型,基于提示引导的视觉感知技术,实现对视频内容的...
-
LTX Video是什么?一文让你看懂LTX Video的技术原理、主要功能、应用场景LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基...
-
HunyuanVideo是什么?一文让你看懂HunyuanVideo的技术原理、主要功能、应用场景HunyuanVideo概述简介 HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。Hunyu...
-
Enhance-A-Video是什么?一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
-
VideoPhy是什么?一文让你看懂VideoPhy的技术原理、主要功能、应用场景VideoPhy概述简介 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否...
-
VideoVAE+是什么?一文让你看懂VideoVAE+的技术原理、主要功能、应用场景VideoVAE+概述简介 VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE...
-
VideoMaker是什么?一文让你看懂VideoMaker的技术原理、主要功能、应用场景VideoMaker概述简介 VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频...
-
VideoAnydoor是什么?一文让你看懂VideoAnydoor的技术原理、主要功能、应用场景VideoAnydoor概述简介 VideoAnydoor是香港大学、阿里集团达摩院、湖畔实验室、华中科技大学联合推出的零样本的视频对象插入框架,能...
-
VideoRefer是什么?一文让你看懂VideoRefer的技术原理、主要功能、应用场景VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言大模型(V...
-
VideoRAG是什么?一文让你看懂VideoRAG的技术原理、主要功能、应用场景VideoRAG概述简介 VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提...
-
CogVideoX-Flash是什么?一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频...
-
Video Alchemist是什么?一文让你看懂Video Alchemist的技术原理、主要功能、应用场景Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型,具备多主体、开放集合个性化能力,能根据...
-
VideoWorld是什么?一文让你看懂VideoWorld的技术原理、主要功能、应用场景VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目,探索深度生成模型是否能仅通过未标...
-
VideoChat-Flash是什么?一文让你看懂VideoChat-Flash的技术原理、主要功能、应用场景VideoChat-Flash概述简介 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言大...
-
Step-Video V2是什么?一文让你看懂Step-Video V2的技术原理、主要功能、应用场景Step-Video V2概述简介 Step-Video V2 是上海阶跃星辰智能科技发布的升级版视频生成模型。该版本在多个核心技术领域进行了优化和...
-
CogVideoX-2是什么?一文让你看懂CogVideoX-2的技术原理、主要功能、应用场景CogVideoX-2概述简介 CogVideoX-2是智谱 AI 推出的文本到视频生成模型,基于先进的 3D 变分自编码器(VAE),将视频数据压...
-
VideoLLaMA3是什么?一文让你看懂VideoLLaMA3的技术原理、主要功能、应用场景VideoLLaMA3概述简介 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合...
-
VideoReward是什么?一文让你看懂VideoReward的技术原理、主要功能、应用场景VideoReward概述简介 VideoReward 是香港中文大学、清华大学、快手科技等联合创建的视频生成偏好数据集及奖励模型。包含182,00...
-
VideoJAM是什么?一文让你看懂VideoJAM的技术原理、主要功能、应用场景VideoJAM概述简介 VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学...
-
FlashVideo是什么?一文让你看懂FlashVideo的技术原理、主要功能、应用场景FlashVideo概述简介 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视...