收集全球10,000⁺个好用的AI软件
-
DreamVideo-2是什么?一文让你看懂DreamVideo-2的技术原理、主要功能、应用场景DreamVideo-2概述简介 DreamVideo-2是创新的零样本视频定制框架,复旦大学和阿里集团等机构联合推出。DreamVideo-2能根...
-
VideoTuna是什么?一文让你看懂VideoTuna的技术原理、主要功能、应用场景VideoTuna概述简介 VideoTuna是集成多种AI视频生成模型的代码库,支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提...
-
MMBench-Video是什么?一文让你看懂MMBench-Video的技术原理、主要功能、应用场景MMBench-Video概述简介 MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文...
-
CogVideoX v1.5是什么?一文让你看懂CogVideoX v1.5的技术原理、主要功能、应用场景CogVideoX v1.5概述简介 CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和Co...
-
HourVideo是什么?一文让你看懂HourVideo的技术原理、主要功能、应用场景HourVideo概述简介 HourVideo是斯坦福大学李飞飞和吴佳俊团队推出的长视频理解基准数据集,包含500个第一人称视角视频,时长20至12...
-
VideoChat是什么?一文让你看懂VideoChat的技术原理、主要功能、应用场景VideoChat概述简介 VideoChat是开源的实时数字人对话系统,支持语音输入和实时对话功能。用户自定义数字人的形象和音色,无需训练即可进行...
-
Free Video-LLM是什么?一文让你看懂Free Video-LLM的技术原理、主要功能、应用场景Free Video-LLM概述简介 Free Video-LLM是创新的无需训练的高效视频语言大模型,基于提示引导的视觉感知技术,实现对视频内容的...
-
LTX Video是什么?一文让你看懂LTX Video的技术原理、主要功能、应用场景LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基...
-
HunyuanVideo是什么?一文让你看懂HunyuanVideo的技术原理、主要功能、应用场景HunyuanVideo概述简介 HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。Hunyu...
-
Enhance-A-Video是什么?一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
-
VideoPhy是什么?一文让你看懂VideoPhy的技术原理、主要功能、应用场景VideoPhy概述简介 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否...
-
VideoVAE+是什么?一文让你看懂VideoVAE+的技术原理、主要功能、应用场景VideoVAE+概述简介 VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE...
-
VideoMaker是什么?一文让你看懂VideoMaker的技术原理、主要功能、应用场景VideoMaker概述简介 VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频...
-
VideoAnydoor是什么?一文让你看懂VideoAnydoor的技术原理、主要功能、应用场景VideoAnydoor概述简介 VideoAnydoor是香港大学、阿里集团达摩院、湖畔实验室、华中科技大学联合推出的零样本的视频对象插入框架,能...
-
VideoRefer是什么?一文让你看懂VideoRefer的技术原理、主要功能、应用场景VideoRefer概述简介 VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言大模型(V...
-
VideoRAG是什么?一文让你看懂VideoRAG的技术原理、主要功能、应用场景VideoRAG概述简介 VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提...
-
CogVideoX-Flash是什么?一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频...
-
Video Alchemist是什么?一文让你看懂Video Alchemist的技术原理、主要功能、应用场景Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型,具备多主体、开放集合个性化能力,能根据...
-
VideoWorld是什么?一文让你看懂VideoWorld的技术原理、主要功能、应用场景VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目,探索深度生成模型是否能仅通过未标...
-
VideoChat-Flash是什么?一文让你看懂VideoChat-Flash的技术原理、主要功能、应用场景VideoChat-Flash概述简介 VideoChat-Flash 是上海人工智能实验室和南京大学等机构联合开发的针对长视频建模的多模态大语言大...