收集全球10,000⁺个好用的AI软件
-
DINO-X是什么?一文让你看懂DINO-X的技术原理、主要功能、应用场景DINO-X概述简介 DINO-X是IDEA研究院推出的通用视觉大模型,具备开放世界对象检测与理解能力。支持文本、视觉和定制提示,能识别图像中的任何...
-
LTX Video是什么?一文让你看懂LTX Video的技术原理、主要功能、应用场景LTX Video概述简介 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基...
-
AutoVFX是什么?一文让你看懂AutoVFX的技术原理、主要功能、应用场景AutoVFX概述简介 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(...
-
XGrammar是什么?一文让你看懂XGrammar的技术原理、主要功能、应用场景XGrammar概述简介 XGrammar是由陈天奇团队推出的开源软件库,能为大型语言大模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基...
-
ebook2audiobookXTTS是什么?一文让你看懂ebook2audiobookXTTS的技术原理、主要功能、应用场景ebook2audiobookXTTS概述简介 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audi...
-
VISION XL是什么?一文让你看懂VISION XL的技术原理、主要功能、应用场景VISION XL概述简介 VISION XL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部...
-
EXAONE 3.5是什么?一文让你看懂EXAONE 3.5的技术原理、主要功能、应用场景EXAONE 3.5概述简介 EXAONE 3.5是LG AI研究院推出的开源AI大模型,包含24亿、78亿和320亿参数的三个版本。EXAONE ...
-
EMMA-X是什么?一文让你看懂EMMA-X的技术原理、主要功能、应用场景EMMA-X概述简介 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenV...
-
X-AnyLabeling是什么?一文让你看懂X-AnyLabeling的技术原理、主要功能、应用场景X-AnyLabeling概述简介 X-AnyLabeling是集成多种深度学习算法的图像标注软件,专注于提升标注效率和精度。X-AnyLabeli...
-
TANGOFLUX是什么?一文让你看懂TANGOFLUX的技术原理、主要功能、应用场景TANGOFLUX概述简介 TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA一起推出的。模型拥有约5.1...
-
讯飞星火 X1是什么?一文让你看懂讯飞星火 X1的技术原理、主要功能、应用场景讯飞星火 X1概述简介 讯飞星火 X1 是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题...
-
CogVideoX-Flash是什么?一文让你看懂CogVideoX-Flash的技术原理、主要功能、应用场景CogVideoX-Flash概述简介 CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,继承CogVideoX自研的端到端视频...
-
XMusic是什么?一文让你看懂XMusic的技术原理、主要功能、应用场景XMusic概述简介 XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容,XMusic能生...
-
X-Dyna是什么?一文让你看懂X-Dyna的技术原理、主要功能、应用场景X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架,基于驱动视频中的面部表情和身体动作,将单张人类图像动画化,生成具有真实感和环境感知...
-
3DIS-FLUX是什么?一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
-
CogVideoX-2是什么?一文让你看懂CogVideoX-2的技术原理、主要功能、应用场景CogVideoX-2概述简介 CogVideoX-2是智谱 AI 推出的文本到视频生成模型,基于先进的 3D 变分自编码器(VAE),将视频数据压...
-
X-Prompt是什么?一文让你看懂X-Prompt的技术原理、主要功能、应用场景X-Prompt概述简介 X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预...
-
DynVFX是什么?一文让你看懂DynVFX的技术原理、主要功能、应用场景DynVFX概述简介 DynVFX是创新的视频增强技术,能根据简单的文本指令将动态内容无缝集成到真实视频中。通过结合预训练的文本到视频扩散模型和视觉...
-
MedRAX是什么?一文让你看懂MedRAX的技术原理、主要功能、应用场景MedRAX概述简介 MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理...
-
CustomVideoX是什么?一文让你看懂CustomVideoX的技术原理、主要功能、应用场景CustomVideoX概述简介 CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架,通过参考图像和文本描述生成高质量的定...