收集全球10,000⁺个好用的AI软件
-
LLMDet是什么?一文让你看懂LLMDet的技术原理、主要功能、应用场景LLMDet概述简介 LLMDet是阿里集团通义实验室、中山大学计算机科学与工程学院、鹏城实验室等机构推出的开放词汇目标检测器,基于与大型语言大模型...
-
VisoMaster是什么?一文让你看懂VisoMaster的技术原理、主要功能、应用场景VisoMaster概述简介 VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真...
-
FlashVideo是什么?一文让你看懂FlashVideo的技术原理、主要功能、应用场景FlashVideo概述简介 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视...
-
ACE++是什么?一文让你看懂ACE++的技术原理、主要功能、应用场景ACE++概述简介 ACE++是阿里巴巴通义实验室推出的先进的图像生成与编辑工具,通过指令化和上下文感知的内容填充技术,实现了高质量的图像创作和编辑...
-
LLaVA-Rad是什么?一文让你看懂LLaVA-Rad的技术原理、主要功能、应用场景LLaVA-Rad概述简介 LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部...
-
Satori是什么?一文让你看懂Satori的技术原理、主要功能、应用场景Satori概述简介 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言大模型,专注于提升推理能力。基于Qwen-2.5-Ma...
-
Goku是什么?一文让你看懂Goku的技术原理、主要功能、应用场景Goku概述简介 Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Tr...
-
AnythingLLM是什么?一文让你看懂AnythingLLM的技术原理、主要功能、应用场景AnythingLLM概述简介 AnythingLLM 是开源免费且支持多模态交互的全栈 AI 客户端。AnythingLLM支持文本、图像和音频等...
-
VideoCaptioner是什么?一文让你看懂VideoCaptioner的技术原理、主要功能、应用场景VideoCaptioner概述简介 VideoCaptioner(中文名:卡卡字幕助手)是基于大语言大模型(LLM)的智能字幕处理工具,能简化视频...
-
Zonos是什么?一文让你看懂Zonos的技术原理、主要功能、应用场景Zonos概述简介 Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和S...
-
InspireMusic是什么?一文让你看懂InspireMusic的技术原理、主要功能、应用场景InspireMusic概述简介 InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模...
-
YAYI-Ultra是什么?一文让你看懂YAYI-Ultra的技术原理、主要功能、应用场景YAYI-Ultra概述简介 YAYI-Ultra (雅意)是中科闻歌研发的企业级大语言大模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能...
-
HUGWBC是什么?一文让你看懂HUGWBC的技术原理、主要功能、应用场景HUGWBC概述简介 HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通...
-
TPO是什么?一文让你看懂TPO的技术原理、主要功能、应用场景TPO概述简介 TPO(Test-Time Preference Optimization)是新型的AI优化框架,在推理阶段对语言大模型输出进行动态...
-
PDF to Podcast是什么?一文让你看懂PDF to Podcast的技术原理、主要功能、应用场景PDF to Podcast概述简介 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,...
-
InternVideo2.5是什么?一文让你看懂InternVideo2.5的技术原理、主要功能、应用场景InternVideo2.5概述简介 InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模...
-
HumanDiT是什么?一文让你看懂HumanDiT的技术原理、主要功能、应用场景HumanDiT概述简介 HumanDiT 是浙江大学和字节跳动联合提出的姿态引导的高保真人体视频生成框架。基于扩散变换器(Diffusion Tr...
-
ProtGPS是什么?一文让你看懂ProtGPS的技术原理、主要功能、应用场景ProtGPS概述简介 ProtGPS(Protein Localization Prediction Model)是麻省理工学院(MIT)和怀特黑...
-
potpie.ai是什么?一文让你看懂potpie.ai的技术原理、主要功能、应用场景potpie.ai概述简介 potpie.ai 是开源平台,基于AI技术为代码库创建定制化的工程代理(Agents)。potpie.ai基于构建代码...
-
MoMask是什么?一文让你看懂MoMask的技术原理、主要功能、应用场景MoMask概述简介 MoMask是创新的3D人体动作生成工具,通过生成式掩码建模技术,能根据文本描述生成高质量的3D人体动作。MoMask采用分层...