收集全球10,000⁺个好用的AI软件
-
TrendPublish是什么?一文让你看懂TrendPublish的技术原理、主要功能、应用场景TrendPublish概述简介 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等...
-
Proxy Lite是什么?一文让你看懂Proxy Lite的技术原理、主要功能、应用场景Proxy Lite概述简介 Proxy Lite 是开源的轻量级视觉语言大模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite ...
-
WeGen是什么?一文让你看懂WeGen的技术原理、主要功能、应用场景WeGen概述简介 WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉...
-
DiffBrush是什么?一文让你看懂DiffBrush的技术原理、主要功能、应用场景DiffBrush概述简介 DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支...
-
Liquid是什么?一文让你看懂Liquid的技术原理、主要功能、应用场景Liquid概述简介 Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token...
-
X-Dancer是什么?一文让你看懂X-Dancer的技术原理、主要功能、应用场景X-Dancer概述简介 X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的开发人员一起推出的音乐驱动的人像舞蹈视频生成框架,支持从...
-
AVD2是什么?一文让你看懂AVD2的技术原理、主要功能、应用场景AVD2概述简介 AVD2(Accident Video Diffusion for Accident Video Description)是清华大...
-
Kiss3DGen是什么?一文让你看懂Kiss3DGen的技术原理、主要功能、应用场景Kiss3DGen概述简介 Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于...
-
Archon是什么?一文让你看懂Archon的技术原理、主要功能、应用场景Archon概述简介 Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能,展示了现代 AI 开发的核心理念。...
-
PodAgent是什么?一文让你看懂PodAgent的技术原理、主要功能、应用场景PodAgent概述简介 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主...
-
Chat2SVG是什么?一文让你看懂Chat2SVG的技术原理、主要功能、应用场景Chat2SVG概述简介 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言大模型(LLMs)和图像扩散模型,实现高质量 ...
-
QwQ-32B是什么?一文让你看懂QwQ-32B的技术原理、主要功能、应用场景QwQ-32B概述简介 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上...
-
Light-R1是什么?一文让你看懂Light-R1的技术原理、主要功能、应用场景Light-R1概述简介 Light-R1是360智脑开源的AI大模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qw...
-
SpatialVLA是什么?一文让你看懂SpatialVLA的技术原理、主要功能、应用场景SpatialVLA概述简介 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构一起推出的新型空间具身通用操作模...
-
TheoremExplainAgent是什么?一文让你看懂TheoremExplainAgent的技术原理、主要功能、应用场景TheoremExplainAgent概述简介 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理...
-
Aya Vision是什么?一文让你看懂Aya Vision的技术原理、主要功能、应用场景Aya Vision概述简介 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 ...
-
BGE-VL是什么?一文让你看懂BGE-VL的技术原理、主要功能、应用场景BGE-VL概述简介 BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL...
-
混元图生视频是什么?一文让你看懂混元图生视频的技术原理、主要功能、应用场景混元图生视频概述简介 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口...
-
Granite 3.2是什么?一文让你看懂Granite 3.2的技术原理、主要功能、应用场景Granite 3.2概述简介 Granite 3.2 是IBM开源的多模态AI大模型系列,具备强大的推理、视觉理解和预测能力。Granite 3....
-
Resume Matcher是什么?一文让你看懂Resume Matcher的技术原理、主要功能、应用场景Resume Matcher概述简介 Resume Matcher 是开源的 AI 简历优化工具,帮助求职者提升简历通过自动化筛选系统(ATS)的概...