收集全球10,000⁺个好用的AI软件
-
Kiroku是什么?一文让你看懂Kiroku的技术原理、主要功能、应用场景Kiroku概述简介 Kiroku是多智能体系统,辅助用户组织和撰写文档。灵感源自创始人在斯坦福大学攻读博士期间的学术写作经历,Kiroku模拟学生...
-
Vision Search Assistant是什么?一文让你看懂Vision Search Assistant的技术原理、主要功能、应用场景Vision Search Assistant概述简介 Vision Search Assistant(VSA)是结合视觉语言大模型(VLMs)和网...
-
MVDrag3D是什么?一文让你看懂MVDrag3D的技术原理、主要功能、应用场景MVDrag3D概述简介 MVDrag3D是创新的3D编辑框架,结合多视图生成和重建先验实现灵活且富有创造性的拖拽编辑。框架用多视图扩散模型作为生成...
-
Chonkie是什么?一文让你看懂Chonkie的技术原理、主要功能、应用场景Chonkie概述简介 Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本...
-
MSQA是什么?一文让你看懂MSQA的技术原理、主要功能、应用场景MSQA概述简介 MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身A...
-
Excalidraw是什么?一文让你看懂Excalidraw的技术原理、主要功能、应用场景Excalidraw概述简介 Excalidraw是开源的在线白板工具,拥有简洁的手绘风格和实时协作功能。Excalidraw完全在浏览器中运行,无...
-
RMBG-2.0是什么?一文让你看懂RMBG-2.0的技术原理、主要功能、应用场景RMBG-2.0概述简介 RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA...
-
JanusFlow是什么?一文让你看懂JanusFlow的技术原理、主要功能、应用场景JanusFlow概述简介 JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言大模型与校正...
-
SWE-Kit是什么?一文让你看懂SWE-Kit的技术原理、主要功能、应用场景SWE-Kit概述简介 SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环...
-
云锦天章是什么?一文让你看懂云锦天章的技术原理、主要功能、应用场景云锦天章概述简介 云锦天章是彩云科技推出的基于DCFormer架构的通用大模型,DCFormer在性能上实现对传统Transformer模型1.7-...
-
MikuDance是什么?一文让你看懂MikuDance的技术原理、主要功能、应用场景MikuDance概述简介 MikuDance是基于扩散模型的动画生成技术,整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运...
-
MATRIX-Gen是什么?一文让你看懂MATRIX-Gen的技术原理、主要功能、应用场景MATRIX-Gen概述简介 MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的A...
-
BodyTalk是什么?一文让你看懂BodyTalk的技术原理、主要功能、应用场景BodyTalk概述简介 BodyTalk是Panjaya推出的AI视频配音工具,基于生成性AI技术,将视频中的人物声音转换为其他语言,自动调整视频...
-
Windsurf是什么?一文让你看懂Windsurf的技术原理、主要功能、应用场景Windsurf概述简介 Windsurf 是Codeium公司推出的AI编程工具,具备实时协作功能,支持多系统,提供了强大的上下文感知能力。Win...
-
OmniParse是什么?一文让你看懂OmniParse的技术原理、主要功能、应用场景OmniParse概述简介 OmniParse是数据解析平台,将非结构化数据转换为结构化、可操作的数据,优化适用于GenAI(大型语言大模型)应用。...
-
Promptim是什么?一文让你看懂Promptim的技术原理、主要功能、应用场景Promptim概述简介 Promptim是实验性的AI提示优化库,基于自动化流程提升AI系统在特定任务上的提示效果。用户提供初始提示、数据集和自定...
-
TinyTroupe是什么?一文让你看懂TinyTroupe的技术原理、主要功能、应用场景TinyTroupe概述简介 TinyTroupe是microsoft推出的实验性Python库,用在模拟具有特定个性、兴趣和目标的人工代理(Tin...
-
Thinking Claude是什么?一文让你看懂Thinking Claude的技术原理、主要功能、应用场景Thinking Claude概述简介 Thinking Claude是基于深度思考协议和浏览器扩展工具,增强AI大模型Claude-3.5的“深度...
-
OmniVision是什么?一文让你看懂OmniVision的技术原理、主要功能、应用场景OmniVision概述简介 OmniVision是紧凑的多模态模型,拥有968M参数,专为边缘设备优化。OmniVision能处理视觉和文本输入,...
-
Free Video-LLM是什么?一文让你看懂Free Video-LLM的技术原理、主要功能、应用场景Free Video-LLM概述简介 Free Video-LLM是创新的无需训练的高效视频语言大模型,基于提示引导的视觉感知技术,实现对视频内容的...