收集全球10,000⁺个好用的AI软件
-
OpenManus是什么?一文让你看懂OpenManus的技术原理、主要功能、应用场景OpenManus概述简介 OpenManus 是MetaGPT 团队推出的开源复刻版Manus,提供无需邀请码的 AI Agent 。OpenMa...
-
NEXUS-O是什么?一文让你看懂NEXUS-O的技术原理、主要功能、应用场景NEXUS-O概述简介 NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI大...
-
OWL是什么?一文让你看懂OWL的技术原理、主要功能、应用场景OWL概述简介 OWL(Optimized Workforce Learning)是基于CAMEL-AI框架开发的多智能体协作系统,通过智能体之间的...
-
TicVoice 7.0是什么?一文让你看懂TicVoice 7.0的技术原理、主要功能、应用场景TicVoice 7.0概述简介 TicVoice 7.0 是出门问问推出的第七代高品质 TTS(语音合成)引擎,基于新一代语音生成模型 Spark...
-
GEN3C是什么?一文让你看懂GEN3C的技术原理、主要功能、应用场景GEN3C概述简介 GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视...
-
Mercury Coder是什么?一文让你看懂Mercury Coder的技术原理、主要功能、应用场景Mercury Coder概述简介 Mercury Coder 是 Inception Labs 推出的首个扩散型大语言大模型(dLLM),是 Me...
-
GCDance是什么?一文让你看懂GCDance的技术原理、主要功能、应用场景GCDance概述简介 GCDance(Genre-Controlled 3D Full Body Dance Generation Driven ...
-
LaWGPT是什么?一文让你看懂LaWGPT的技术原理、主要功能、应用场景LaWGPT概述简介 LaWGPT 是南京大学推出的中文法律大语言大模型,基于 LLaMA 模型进行二次预训练,融入大量中文法律知识。专注于法律领域...
-
autoMate是什么?一文让你看懂autoMate的技术原理、主要功能、应用场景autoMate概述简介 autoMate是基于AI和RPA的本地自动化工具,用自然语言实现复杂任务的自动化操作。autoMate基于大型语言大模型...
-
URO-Bench是什么?一文让你看懂URO-Bench的技术原理、主要功能、应用场景URO-Bench概述简介 URO-Bench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任...
-
Nanobrowser是什么?一文让你看懂Nanobrowser的技术原理、主要功能、应用场景Nanobrowser概述简介 Nanobrowser 是开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。Nanobrowser基于...
-
DINO-XSeek是什么?一文让你看懂DINO-XSeek的技术原理、主要功能、应用场景DINO-XSeek概述简介 DINO-XSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINO-XSee...
-
AppAgentX是什么?一文让你看懂AppAgentX的技术原理、主要功能、应用场景AppAgentX概述简介 AppAgentX 是西湖大学推出的新型自我进化式 GUI(图形用户界面)代理框架,基于从执行历史中抽象出高级动作提升代...
-
GO-1是什么?一文让你看懂GO-1的技术原理、主要功能、应用场景GO-1概述简介 GO-1(Genie Operator-1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用Vision-Lang...
-
Gemini Embedding是什么?一文让你看懂Gemini Embedding的技术原理、主要功能、应用场景Gemini Embedding概述简介 Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量...
-
DoraCycle是什么?一文让你看懂DoraCycle的技术原理、主要功能、应用场景DoraCycle概述简介 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-...
-
IMAGPose是什么?一文让你看懂IMAGPose的技术原理、主要功能、应用场景IMAGPose概述简介 IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的...
-
Heygem是什么?一文让你看懂Heygem的技术原理、主要功能、应用场景Heygem概述简介 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照...
-
LanDiff是什么?一文让你看懂LanDiff的技术原理、主要功能、应用场景LanDiff概述简介 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言大模型(LLM)和扩散模型(Diffus...
-
FoxBrain是什么?一文让你看懂FoxBrain的技术原理、主要功能、应用场景FoxBrain概述简介 FoxBrain 是鸿海研究院推出的繁体中文大型语言大模型(LLM),具有强大的推理能力。基于 Meta Llama 3....