收集全球10,000⁺个好用的AI软件
-
ReCamMaster是什么?一文让你看懂ReCamMaster的技术原理、主要功能、应用场景ReCamMaster概述简介 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训...
-
Stable Virtual Camera是什么?一文让你看懂Stable Virtual Camera的技术原理、主要功能、应用场景Stable Virtual Camera概述简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能...
-
Instella是什么?一文让你看懂Instella的技术原理、主要功能、应用场景Instella概述简介 Instella是AMD推出的系列30亿参数的开源语言大模型。模型完全从零开始在AMD Instinct™ MI300X ...
-
Maestro是什么?一文让你看懂Maestro的技术原理、主要功能、应用场景Maestro概述简介 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和...
-
OLMo 2 32B是什么?一文让你看懂OLMo 2 32B的技术原理、主要功能、应用场景OLMo 2 32B概述简介 OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言大模型,是 OLMo...
-
InternVL是什么?一文让你看懂InternVL的技术原理、主要功能、应用场景InternVL概述简介 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViT-MLP...
-
Umi-OCR是什么?一文让你看懂Umi-OCR的技术原理、主要功能、应用场景Umi-OCR概述简介 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网,解压即用,支持截图、批量图片、PDF 扫描件的文字识别,能...
-
Orpheus TTS是什么?一文让你看懂Orpheus TTS的技术原理、主要功能、应用场景Orpheus TTS概述简介 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生...
-
o1-pro是什么?一文让你看懂o1-pro的技术原理、主要功能、应用场景o1-pro概述简介 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势...
-
Crack Coder是什么?一文让你看懂Crack Coder的技术原理、主要功能、应用场景Crack Coder概述简介 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐...
-
YT Navigator是什么?一文让你看懂YT Navigator的技术原理、主要功能、应用场景YT Navigator概述简介 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube...
-
Step-Video-TI2V是什么?一文让你看懂Step-Video-TI2V的技术原理、主要功能、应用场景Step-Video-TI2V概述简介 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video...
-
Dify-Plus是什么?一文让你看懂Dify-Plus的技术原理、主要功能、应用场景Dify-Plus概述简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Di...
-
gpt-4o-transcribe是什么?一文让你看懂gpt-4o-transcribe的技术原理、主要功能、应用场景gpt-4o-transcribe概述简介 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,...
-
GPT-4o mini TTS是什么?一文让你看懂GPT-4o mini TTS的技术原理、主要功能、应用场景GPT-4o mini TTS概述简介 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语...
-
福棠·百川是什么?一文让你看懂福棠·百川的技术原理、主要功能、应用场景福棠·百川概述简介 福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见...
-
Agent TARS是什么?一文让你看懂Agent TARS的技术原理、主要功能、应用场景Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统...
-
gpt-4o-mini-transcribe是什么?一文让你看懂gpt-4o-mini-transcribe的技术原理、主要功能、应用场景gpt-4o-mini-transcribe概述简介 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-...
-
SpatialLM是什么?一文让你看懂SpatialLM的技术原理、主要功能、应用场景SpatialLM概述简介 SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄...
-
Multi-Agent Orchestrator是什么?一文让你看懂Multi-Agent Orchestrator的技术原理、主要功能、应用场景Multi-Agent Orchestrator概述简介 Multi-Agent Orchestrator 是用于管理和协调多个智能代理(Agent...