功能

首页 > 功能

ReCamMaster是什么？一文让你看懂ReCamMaster的技术原理、主要功能、应用场景

ReCamMaster概述简介 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架，能根据新的相机轨迹重新生成视频内容。通过预训...
Stable Virtual Camera是什么？一文让你看懂Stable Virtual Camera的技术原理、主要功能、应用场景

Stable Virtual Camera概述简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型，能...
Instella是什么？一文让你看懂Instella的技术原理、主要功能、应用场景

Instella概述简介 Instella是AMD推出的系列30亿参数的开源语言大模型。模型完全从零开始在AMD Instinct™ MI300X ...
Maestro是什么？一文让你看懂Maestro的技术原理、主要功能、应用场景

Maestro概述简介 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制，解决传统测试中常见的不稳定性和...
OLMo 2 32B是什么？一文让你看懂OLMo 2 32B的技术原理、主要功能、应用场景

OLMo 2 32B概述简介 OLMo 2 32B 是 Allen Institute for AI（Ai2）推出的最新开源语言大模型，是 OLMo...
InternVL是什么？一文让你看懂InternVL的技术原理、主要功能、应用场景

InternVL概述简介 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型，专注于视觉与语言任务。采用 ViT-MLP...
Umi-OCR是什么？一文让你看懂Umi-OCR的技术原理、主要功能、应用场景

Umi-OCR概述简介 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网，解压即用，支持截图、批量图片、PDF 扫描件的文字识别，能...
Orpheus TTS是什么？一文让你看懂Orpheus TTS的技术原理、主要功能、应用场景

Orpheus TTS概述简介 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音（TTS）系统。Orpheus TTS 支持生...
o1-pro是什么？一文让你看懂o1-pro的技术原理、主要功能、应用场景

o1-pro概述简介 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本，o1-pro 是目前 OpenAI 最强大的推理模型，核心优势...
Crack Coder是什么？一文让你看懂Crack Coder的技术原理、主要功能、应用场景

Crack Coder概述简介 Crack Coder 是开源的隐形 AI 辅助工具，专为技术面试设计。Crack Coder支持在后台运行，完全隐...
YT Navigator是什么？一文让你看懂YT Navigator的技术原理、主要功能、应用场景

YT Navigator概述简介 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具，帮助用户高效地搜索和浏览 YouTube...
Step-Video-TI2V是什么？一文让你看懂Step-Video-TI2V的技术原理、主要功能、应用场景

Step-Video-TI2V概述简介 Step-Video-TI2V 是阶跃星辰（StepFun）推出的开源图生视频（Image-to-Video...
Dify-Plus是什么？一文让你看懂Dify-Plus的技术原理、主要功能、应用场景

Dify-Plus概述简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，集成基于 gin-vue-admin 的管理中心。Di...
gpt-4o-transcribe是什么？一文让你看懂gpt-4o-transcribe的技术原理、主要功能、应用场景

gpt-4o-transcribe概述简介 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构，...
GPT-4o mini TTS是什么？一文让你看懂GPT-4o mini TTS的技术原理、主要功能、应用场景

GPT-4o mini TTS概述简介 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型，支持将文本内容转换为自然流畅语...
福棠·百川是什么？一文让你看懂福棠·百川的技术原理、主要功能、应用场景

福棠·百川概述简介福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见...
Agent TARS是什么？一文让你看懂Agent TARS的技术原理、主要功能、应用场景

Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容，与浏览器、命令行和文件系统...
gpt-4o-mini-transcribe是什么？一文让你看懂gpt-4o-mini-transcribe的技术原理、主要功能、应用场景

gpt-4o-mini-transcribe概述简介 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型，gpt-...
SpatialLM是什么？一文让你看懂SpatialLM的技术原理、主要功能、应用场景

SpatialLM概述简介 SpatialLM 是群核科技开源的空间理解多模态模型，赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄...
Multi-Agent Orchestrator是什么？一文让你看懂Multi-Agent Orchestrator的技术原理、主要功能、应用场景

Multi-Agent Orchestrator概述简介 Multi-Agent Orchestrator 是用于管理和协调多个智能代理（Agent...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL