多

收集全球10,000⁺个好用的AI软件

首页 > 多

EVI 2

EVI 2是Hume AI推出的新型基础语音对语音模型，能够以接近人类的自然方式与用户进行流畅对话。它具备快速响应、理解用户语调、生成不同语调、以及执...
LLaMA-Omni

LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的低延迟、高质量的端到端语音交互模型，旨在实现GPT-4o级别的语音能力。...
EMOVA

EMOVA（EMotionally Omni-present Voice Assistant）是一个多模态语言模型，它能够进行端到端的语音处理，同时保...
Whisper large-v3-turbo

Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。它在超过500万小时的标记数据上进行训...
LiveKit Agents

LiveKit Agents 是一个端到端框架，它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手（AI代理）。它通过集成O...
Rev AI

Rev AI提供高精度的语音转录服务，支持58种以上语言，能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练，为视频和...
FineVoice

FineVoice是一个多功能的AI配音平台，它使用先进的人工智能技术，为用户提供逼真的个性化语音服务。这个平台不仅可以将文本转换为自然逼真的声音，还...
Praises

Praises是一款文本转语音（TTS）工具，它通过将文本转换为语音输出，帮助用户更轻松地获取信息。这款工具支持多种API，包括Azure API、E...
AsrTools

AsrTools是一款基于人工智能技术的语音转文字工具，它通过调用大厂的ASR服务接口，实现了无需GPU和复杂配置的高效语音识别功能。该工具支持批量处...
Audeus

Audeus for Chrome是一款文本转语音的Chrome浏览器扩展程序，它通过使用人工智能技术，将网页、文档等文本内容转化为语音，帮助用户在阅...
FunASR

FunASR是一款语音离线文件转写服务软件包，集成了语音端点检测、语音识别、标点等模型，能够将长音频与视频转换成带标点的文字，并支持多路请求同时转写。...
openai-realtime-api

openai-realtime-api是一个TypeScript客户端，用于与OpenAI的实时语音API进行交互。它提供了强类型的特性，并且是Ope...
d1tools文字转语音

文字转语音工具是一款在线服务产品，它能够将文本内容转换成自然流畅的语音输出，支持74种不同的语言和318种不同的声音风格。这项技术的应用场景广泛，包括...
TEN Agent

TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎，为开发者提供快速、高效的工具来构建实时对话式 AI Agent，如AI虚拟客服、AI...
Spirit LM

Spirit LM是一个基础多模态语言模型，能够自由混合文本和语音。该模型基于一个7B预训练的文本语言模型，通过持续在文本和语音单元上训练来扩展到语音...
ElevenLabs Voice Design

ElevenLabs Voice Design是一个在线平台，允许用户通过简单的文本提示来设计和生成定制的声音。这项技术的重要性在于它能够快速创建出符...
Dictate Buddy

Dictate Buddy是一款利用人工智能技术将语音转换为文字的应用程序。它支持99种语言，并且能够自动检测语言。该应用使用OpenAI Whisp...
GPTS4O.SO

GPT-4o是OpenAI推出的先进多模态AI平台，它在GPT-4的基础上进一步扩展，实现了真正的多模态方法，涵盖文本、图像和音频。GPT-4o设计上...
Fish Agent V0.1 3B

Fish Agent V0.1 3B是一个开创性的语音转语音模型，能够以前所未有的精确度捕捉和生成环境音频信息。该模型采用了无语义标记架构，消除了传统...
Fish Speech

Fish Speech是一款专注于语音合成的产品，它通过使用先进的深度学习技术，能够将文本转换为自然流畅的语音。该产品支持多种语言，包括中文、英文等，...

«
1
2
...
22
23
24
25
26
27
28
...
35
36
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们