语音

收集全球10,000⁺个好用的AI软件

首页 > 语音

TestAI

TestAI是一个专注于AI语音代理的自动化测试与性能分析平台。它通过真实世界的场景模拟和详细的性能评估，帮助企业确保其语音和聊天代理的可靠性和流畅性...
Sesame

Sesame 是一个专注于语音技术的跨学科产品和研究团队，旨在通过自然语音交互，让用户与计算机的交互更加自然和高效。其主要产品包括个人语音伴侣和轻量级...
Llasa

Llasa是一个基于Llama框架的文本到语音（TTS）基础模型，专为大规模语音合成任务设计。该模型利用16万小时的标记化语音数据进行训练，具备高效的...
DuRT

DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。它通过本地 AI 模型和系统服务实现语音的实时识别与翻译，支持多种语音识别方法，提高了识...
Vibe Coder

Vibe Coder 是由 Deepgram 开发的一款开源 VS Code 扩展，旨在探索语音驱动编程的可能性。它利用语音识别技术，让用户通过语音指...
音刻

音刻转录是一款专注于音视频转录的在线工具，通过先进的语音识别技术，能够快速将音频或视频文件转换为文本。其主要优点包括转录速度快、准确率高、支持多种语言...
Spark-TTS

Spark-TTS 是一种基于大语言模型的高效文本到语音合成模型，具有单流解耦语音令牌的特性。它利用大语言模型的强大能力，直接从代码预测的音频进行重建...
Aider.chat

Aider 是一款创新的 AI 辅助编程工具，旨在通过与大型语言模型（LLM）集成，帮助开发者在本地代码库中高效完成编程任务。它支持多种流行编程语言，...
KokoroTTS

Kokoro TTS 是一款强大的文本转语音工具，支持多种语言和语音融合功能，能够将 EPUB、PDF 和 TXT 文件转换为高质量的语音输出。该工具...
Sesame AI

Sesame AI 代表了下一代语音合成技术，通过结合先进的人工智能技术和自然语言处理，能够生成极其逼真的语音，具备真实的情感表达和自然的对话流程。该...
Zonos TTS

Zonos TTS 是一款先进的 AI 文本转语音技术，支持多语言、情感控制和零样本语音克隆。它能够生成自然、富有表现力的语音，适用于教育、有声读物、...
Sesame CSM

CSM 是一个由 Sesame 开发的对话式语音生成模型，它能够根据文本和音频输入生成高质量的语音。该模型基于 Llama 架构，并使用 Mimi 音...
CSM 1B

CSM 1B 是一个基于 Llama 架构的语音生成模型，能够从文本和音频输入中生成 RVQ 音频代码。该模型主要应用于语音合成领域，具有高质量的语音...
Orpheus TTS

Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统，旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力...
OpenAI.fm

OpenAI.fm 是一个互动演示平台，允许开发者体验 OpenAI API 中的最新文本转语音模型gpt-4o-transcribe， gpt-4o...
Podcastle AI Voices

这是一个强大的文本转语音生成器，拥有超过 1000 种高质量的 AI 语音。适合各种使用场景，如播客、教育和商业内容创作。用户可以利用该平台生成清晰、...
Qwen2.5-Omni

Qwen2.5-Omni 是阿里云通义千问团队推出的新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多...
Grimo

Grimo 是一个高效的 AI 文本编辑器，结合最新的 AI 模型，如 DeepSeek R1 和 OpenAI GPT-4，致力于提升用户的写作体验...
Vapi

Vapi 是一个为开发者设计的语音 AI 代理平台，支持企业从初创公司到财富 500 强的各种需求。其灵活的 API 设计和多种语言支持使得它在电话运...
AskVia

Ask Via是一款基于AI技术的聊天机器人，可以帮助用户回答问题、完成任务。通过与WhatsApp无缝集成，使用GPT-3.5技术，Ask Via能...

«
1
2
...
34
35
36
37
38
39
40
...
42
43
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们