语音

收集全球10,000⁺个好用的AI软件

首页 > 语音

Ola Friend

Ola Friend是字节跳动豆包推出的首款AI智能体耳机，它通过接入豆包大模型，与豆包APP深度结合，实现了无需打开手机即可通过语音唤醒AI助手的功...
FineVoice

FineVoice是一个多功能的AI配音平台，它使用先进的人工智能技术，为用户提供逼真的个性化语音服务。这个平台不仅可以将文本转换为自然逼真的声音，还...
Praises

Praises是一款文本转语音（TTS）工具，它通过将文本转换为语音输出，帮助用户更轻松地获取信息。这款工具支持多种API，包括Azure API、E...
Echo

Echo是一款结合了人工智能技术的语音和文本笔记应用，它通过AI技术帮助用户组织和提炼思考。Echo利用GPT-4o大型语言模型进行转录、回忆和洞察力...
F5-TTS

F5-TTS是由SWivid团队开发的一个文本到语音合成（TTS）模型，它利用深度学习技术将文本转换为自然流畅、忠实于原文的语音输出。该模型在生成语音...
Image Describer

Image Describer图像描述生成器是一款利用人工智能技术，通过上传图像并根据用户需求输出图像描述的工具。它能够理解图像内容，并生成详细的描述...
NotesGPT

NotesGPT是一款利用人工智能技术将用户的语音笔记转换成有组织的摘要和清晰的行动项的在线服务。它通过先进的语音识别和自然语言处理技术，帮助用户更高...
AsrTools

AsrTools是一款基于人工智能技术的语音转文字工具，它通过调用大厂的ASR服务接口，实现了无需GPU和复杂配置的高效语音识别功能。该工具支持批量处...
Audeus

Audeus for Chrome是一款文本转语音的Chrome浏览器扩展程序，它通过使用人工智能技术，将网页、文档等文本内容转化为语音，帮助用户在阅...
FunASR

FunASR是一款语音离线文件转写服务软件包，集成了语音端点检测、语音识别、标点等模型，能够将长音频与视频转换成带标点的文字，并支持多路请求同时转写。...
openai-realtime-api

openai-realtime-api是一个TypeScript客户端，用于与OpenAI的实时语音API进行交互。它提供了强类型的特性，并且是Ope...
d1tools文字转语音

文字转语音工具是一款在线服务产品，它能够将文本内容转换成自然流畅的语音输出，支持74种不同的语言和318种不同的声音风格。这项技术的应用场景广泛，包括...
Wav2Lip

Wav2Lip 是一个开源项目，旨在通过深度学习技术实现视频中人物的唇形与任意目标语音高度同步。该项目提供了完整的训练代码、推理代码和预训练模型，支持...
TEN Agent

TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎，为开发者提供快速、高效的工具来构建实时对话式 AI Agent，如AI虚拟客服、AI...
Spirit LM

Spirit LM是一个基础多模态语言模型，能够自由混合文本和语音。该模型基于一个7B预训练的文本语言模型，通过持续在文本和语音单元上训练来扩展到语音...
Whispo

Whispo是一款利用人工智能技术的语音听写工具，它能够将用户的语音实时转换成文字。这款工具使用了OpenAI Whisper技术进行语音识别，并支持...
ElevenLabs Voice Design

ElevenLabs Voice Design是一个在线平台，允许用户通过简单的文本提示来设计和生成定制的声音。这项技术的重要性在于它能够快速创建出符...
Say It So

Say It So是一个Chrome扩展程序，允许用户在Google Docs文档中添加语音评论，使反馈、解释和协作更加清晰和个性化。这个工具特别适合...
Dictate Buddy

Dictate Buddy是一款利用人工智能技术将语音转换为文字的应用程序。它支持99种语言，并且能够自动检测语言。该应用使用OpenAI Whisp...
GPTS4O.SO

GPT-4o是OpenAI推出的先进多模态AI平台，它在GPT-4的基础上进一步扩展，实现了真正的多模态方法，涵盖文本、图像和音频。GPT-4o设计上...

«
1
2
...
27
28
29
30
31
32
33
...
42
43
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们