收集全球10,000⁺个好用的AI软件
-
SpeechZapSpeechZap是一款专注于语音转文字的在线服务,它能够将用户的语音快速准确地转换成文字,极大地提高了工作效率和信息记录的便捷性。该产品以其高准确性...
-
WeSTWeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和...
-
PandratorPandrator 是一个基于开源软件的工具,能够将文本、PDF、EPUB 和 SRT 文件转换成多种语言的语音音频,包括语音克隆、基于LLM的文本预...
-
逗逗游戏伙伴逗逗是一款AI游戏伙伴APP,为用户提供了智能陪玩、情绪陪伴、智能攻略、笑话锦集以及多种角色扮演等功能。它能够根据用户的需求提供个性化的互动体验,增强...
-
Qwen2 Audio Instruct DemoQwen2 Audio Instruct Demo 是一个基于音频指令的交互式演示网站,它利用最新的人工智能技术,让用户通过语音指令与网页进行互动。这...
-
whisper-diarizationwhisper-diarization是一个结合了Whisper自动语音识别(ASR)能力、声音活动检测(VAD)和说话人嵌入技术的开源项目。它通过提...
-
SilviaSilvia是一款能够适应用户说话方式的语音输入系统,支持用户在不同语言之间自由切换,即使在句子中也能无缝切换。它支持英语和西班牙语,并且即将支持法语...
-
Gan.AIGan.AI是一个专注于对话式人工智能研究和产品的公司,致力于通过其先进的AI技术,为全球知名品牌提供个性化的视频和音频通信解决方案。该公司的产品和技...
-
Bailing-TTSBailing-TTS是由Giant Network的AI Lab开发的大型文本到语音(TTS)模型系列,专注于生成高质量的中文方言语音。该模型采用持...
-
NotHotDogNotHotDog是一个专注于自动化测试AI代理和语音AI应用的平台。它通过提供自动化、可复用的语音测试案例,简化了对语音API、WebSocket ...
-
Felo实时翻译Felo实时翻译是一款应用最新AI技术,提供实时语音翻译服务的应用程序。它通过GPT技术实现高速和高精度的翻译,支持实时转录语音并识别语种,将语音转录...
-
汉王语音王汉王语音王App是汉王科技基于自研多模态天地大模型,自主研发的智能语音旗舰应用。它集AI语音记录、智能翻译与同声传译于一体,支持AI精准转写、拍录同步...
-
speech-to-speechspeech-to-speech 是一个开源的模块化GPT4-o项目,通过语音活动检测、语音转文本、语言模型和文本转语音等连续部分实现语音到语音的转换...
-
FitCheck AIFitCheck AI是一个创新的在线时尚顾问平台,利用人工智能技术为用户提供个性化的服装推荐和实时风格分析。它通过摄像头进行实时风格分析,并通过语音...
-
TikTok Voice GeneratorTikTok Voice Generator是一个基于最新TikTok文本到语音技术的工具,能够生成多种有趣且逼真的AI语音效果,如Jessie语音、...
-
Open-LLM-VTuberOpen-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。该...
-
HammingHamming是一个端到端的AI语音代理测试平台,支持从开发到生产的全流程。它通过自动化语音角色创建成千上万的并发电话呼叫,以测试和发现语音代理中的b...
-
ChatTTS-OpenVoiceChatTTS-OpenVoice是一个结合了ChatTTS和OpenVoice技术的语音克隆模型。它通过上传10秒音频片段,可以克隆个性化的语音,并...
-
Seed-ASRSeed-ASR是由字节跳动公司开发的基于大型语言模型(Large Language Model, LLM)的语音识别模型。它通过将连续的语音表示和上...
-
Daily BotsDaily Bots是一个开源云平台,专注于提供超低延迟的语音和视频人工智能服务。它支持开发者构建和托管实时的全球基础设施上的代理,并利用快速增长的开...