收集全球10,000⁺个好用的AI软件
-
kg-genkg-gen 是一个基于人工智能的工具,能够从普通文本中提取知识图谱。它支持处理小到单句话、大到长篇文档的文本输入,并且可以处理对话格式的消息。该工具...
-
Awesome-LLM-Post-trainingAwesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。它提供了关于 LLM 后训练的深入研究,包括...
-
Light-R1-14B-DSLight-R1-14B-DS 是由北京奇虎科技有限公司开发的开源数学模型。该模型基于 DeepSeek-R1-Distill-Qwen-14B 进行...
-
Art Review GeneratorArt Review Generator是一个自然语言处理工具和文本生成器,通过使用来自Artforum的57年艺术评论的训练数据,生成中等长度的句子...
-
Natural Language Playlist自然语言播放列表是一款由人工智能生成的混音带应用。通过使用自然语言描述,用户可以定制自己想要的歌曲混音带,AI会根据描述自动生成符合要求的播放列表。这...
-
MusicGPTMusicGPT 是一款允许在任何平台上以高性能方式在本地运行最新音乐生成 AI 模型的应用程序。它支持文本条件音乐生成、旋律条件音乐生成以及不确定长...
-
ai-discord-bot-PigPigPigPig是一个基于多模态大型语言模型(LLM)的Discord机器人,旨在通过自然语言与用户互动。它结合了先进的AI能力和实用功能,为Discor...
-
AudioSepAudioSep是一种基于自然语言查询的开放领域音频源分离模型。它由文本编码器和分离模型两个关键组件组成。我们在大规模多模态数据集上训练AudioSe...
-
AudioboxAudiobox是Meta的新一代音频生成研究模型,可以利用语音输入和自然语言文本提示生成声音和音效,轻松为各种用例创建定制音频。Audiobox系列...
-
NotebookLlamaNotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到Podcast的工作流。该项目涵盖了从文本预处理到使用文本到...
-
OmniAudio-2.6BOmniAudio-2.6B是一个2.6B参数的多模态模型,能够无缝处理文本和音频输入。该模型结合了Gemma-2B、Whisper turbo和一个...
-
video-analyzervideo-analyzer是一个视频分析工具,它结合了Llama的11B视觉模型和OpenAI的Whisper模型,通过提取关键帧、将它们输入视觉模...
-
TikTokVoice AI Sound Effect GeneratorAI Sound Effect Generator是一款革命性的工具,它利用先进的AI技术将书面描述转换成自定义音效。该技术结合了自然语言处理和神经音...
-
Stability AI text-to-speech modelsStability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。它通过标注不同的说话者身份、风格和录音条件来...
-
BASE TTSBASE TTS是亚马逊开发的大规模文本到语音合成模型,运用了10亿参数的自动回归转换器,可将文本转换成语音代码,再通过卷积解码器生成语音波形。该模型...
-
OngkanonOngkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏...
-
Hume AI EVIHume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基...
-
Boff AIboff.ai是一款基于人工智能的语音识别和自然语言处理技术的网站。它的主要优点是快速准确地识别用户的语音输入并能够理解其意图,从而提供相应的回答和建...
-
RetellRetell AI是一个强大的AI代理构建平台,允许用户快速构建和测试复杂的工作流程,并通过电话呼叫、网络呼叫或任何其他地方部署它们。该平台支持使用任...
-
Gemini 1.5 FlashGemini 1.5 Flash是Google DeepMind团队推出的最新AI模型,它通过蒸馏过程从更大的1.5 Pro模型中提炼出核心知识和技能...