收集全球10,000⁺个好用的AI软件
-
DeepScaleR-1.5B-PreviewDeepScaleR-1.5B-Preview 是一个经过强化学习优化的大型语言模型,专注于提升数学问题解决能力。该模型通过分布式强化学习算法,显著提...
-
PIKE-RAGPIKE-RAG 是微软开发的一种领域知识和推理增强生成模型,旨在通过知识提取、存储和推理逻辑增强大型语言模型(LLM)的能力。该模型通过多模块设计,...
-
Stable Audio OpenStable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
-
YuEYuE 是由香港科技大学和多模态艺术投影团队开发的开源音乐生成模型。它能够根据给定的歌词生成长达 5 分钟的完整歌曲,包括人声和伴奏部分。该模型通过多...
-
Stable Audio OpenStable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
-
hertz-devhertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型,拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
-
hertz-devhertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型,拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
-
Kokoro-82MKokoro-82M是一个由hexgrad创建并托管在Hugging Face上的文本到语音(TTS)模型。它具有8200万参数,使用Apache 2...
-
Llasa-3BLlasa-3B 是一个强大的文本到语音(TTS)模型,基于 LLaMA 架构开发,专注于中英文语音合成。该模型通过结合 XCodec2 的语音编码技...
-
Llasa-1BLlasa-1B 是一个由香港科技大学音频实验室开发的文本转语音模型。它基于 LLaMA 架构,通过结合 XCodec2 代码本中的语音标记,能够将文...
-
HibikiHibiki 是一款专注于流式语音翻译的先进模型。它通过实时积累足够的上下文信息来逐块生成正确的翻译,支持语音和文本翻译,并可进行声音转换。该模型基于...
-
Zonos-v0.1Zonos-v0.1 是 Zyphra 团队开发的实时文本转语音(TTS)模型,具备高保真语音克隆功能。该模型包含一个 1.6B 参数的 Transf...
-
CSM 1BCSM 1B 是一个基于 Llama 架构的语音生成模型,能够从文本和音频输入中生成 RVQ 音频代码。该模型主要应用于语音合成领域,具有高质量的语音...
-
Qwen2.5Qwen2.5是一系列基于Qwen2语言模型构建的新型语言模型,包括通用语言模型Qwen2.5,以及专门针对编程的Qwen2.5-Coder和数学的Q...
-
Qwen2.5-CoderQwen2.5-Coder是Qwen2.5开源家族的一员,专注于代码生成、推理、修复等任务。它通过扩增大规模代码训练数据,提升了代码能力,同时保持了数...
-
CursorCoreCursorCore是一系列开源模型,旨在通过编程指令对齐来协助编程,支持自动化编辑和内联聊天等功能。这些功能模仿了如Cursor这样的闭源AI辅助编...
-
Qwen2.5-Coder-3B-InstructQwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至...
-
Qwen2.5-Coder-1.5B-InstructQwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力,该模型在训练时使用了5....
-
Qwen2.5-Coder-1.5BQwen2.5-Coder-1.5B是Qwen2.5-Coder系列中的一款大型语言模型,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5...
-
Qwen2.5-Coder-32B-Instruct-GPTQ-Int8Qwen2.5-Coder-32B-Instruct-GPTQ-Int8是Qwen系列中针对代码生成优化的大型语言模型,拥有32亿参数,支持长文本处理...