百聆
国内AI工具
AI 语音助手 开源 低配置 语音对话 AI音频生成 AI音频编辑

百聆

百聆是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,低配置也可运行,支持打断。

百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。

  • 工具介绍
  • 平替软件
    • 百聆简介概述

      百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。

      需求人群:

      "该产品适合需要高效语音交互体验的用户,无论是日常对话、信息查询还是任务管理,百聆都能提供便捷的语音支持,尤其适合对硬件配置要求不高但对语音交互质量有较高要求的用户。"

      使用场景示例:

      用户可以通过语音指令让百聆查询天气情况,如说‘杭州天气怎么样?’,百聆会返回杭州的天气信息。

      用户可以使用百聆进行雅思口语练习,百聆会生成雅思口语练习题目和对话,帮助用户进行练习。

      用户可以设置定时任务,如说‘每天早上8点提醒我喝水。’,百聆会按照设定的时间提醒用户。

      产品特色:

      高效开源模型:百聆使用多个开源模型,确保高效、可靠的语音对话体验。

      无需GPU:通过优化,可本地部署,仍能提供类GPT-4的性能表现。

      模块化设计:ASR、VAD、LLM和TTS模块相互独立,可根据需求进行替换和升级。

      支持记忆功能:具备持续学习能力,能够记忆用户的偏好与历史对话,提供个性化的互动体验。

      支持工具调用:灵活集成外部工具,用户可通过语音直接请求信息或执行操作,提升助手的实用性。

      支持任务管理:高效管理用户任务,能够跟踪进度、设置提醒,并提供动态更新,确保用户不错过任何重要事项。

      使用教程:

      1. 克隆项目仓库:git clone https://github.com/wwbin2017/bailing.git,然后进入项目目录cd bailing。

      2. 安装所需依赖:pip install -r requirements.txt。

      3. 配置环境变量:打开config/config.yaml配置ASR LLM等相关配置,下载SenseVoiceSmall到目录models/SenseVoiceSmall,并获取deepseek的api_key。

      4. 启动后端服务:cd server,运行python server.py(可选)。

      5. 启动主程序:运行python main.py,系统会等待语音输入,用户即可开始使用百聆进行语音对话。

    © 版权声明:除另有声明外,本站所有内容版权均归卓商AI工具网址导航及原创作者所有,未经允许,任何个人、媒体、网站、团体不得转载或以其他方式抄袭发布本站内容,或在非本站所属服务器上建立镜像,否则我们将保留依法追究相关法律责任的权利。
    当前AI工具AI软件本站不保证其完整性、准确性、合法性、安全性和可用性,用户使用所产生的一切后果自行承担;内容来自网络收集,如有侵犯您的相关权利,请联系我们纠正、删除。
    Hailuo AI Audio

    上一个

    Hailuo AI Audio

    下一个

    Duory
    Duory
    相关AI工具集
    卓商AI
    卓商AI

    AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。