跳到主要内容

语音(STT 和 TTS)

OpenHuman 有一个语音层,因此 agent 可以朗读文本,您可以说话而不是打字。

语音转文本(STT)

  • 按需从麦克风捕获
  • 流式传输到后端进行转录
  • 支持多种语言

文本转语音(TTS)

  • 将生成的音频直接流式传输到您的扬声器
  • 不存储 - 生成后丢弃
  • 支持多种语音

语音设置

设置 → 语音 中:

  • 麦克风 - 选择输入设备
  • 语音模型 - 选择语音配置文件
  • 语言 - STT 语言偏好
  • 唤醒词 - 可选的"Hey OpenHuman"激活(默认关闭)

隐私说明

音频缓冲区在本地处理,不写入磁盘。见隐私与安全

另见