跳到主要内容

Voice

OpenHuman 支持语音交互,让您在不方便打字时也能与 agent 沟通。

语音设置

启用语音

  1. 进入 Settings → Voice
  2. 启用 语音交互
  3. 选择输入/输出设备

配置选项

选项说明
STT 语言语音识别的目标语言
TTS 声音合成语音的声音选择
唤醒词开启语音的触发词(默认关闭)
麦克风选择输入设备

使用方式

语音输入

按住空格键说话,说完后松开。您的语音会被转换为文字发送给 agent。

语音输出

agent 的回复会通过 TTS 朗读出来。您可以在设置中选择是否启用此功能。

唤醒词(可选)

启用后,您可以说 "Hey OpenHuman" 来激活语音输入,无需按键。

声音模型

OpenHuman 提供多种声音选项:

声音风格
default中性
friendly友好、温暖
professional专业、正式

隐私说明

  • 语音输入在本地处理
  • 音频缓冲区不被存储
  • 所有处理通过可信赖的后端服务

故障排除

语音识别不准确

  1. 检查麦克风是否正确选择
  2. 确认网络连接正常
  3. 在安静环境中使用

TTS 无声音

  1. 检查输出设备音量
  2. 确认 TTS 功能已启用
  3. 尝试重启应用

下一步