Voice
OpenHuman 支持语音交互,让您在不方便打字时也能与 agent 沟通。
语音设置
启用语音
- 进入 Settings → Voice
- 启用 语音交互
- 选择输入/输出设备
配置选项
| 选项 | 说明 |
|---|---|
| STT 语言 | 语音识别的目标语言 |
| TTS 声音 | 合成语音的声音选择 |
| 唤醒词 | 开启语音的触发词(默认关闭) |
| 麦克风 | 选择输入设备 |
使用方式
语音输入
按住空格键说话,说完后松开。您的语音会被转换为文字发送给 agent。
语音输出
agent 的回复会通过 TTS 朗读出来。您可以在设置中选择是否启用此功能。
唤醒词(可选)
启用后,您可以说 "Hey OpenHuman" 来激活语音输入,无需按键。
声音模型
OpenHuman 提供多种声音选项:
| 声音 | 风格 |
|---|---|
default | 中性 |
friendly | 友好、温暖 |
professional | 专业、正式 |
隐私说明
- 语音输入在本地处理
- 音频缓冲区不被存储
- 所有处理通过可信赖的后端服务
故障排除
语音识别不准确
- 检查麦克风是否正确选择
- 确认网络连接正常
- 在安静环境中使用
TTS 无声音
- 检查输出设备音量
- 确认 TTS 功能已启用
- 尝试重启应用