跳到主要内容

Voice

OpenHuman 支持语音交互，让您在不方便打字时也能与 agent 沟通。

语音设置

启用语音

进入 Settings → Voice
启用 语音交互
选择输入/输出设备

配置选项

选项	说明
STT 语言	语音识别的目标语言
TTS 声音	合成语音的声音选择
唤醒词	开启语音的触发词（默认关闭）
麦克风	选择输入设备

使用方式

语音输入

按住空格键说话，说完后松开。您的语音会被转换为文字发送给 agent。

语音输出

agent 的回复会通过 TTS 朗读出来。您可以在设置中选择是否启用此功能。

唤醒词（可选）

启用后，您可以说 "Hey OpenHuman" 来激活语音输入，无需按键。

声音模型

OpenHuman 提供多种声音选项：

声音	风格
`default`	中性
`friendly`	友好、温暖
`professional`	专业、正式

隐私说明

语音输入在本地处理
音频缓冲区不被存储
所有处理通过可信赖的后端服务

故障排除

语音识别不准确

检查麦克风是否正确选择
确认网络连接正常
在安静环境中使用

TTS 无声音

检查输出设备音量
确认 TTS 功能已启用
尝试重启应用

下一步

STT & TTS - 技术细节
本地 AI - 本地语音处理

语音设置
- 启用语音
- 配置选项
使用方式
声音模型
隐私说明
故障排除
- 语音识别不准确
- TTS 无声音
下一步