OpenHuman 有一个语音层,因此 agent 可以朗读文本,您可以说话而不是打字。
语音转文本(STT)
- 按需从麦克风捕获
- 流式传输到后端进行转录
- 支持多种语言
文本转语音(TTS)
- 将生成的音频直接流式传输到您的扬声器
- 不存储 - 生成后丢弃
- 支持多种语音
语音设置
在 设置 → 语音 中:
- 麦克风 - 选择输入设备
- 语音模型 - 选择语音配置文件
- 语言 - STT 语言偏好
- 唤醒词 - 可选的"Hey OpenHuman"激活(默认关闭)
隐私说明
音频缓冲区在本地处理,不写入磁盘。见隐私与安全。