跳到主要内容

语音（STT 和 TTS）

OpenHuman 有一个语音层，因此 agent 可以朗读文本，您可以说话而不是打字。

语音转文本（STT）

按需从麦克风捕获
流式传输到后端进行转录
支持多种语言

文本转语音（TTS）

将生成的音频直接流式传输到您的扬声器
不存储 - 生成后丢弃
支持多种语音

语音设置

在 设置 → 语音 中：

麦克风 - 选择输入设备
语音模型 - 选择语音配置文件
语言 - STT 语言偏好
唤醒词 - 可选的"Hey OpenHuman"激活（默认关闭）

隐私说明

音频缓冲区在本地处理，不写入磁盘。见隐私与安全。

另见

隐私与安全 - 音频数据处理
本地 AI - 可选的设备上语音处理

语音转文本（STT）
文本转语音（TTS）
语音设置
隐私说明
另见