Token 压缩
模型有固定的上下文窗口。Token 压缩是 OpenHuman 保持长对话、大型记忆树和冗长工具结果不会达到该上限的方式。
压缩内容
| 来源 | 方法 |
|---|---|
| 网络搜索结果 | 片段提取 - 保留前 3 个结果,丢弃其余 |
| 网络抓取器输出 | 剥离 + 在 1 MB 输入 / 50 K 输出处截断 |
| 记忆召回结果 | 在将块传递给模型之前进行语义去重 |
| 长工具输出 | 带"见文件"提示的行号截断 |
| 对话历史 | 当轮数超过窗口时重写摘要 |
工作原理
原始输入 → 过滤器(广告、导航、样板)→ 块 → 去重 → 总结(如超过限制)→ 模型
配置
| 标志 | 默认 | 功能 |
|---|---|---|
MAX_SEARCH_RESULTS | 3 | 每次搜索保留的结果数 |
MAX_SCRAPE_BYTES | 1 MB | 每页输入上限 |
MAX_MEMORY_CHUNKS | 20 | 每次查询召回的块数 |