跳到主要内容

Token 压缩

模型有固定的上下文窗口。Token 压缩是 OpenHuman 保持长对话、大型记忆树和冗长工具结果不会达到该上限的方式。

压缩内容

来源	方法
网络搜索结果	片段提取 - 保留前 3 个结果，丢弃其余
网络抓取器输出	剥离 + 在 1 MB 输入 / 50 K 输出处截断
记忆召回结果	在将块传递给模型之前进行语义去重
长工具输出	带"见文件"提示的行号截断
对话历史	当轮数超过窗口时重写摘要

工作原理

原始输入 → 过滤器（广告、导航、样板）→ 块 → 去重 → 总结（如超过限制）→ 模型

配置

标志	默认	功能
`MAX_SEARCH_RESULTS`	3	每次搜索保留的结果数
`MAX_SCRAPE_BYTES`	1 MB	每页输入上限
`MAX_MEMORY_CHUNKS`	20	每次查询召回的块数

另见

网络搜索 - 压缩前的搜索结果
网络抓取器 - 压缩前的页面内容
记忆工具 - 压缩前的召回结果

压缩内容
工作原理
配置
另见