上下文
每个模型一次只能容纳一段对话中有限的内容 — 即它的上下文。OpenChamber 会显示上下文的占满程度,让你知道会话何时接近上限,以及回复何时可能开始丢弃较早的细节。
快速指示器
聊天时,一个小仪表会显示已使用上下文的百分比。随着上下文被填满,它会改变颜色:
- 绿色 — 空间充足
- 黄色 — 渐满(约四分之三)
- 红色 — 接近占满
将鼠标悬停在它上面(在移动端则点按它)可查看准确的 token 计数。
完整上下文面板
打开右侧边栏中的 Context 标签页,可更全面地了解当前会话:
- 正在使用的模型,以及会话开始的时间
- 总 token 数与模型上限的对比
- 消息和成本总计
- 上一条回复的 token 细分
- 大致区分出占用上下文的内容(你的消息、智能体的消息、工具输出)
该细分是估算值,而非精确计数 — 用它来发现是什么在填满窗口,而不是用于计费。
占满时该怎么办
为新任务开启一个新会话,而不要让单个会话无限增长。更短的上下文更快,并能让模型保持专注。
相关内容
- 项目 — 会话按项目分组