标签: KV Cache

Agent Harness 1 Coding Agent 1 Context Engineering 3 DPO 1 ECPE 2 Harness Engineering 1 KV Cache 3 LLM 23 NER 1 RLHF 1 RoPE 1 agent 5 chaofa 9 git 1 month-summary 11 multimodal 1 paper 7 python-type-tutorial 3 python-typing-tutorial 3 transformer 12 year-summary 1 倒排索引 1 入门算法 1 公开表达 5 关于我 1 分词 3 友链 1 实体识别 1 工作 2 序列标注 1 我的朋友 1 搜索技术 1 数学题 1 杂谈 38 算法妙用 2 算法实现 1 自媒体 5 面试锦囊 2

Agent 系统中的 Prompt Caching 设计（下）：上下文管理与子代理架构

深入分析 AI Agent 的上下文管理策略：Context Rot 问题、Cache-Safe Compaction、Plan 模式演进、文件系统作为延展记忆、子代理 Cache 友好设计，以及 The Bitter Lesson。

2026年02月22日 agent system design agent LLM KV Cache Context Engineering

Agent 系统中的 Prompt Caching 设计（上）：Cache 破坏、Prompt 布局与工具管理

深入分析 AI Agent 为什么比 Chatbot 更需要 Prompt Caching，什么操作会破坏 Cache，以及 Claude Code、Manus、OpenAI Codex 在 Prompt 布局和工具管理上的 Cache-aware 设计实践。

2026年02月22日 agent system design agent LLM KV Cache Context Engineering

理解 KV Cache 与 Prompt Caching：LLM 推理加速的核心机制

深入理解 KV Cache 的原理、Prefill/Decode 两阶段与 Compute Bound/Memory Bound 的关系，以及 Prompt Caching（前缀缓存）如何实现推理加速和成本节约。

2026年02月21日 agent system design LLM transformer KV Cache

Chaofa Yuan

袁朝发的个人技术博客，做了一个播客叫做《逃逸速度》，喜欢折腾各种各样的事情，业余野生视频博主，专业大模型算法工程师，尝试做一些有意义的事情

83 归档 83 文章 16 分类 38 标签