Harness Engineering — Agent 不好用,也许不是模型的问题
同一个模型,只改 Agent Harness,性能从 Top 30 到 Top 5。Harness Engineering 到底是什么?和 Context Engineering 什么关系?以及 The Bitter Lesson 再思考。
同一个模型,只改 Agent Harness,性能从 Top 30 到 Top 5。Harness Engineering 到底是什么?和 Context Engineering 什么关系?以及 The Bitter Lesson 再思考。
解读 Kimi K2.5 论文核心技术:原生多模态联合训练的反共识发现(Early Fusion + 低视觉比例优于 Late Fusion)、Zero-Vision SFT、跨模态双向迁移、Agent Swarm 并行编排框架(PARL)、Toggle Token 效率优化。关注算法与数据创新,而非 benchmark 秀肌肉。
深入分析 AI Agent 的上下文管理策略:Context Rot 问题、Cache-Safe Compaction、Plan 模式演进、文件系统作为延展记忆、子代理 Cache 友好设计,以及 The Bitter Lesson。
深入分析 AI Agent 为什么比 Chatbot 更需要 Prompt Caching,什么操作会破坏 Cache,以及 Claude Code、Manus、OpenAI Codex 在 Prompt 布局和工具管理上的 Cache-aware 设计实践。
本文深入剖析RAG技术的进化历程,从传统RAG到智能体RAG的全面升级。探索两种实现Agentic RAG的关键路径:提示工程+工具调用与强化学习驱动方法。通过解读企业级项目chatbox和Search-R1,揭示如何让大模型从"被动检索"转变为"主动决策",实现更精准的知识获取与应用。无论你是AI研发工程师还是产品经理,这篇文章都将帮你理解RAG技术的未来发展方向,掌握构建更智能RAG系统的核心技术。