第 3 页 | chaofa用代码打点酱油

2025-05-35岁之前赚不到一千万是我的错吗？

小镇青年、一直在一线大厂，工作也很努力，学历也不差，一技之长（写代码），也没有离谱投资和创业，但是离赚一千万远得有点离谱。哪怕算上未来的通胀、非线性的增长，甚至出现奇迹般的狗屎运，也几乎无法达到这个目标。所以到底是哪里出了问题呢？

2025年06月02日月度总结杂谈 chaofa month-summary

自适应快慢思考推理模型（Adaptive Reasoning Model）：Qwen3混合思考->字节AdaCoT->清华AdaptThinking

深入分析三个快慢思考模型的实现：阿里Qwen3通过SFT实现的混合思考、字节AdaCoT基于RL的帕累托最优化、清华AdaThinking的受限优化框架。详细解读代码实现、训练方法和实验效果，探讨如何让模型在保持准确率的同时减少不必要的思考过程。对于想了解大模型推理优化的读者很有帮助。

2025年05月25日 paper-reading LLM paper

2025-04-努力不是做好事情最重要的因素

努力并不是工作能做好最重要的因素。关键的问题、适当的时机、有效的思考，这些可能都比努力更重要，我真应该多审视一下自己的目标是什么，而不是无效的忙碌~

2025年05月04日月度总结杂谈 chaofa month-summary

DeepSeek-GRM：Inferene-time Scaling 的 Generalist Reward Model(通用奖励模型)

DeepSeek团队提出全新通用奖励模型DeepSeek-GRM，通过Self-Principled Critique Tuning（SPCT）方法实现推理时动态扩展能力。该研究突破传统规则奖励模型的局限，在角色扮演、创意写作等开放领域展现卓越性能。27B小模型效果超越340B大模型，且具备更少领域偏差。文章详解训练策略（RFT+在线强化学习）和推理优化（投票机制+元奖励引导），实验结果证实推理时扩展可显著提升效果，这是 DeepSeek-R2 的前兆吗？

2025年05月03日 paper-reading LLM paper

2025-03-走慢些，走远点

走慢些，走远点。整个 Q1 都处于比较紧张的状态，工作日忙工作，周末学点知识或者做视频，整个人非常地疲劳，但已经明显感觉到不可持续了。而无论是工作、开源项目还是投资，都是需要长期地投入，并且保持耐心，适当的放松是为了走得更远。

2025年03月30日月度总结杂谈 chaofa month-summary

MLA(2)：从代码和公式角度理解 DeepSeek MLA 的矩阵吸收 (Projection Absorption)

从代码角度深入理解 DeepSeek MLA 算法。从代码角度详细解析 MLA（Multi-head Latent Attention）算法的核心思想，如何通过矩阵吸收来优化 KV Cache。

2025年03月16日 hands-on-code transformer LLM

2025-02-努力真是又痛苦又充实

回首每一天，似乎都有挺多的遗憾，因为想要做的事情太多了，但是当月底回望这一个月，我觉得很满意了，我想这一次应该是不一样的开始。

2025年03月08日月度总结杂谈 chaofa month-summary

深度解读 Kimi-K1.5，真正了解 RL 数据是怎么筛选的

深度解读 Kimi K1.5 论文，介绍其多模态推理模型的技术原理与发展路线，涵盖预训练、监督微调、强化学习及其核心启发，提供详细的算法处理细节和数据构建方法。

2025年03月01日 paper-reading LLM paper

自顶向下方式深度解读 DeepSeek-R1，内含大量细节

从自顶向下的方式深度解读 DeepSeek-R1 论文，介绍其技术原理与发展路线，涵盖 DeepSeek-R1-Zero、DeepSeek-R1 及其蒸馏模型的训练方法和核心启发。

2025年02月22日 paper-reading LLM paper

MLA(1)：从代码角度学习和彻底理解 DeepSeek MLA 算法

从代码角度深入理解 DeepSeek MLA 算法。从代码角度详细解析 MLA（Multi-head Latent Attention）算法的核心思想、ROPE 位置编码的兼容性问题，以及如何通过矩阵吸收来优化 KV Cache。

2025年02月05日 hands-on-code transformer LLM

Chaofa Yuan

袁朝发的个人技术博客，做了一个播客叫做《逃逸速度》，喜欢折腾各种各样的事情，业余野生视频博主，专业大模型算法工程师，尝试做一些有意义的事情

83 归档 83 文章 16 分类 38 标签