归档 共 79 篇
2026
2025
- Keep Looking, Don't Settle:重听乔布斯演讲(25-11-月度小结)
- Kimi-K2 和 Kimi-K2-Thinking 深度解读:从预训练优化到 Agentic 能力训练的完整流程(含MuonClip优化、Agentic 数据合成等)
- 影视飓风TIM成功背后:一个程序员对自媒体商业化的深度复盘(25年10月月度小结)
- 2025-09-合法赚钱就是高尚的(月度小结)
- RAG 进化之路:传统 RAG 到工具与强化学习双轮驱动的 Agentic RAG
- 2025-08-孙宇晨真的很值得学习(八月小结)
- 2025-07-忙碌与充实的七月(月度小结)
- Gemini 2.5 Pro 是怎么炼成的?-- gemini 2.5 技术报告阅读笔记与思考
- 2025-06-念头通达
- 2025-05-35岁之前赚不到一千万是我的错吗?
- 自适应快慢思考推理模型(Adaptive Reasoning Model):Qwen3混合思考->字节AdaCoT->清华AdaptThinking
- 2025-04-努力不是做好事情最重要的因素
- DeepSeek-GRM:Inferene-time Scaling 的 Generalist Reward Model(通用奖励模型)
- 2025-03-走慢些,走远点
- MLA(2):从代码和公式角度理解 DeepSeek MLA 的矩阵吸收 (Projection Absorption)
- 2025-02-努力真是又痛苦又充实
- 深度解读 Kimi-K1.5,真正了解 RL 数据是怎么筛选的
- 自顶向下方式深度解读 DeepSeek-R1,内含大量细节
- MLA(1):从代码角度学习和彻底理解 DeepSeek MLA 算法
- DeepSeek-R1大模型本地部署的三种方式,总有一种适合你
- LLM MOE的进化之路,从普通简化 MOE,到 sparse moe,再到 deepseek 使用的 share_expert sparse moe
- LLM activate function激活函数的进化之路,从 ReLU,GELU 到 SwiGLU(swishGLU)
2024
2023
2021
2020
- 2020年过去了,我不怀念它
- BBruceyuan的近期不靠谱事件
- 倒着写的文章
- 我不喜欢失眠
- 我为什么没有令我满意的offer
- Python实现蓄水池算法
- 简单方法增加Query召回的多样性
- 01之间均匀分区取两点构成三角形的概率-证明加代码实现
- Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction (中文介绍)
- 记EMNLP2020投稿
- Must-read Papers on Emotion-Cause Pair Extraction(achieved)
- 关于隐马尔可夫模型(HMM),需要知道什么?
- 深度学习时代,分词算法的真实应用实例
- 2020年了,还有必要学习分词算法吗?