普通人从零开始做公开表达的增长策略
国庆七天,开始在 B 站和 YouTube 做了一些教学视频,非常开心地涨粉 1.5k+,以下是我做的几个策略和思考:1. 视频大于文章;2. 利他优先;3. 拙劣的完成好过比完美的开始;4. 选取合适的平台;5. 内容互相链接...
国庆七天,开始在 B 站和 YouTube 做了一些教学视频,非常开心地涨粉 1.5k+,以下是我做的几个策略和思考:1. 视频大于文章;2. 利他优先;3. 拙劣的完成好过比完美的开始;4. 选取合适的平台;5. 内容互相链接...
根据模型的参数大小,预估模型训练和推理过程中的显存占用情况,包括参数占用显存大小、优化器占用显存大小...KV Cache 和 中间激活值的计算方式
利用 Git 的 includeIf 配置,为不同的项目设置不同的配置,通过子文件夹 .gitconfig 覆盖 Git 的 Global 相关配置,比如 name,email 等。
手写一个 Causal Language Model,或者说简化版的 transformer 中的 decoder。
在 AI 相关的面试中,经常会有面试官让写 self-attention,但是 transformer 这篇文章其实包含很多的细节,因此可能面试官对于 self-attention 实现到什么程度是有不同的预期。因此这里想通过写不同版本的 self-attention 实现来达到不同面试官的预期,四个不同的版本,对应不同的细节程度。
我依然在工作,我依然在挣扎,我依然在挣扎着完成工作,希望新的工作策略可以帮助我再坚持坚持!!!
经历越多,就越期待有一个持久的东西,不会因为外在因素的衰亡而衰亡,能一直陪伴着我。--dayu
互联网寒气愈发浓厚,号称宇宙终点站的字节跳动也开始裁员,但毕竟是终点站,哪怕是在裁员的寒冬季节,也依然有很多人陆续入职着字节,我也是其中一员。传闻字节的平均在职时间是 7 个月,这侧面说明了字节跳动的工作压力让员工很难保持一个良好的心理状态。前段时间有一个很火的帖子《在字节工作3个月以上仍保持一定程度的心理健康并非完全不可能》,受它启发,也想谈谈我在字节工作 6 个月后是如何保持心理健康的?
2023年,我结婚了,换工作了。这也意味着在 2024 年,一切都是新的开始,所以这篇文章命名为《新的开始》。
python typing tutorial 高级篇。这篇文章介绍了 Python 类型的一些高级用法,包括 protocol, override, overload, forwardref, generator... 通过实际案例解释了每一种类型的使用场景和使用建议。