【读书笔记】月亮与六便士 月亮是理想,六便士是现实,一定会有冲突。专注理想不世俗的人是天才级的,但也是冷漠自私的。一本很短的经典小说,可以快速刷完。故事有点荒诞和狗血,仔细读完还是敬佩全意追逐理想的人,在发光。 2022-10-30 读书
【读书笔记】怪诞行为学 - 可预测的非理性 罗永浩推荐的一本书,行为经济学的入门书,行为经济学是从心理学的角度来解释人的行为。如果完全从经济学的角度(成本-收益)来看待世界,会发现真实世界存在很多不合理性的事件,但是存在即合理。这些非理性的现象就是因为人在叠加了感性的因素后作出的决策,更重要的是这些非理性的现象是可以被发现,验证,定量分析的。所以如果能已知我们身上非理性的一面,就可以更好的把控我们的生活。 2022-07-01 读书
生成模型与判别模型的比对 前言 搞机器学习的人一定会绕不开「生成模型」和「判别模型」,但是要理解这两个模型有什么区别还是不容易的 生成模型 $\sum{P(X,Y)} = 1, P(X,Y) = P(X|Y)P(Y), P(Y|X) = P(X,Y)/P(X)$ 对于未见示例X,要求出X与不同标记之间的联合概率分布,对比之后最大的概率为最终的Y 典型的生成模型包括:朴素贝叶斯,隐马尔可夫模型HMM 判别模型 $\sum{P 2022-05-27 NLP
【读书笔记】高效能人士的七个习惯 久负盛名的一本书,最开始是在腾讯的封培期间老师推荐的,在微信读书上刷完之后确实开启了新的世界。 最近看到小翔哥的视频中又提到了这本书,买了实体书进行二刷,感觉人生有点活明白了,真的是一本人生行动指南! 七个习惯:积极主动,以终为始,要事第一,双赢思维,知彼解己,统合综效,不断更新 2022-05-07 读书
Git WorkFlow 前言学生时代常常一个人维护一个Git仓库,所以很是随性,不管分支,永远在master上开发,commit message也随便写,工作之后才意识到Git的重要性。其实Git的工作流跟一个产品的推进的工作流紧密相关,如何利用Git进行产品研发,产品测试,产品发布,快速修复缺陷,这些都在Git的分支管理中。 2022-03-26 DevOps
Transformers多机多卡的炼丹实践 前言随着预训练语言模型的快速发展,很多问题可以通过堆数据和堆模型参数简单粗暴的有效解决。所以亲自训练一个大模型一定是每个NLPer都想尝试的事,这时候就需要进行多机多卡的分布式训练了。本文是一篇踩坑后的总结,介绍如何基于huggingface的transformers库来快速实现。 注意本文仅涉及数据并行,而不涉及模型并行。所以参考本文可以自己从零训练一个bert,bert-large等,但想训练 2022-01-28 NLP
【读书笔记】Effective Python 目前工作Python依然是主要语言,业务实际上线也是基于Python来完成,所以编写出高质量的Python代码就很重要。快速的刷完这本Effective Python,确实学到了很多新的用法,常阅读,常实践,常总结。 2022-01-16 读书