大语言模型 (LLM) 是当下最火的技术话题之一,很大程度上,这归功于底层的 transformer 结构。Jean Nyandwi 撰写了 The Transformer Blueprint: A Holistic Guide to the Transformer Neural Network Architecture,仔细梳理了 transformer 的架构。花了点时间细读这篇文章,有些醍醐灌顶的感觉。
类似的,最近听说了Site Reliability Engineering: How Google
掐指一算,搬到新的国家已经两个多月了,感觉这两个月过得非常开心。
最直接的体现是,睡眠好了很多,基本上一觉能到天亮,时间不多,但是质量有了保证。想起之前的睡睡醒醒,都不知道自己是怎么熬过来的。
当然睡眠好,可能也和没有全职工作有关系。两个月没有全职工作,可能最大的压力源就消失了。
来的第一个月基本上完全放松,每天花点时间在 DPS 和 AwesomeVisa 两个项目上,其他时间就是见朋友,玩 CrossFit 或者抱石。
第二个月开始稍微规律了一些,早上起来,看会书,然后去训练。接着有一份兼职,整个上午都泡在这份兼职上。然后吃个午饭睡个午觉,下午要么做DPS 和
最近三周开始规律作息,感觉挺不错的:
1. 早上有训练的话,就五点/五点半起床,没训练的话,六点起床。
2. 训练是七点半,所以七点要出门。起床到出门之间大概有一个半到两个小时的时间。
3. 刨除洗漱吃饭的时间,大概能剩60-90分钟,这些时间正好可以拿来阅读。
4. 三周下来,读完了 Staff Engineer's Path 和 Llama 2: Open Foundation and Fine-Tuned Chat Models
CJ Chilvers 认为目标不重要,重要的是过程。比过程更重要的是程序。
回头一看,我的 CrossFit 训练倒也符合这一逻辑:
并没有设定非常宏大的目标,只是期望能完成所有 RX 级别的训练目标;
没有非常刻板的训练计划,每周一二四六训练,人不舒服就跳过。看了看记录,去年训练了154次,今年到现在61次;
每次训练会记下训练项目和成绩,还有一张单独的表格记录各个单项的最好成绩。
练了快三年,解锁了大部分动作,大部分课都能完成 RX 级别。当然我也深知还有很大的提高空间,比如 RMU,倒立走都还要学。
Recap
本周 AwesomeVisa
当我们遭遇挫折时,往往会陷入其中,而无法自拔。这往往因为我们只是以一种本地视角在看待这些挫折。
倘若我们能换一个视角来看待这些,可能感受就会完全不一样。
第一种视角从时间轴上来看待这些挫折。回头一看,我们经历了多少挫折才走到今天?过往的挫折不仅没有打败我们,反而让我们成长。同样的,当下正在经历的挫折,也会让我们变得更强。只要我们把这些当下的挫折也放到时间轴里来观察,我们会发现,它们也是我们成长的一部分。
第二种视角是俯视视角。倘若我们有上帝之眼,可以从很高的视角来俯瞰一切,那么我们就会发现,这些挫折只是整个经历中的一小部分。每一个过程都交杂着挫折与进步,最终走向了成功。哪怕有一些经最终没有成功,但是放到全局来看,他们也只是一小部分,而从这些挫折中,我们也能学习到不少。
简而言之,挫折也好,失败也好,都是我们人生路上的一部分。