2013 年总结

Jan 01, 2014

2013 年是我走出校园的第一年,这里回顾一下这一年里对我比较重要人和事。

收获

总体

  1. 和女朋友在一起了 – 结束了异地恋,感谢她的支持和坚持。
  2. 毕业 – 离开待了 7 年的地方,有许多美好和痛苦的回忆,最重要的还是结识了几个好朋友和我最尊敬的欧阳老师。
  3. 7月入职豆瓣 – 为了接近大数据系统和高深算法,而且帮我推荐简历的老大在负责数据组,所以在入职时跟新兵导师说想进数据组,并顺利的到了数据组。虽然和想象的不太一样,但是在这里的工作中还是学习了很多(dpark、infobright、mstr、dquery),最重要的还是导师言传身教的解决问题的思路。在这里最喜欢的就是同事都有比较强的的自觉性和责任心,所以这样在合作时比较愉快;另一个喜欢的就是 code 系统。

喜欢的工具

  1. dpark – 豆瓣分布式计算工具,在内部应用广泛。为了学习 dpark 的原理,我开始了个 mdpark 项目(可以理解为照抄,同时抄 spark 和 dpark),目的是在最大化精简的同时,确保覆盖了其基本原理(rdd、dag、stage),利于学习。目前 500 多行,单机多进程版,rdd 只包括 map、filter、reduce、collect,后面会加入 reduceByKey 相关的,其他操作应该不会再加入了。
  2. docopt – 命令行参数解析库 for human。
  3. fabfile – 简化了远程服务器的操作。
  4. khazad-dum – 这是豆瓣内部数据组提供的数据处理SDK,没有开源。简化了自己编写任务调度、错误处理、运行报告、数据导入等任务,而只需将精力集中在业务逻辑上。
  5. code – 内部的github,感谢 code 系统,有了她就可以关注自己感兴趣的项目,查看大牛们的代码和评论。

喜欢的书

  1. sicp manual – 花 250 买的小册子,也被人说是 250,因为之前看 sicp 的时候感觉收获很多,但没有看完(第4章后面和最后一章),这次重新拾起来。很多人反映 sicp 难,我觉得这个书花大块儿时间来集中读比较合适,里面内容讲的比较多,但具体到每一个技术点上又会觉得比较浅(例如,里面也讲到垃圾收集,深度和编写你的第一个垃圾收集器差不多)。
  2. 编写可读代码的艺术 – 和 《clean code》类似,这两本都是我比较喜欢的书,里面有很多 tips。给我映像最深的一条就是“一次只做一件事”,这个说起来简单,但是什么叫一件事?这个未必是个容易回答的问题。所以每次当我觉得一个函数变得复杂时,我就会停下来,思考我是不是让这个函数做了过多的事,事实证明确实有更好的组织方式。另外,我也希望若干年后,我可以达到该书的作者在书背面简介中写的那样“专注于前段、后端、服务器架构、机器学习、大数据、系统等技术领域和实践”,我要从大数据、系统开始积累。
  3. MySQL性能调优与架构设计 – 工作后才正式用上了数据库,这本书就是参考手册。
  4. 淘宝技术这十年 – 时势造英雄、英雄造时势。
  5. 别闹了,费曼先生 : 科学顽童的故事 – 一个 geek。

喜欢的文章(演讲稿)

  1. A Curious Course on Coroutines and Concurrency – Python coroutine 方面最好的文章。
  2. Generator Tricks for Systems Programmers – Python Generator 比较棒的用法。
  3. How to JIT – an introduction – 简单的原理介绍,比 shellcode 还简单。因为这篇中没有讲编译优化过程。
  4. MiniLisp (un ejemplo de ply) – lisp 解释器被写烂了,我是为了看ply的。
  5. 有关 Shell 重定向那些你不知道的故事 – 发现自己还真的不知道。
  6. 对大宋下一代系统软件架构师的七个期望 – 大师的话需要参透,也需要经验,过段时间回来再看。

犯的错

  1. 损坏数据仓库表结构 – 当时就吓尿了,不过即使尿了,还得提起裤子把弄坏的修复了,不然我应该没脸待在那里了。感谢我的老大赵老师没有责怪我,而且帮我找到了修复方案(面对一个黑盒如何定位表结构的文件),感谢 xiliang 同学的陪伴,直到晚上修复好之后才离开公司。

其他

  1. Functional Programming Principles in Scala – 为了方便看 spark,学习了 scala。(拿到证书 with distinction)
  2. Brighthouse: An Analytic Data Warehouse for Ad-hoc Queries – Infobright 的论文,看了之后,感觉概念清晰多了。

生活

和女朋友在北京租了个小房子,过着北漂的生活,没有感受到太大的雾霭,由于不用坐地铁,也没有感受到交通拥挤。日子也渐渐趋于稳定,感谢她一直以来的支持。

大学的好朋友们大多在北京,所以周末时间基本上就是和老同学们聚聚,大学的,高中的。还有和公司同事打球。

和 danglu 约了玩街机,食言了。欠川岛一顿饭。xiaoning 欠我一顿饭。

2014 计划

业余工作计划

  1. 完成 mdpark 项目。
  2. 至少参与两个 code 上的项目。(非自己工作内容,自己的兴趣和公司已有项目结合起来)
  3. 关注 spark。
  4. “精通”一个有用的工具(有几个待选的,现在还没有想好),就是让周围的人遇到问题时会想到我。 :)
  5. 多看一些 paper (10篇以上)
  6. 让自己的 github 好看点