Data103数据科学课后30天

2016年11月9日数据课结束,这30天发生了什么?

数据课的结束不是下课的铃声,是战斗的号角。数据课结束近一个月的时间,自己没有停下自己探索的步伐。回看当初写下的Data103数据科学课回顾,既有悔恨也有欣喜。

  • 悔恨的是“初生牛犊不怕虎”的把作业都给做完了,依然不明就理。很多内容靠的是搜索完成,却不成知识体系,花费了大量时间精力。
  • 欣喜的是至少没有放弃,现在才开始理解官方文档的含义,探索90%的时间都花在官方文档的阅读和理解上。原来很困惑的许多问题,在官方文档里找到了明确的答案。以前不会找的索引文件,文档结构,现在也能主动的梳理出脉络,写成博客沉淀下来。

难者不会,会者不难

回看课程内容,原来自己需要琢磨一周时间才能完成的作业,现在半天时间就能实现,并且用了效率更高,更简洁的代码实现。

题目 上课 现在 备注
贝叶斯定理计算 参考他人博客得到计算结果 自己推导定理,计算结果,尝试解释应用方法 未来尝试更多的应用推理,写到博客。
100以内质数求和 28行代码 10行代码实现高效的求和
二维空间随机游走 33行代码 9行代码实现基本作图
22行即可实现九宫格和多图合一

想到当初趴在床上一边Google,一边尝试修改自己代码,内心对那些报错无比焦虑状态,只想到了八个字”难者不会,会者不难”。当初调试半天的问题,现在可能理解了原理几分钟解决。原来需要好多行代码实现的小功能,现在一两行可以实现。

世外桃源,开源世界

Linux、Git、Python、Numpy、Pandas、Matplotlib,还有很多,这些开源世界的花朵为商业社会带来了更多的可能性。计算机一直是站在巨人肩膀上不断发展的学科,有了开源社区,更能体会人类在推进社会文明与发展中的点点滴滴。和舞台上光鲜亮丽的明星比起来,开源世界的贡献者更像是默默无闻的一只只小蚂蚁,在悄悄建筑精美的世界的基石。我期待自己在N个月后成为基石的成千上万建造者之一。

  • 开源世界里的代码质量极高,可用性极强。这其中融入了全世界程序员的智慧,举个简单的例子,一个Matplotlib的饼状图,竟然有15个变量,饼状图的几乎所有元素都可以进行自由裁剪。
  • 开源世界有自己的逻辑。开源社区是一个伟大的社群,他就在那里,你是伸手党,那么好,清自己搜索找到你需要的材料。你是建造者,那么好,请自行寻找你认为需要修补的地方。你想了解我,那么好,请订阅邮件列表。这里的一切由人创造,无比高效、自动化。可以说开源社群的效率秒杀大量的社会化商业公司。而他提供的社会价值,无法估量。
  • 开源世界还有精美的文档。在公司做项目,经常会遇到程序员不爱写文档的情况,但是开源世界不会,这里的文档是重要的沟通工具。优秀的开源社区一定有优秀的官方文档,这些文档内容丰富,格式简单。仿佛每一个人都是优秀的极简风格设计师。

这里是世外桃源,让人流连忘返。

改变习惯,科学探索

以前写代码,浅尝辄止,不爱看英文材料,能省事就省事,现在尝试彻底改掉坏习惯:

  • 多问一些为什么,不满足于把题目做出来,还想知道更多:贝叶斯定理的简单应用就是新鲜的证据。
  • 从源头学习,英语不好可以补,内容不会可以查。
  • 保持必要难度,代码写了一遍,过半天还记得么?证明自己记得最简单的办法不是复制粘贴,而是重新写一遍。
  • 以教带学,怎么知道自己明白了?讲给别人听,没有听众怎么办,博客写出来。
  • 成长型心智很重要,今天不会,休息一下,明天继续。有些内容优秀的同学30天前就学会了,我按照现在的方式一点一点不断探索,终会到达终点。
  • 保护自己的内在动机,我经常问自己为什么,这些事情没有任何额外的奖励,甚至博客写了也没有几个人看,你为什么还要做。也许没有为什么的答案是最好的答案:我喜欢、我感兴趣,我想。

回顾十年前的自己在这个专业里都没有做到的事情,现在做的这么开心,真是怀疑当年发生了什么事情,自己没有好好钻研。

回顾足迹,点点滴滴

这一个多月以来的学习探索,从毫无头绪到逐渐理清脉络,花了一些时间。后期在学习时不断回看当时的课程内容,找出优秀同学的代码思路参考借鉴,一并表示感谢。诚然,我现在的探索还是比较初级,文章内容也比较浅显,但是相信半年后会有不一样的表现。
最后附上最近探索的9篇文章索引,自己写文章时想象着如何教会N天前的自己学会内容,并且给出学习来源的索引,方便大家找到源头。文章按照课程学习的逻辑,在每一个开源包中探索,将当初“难于上青天”的题目逐个击破,欢迎有兴趣的小伙伴一起探索。

声明: 本文转载需标明出处,禁止用于商业目的。

ChangeLog

161206 新建