Data103数据科学课回顾

开始时还是烈日炎炎,转眼到了秋风习习该说再见的时候。我们的心情也从开始的兴奋忐忑,到最后的平实,坚定。一路走来,诸多收获,回味无穷。

学会回顾

说说收获

解决问题的信心

之前对于程序中的报错相关的问题处理,自己并没有太多的信心。对于有很大难度的理科内容,自己也会畏惧,甚至觉得无法完成。但是这一次我克服了,找到了方法。细细回忆起来,源头是“死磕”和对开智课程设置的信心,随着课程的深入,这一种信心转化为对自己的信心。并且感受到了明显的能力变化。

学习方法的更新

在开智,大家一定不会陌生的几个词汇:时间的源头,信息的源头,信息的承载者等等。经过这一次的学习,结合自己的实践,有了更多的体会:知识体系+官方文档+高质量的信息搜索的工程类学习方法给我很大的启发,从期中的集体回顾到北京线下聚会的方法总结到今天,还在不断更新和丰富自己的方法。

  • 知识的源头:我们的数据科学来自于哪里,从哪里开始学起,这是一个让我困惑了很久的问题。慢慢的理出了头绪,自然也知道了学习的重心在哪里:数理统计&线性代数&部分的微积分应该是核心的理论基础,再集合计算机领域的Python编程。
  • 实践的领域:刚才的源头在向过去看,那么这些学习的未来在哪里,还需要回到现在,回到最前沿的地方,这里一方面有着业界的最佳实践,一方面又有着学界的最新研究。这部分是这一次课程里较少涉及到的。相信未来的课程会有更多的相关知识内容。
  • 高质量的信息:在学习中我们不断接触新鲜的知识,但是信息密度和质量又各不相同。课程里导出都是新知识,如何才能高效掌握,从官方文档这个高质量的信息开始是最优的选择。课程初期自己并不在意,越到后来越是官方文档和Ipython中的帮助说明帮了我。高质量的信息阅读是有自己的规律的,掌握了这个规律,特别的爽。
  • 高效率的搜索:Google+Stack Overflow,不用多说,相信大家都有体会。

最小模型、最小故事、最小行动

这一次课程的认知量着实不小,所以自己借用了《认知写作课》学到的方法应用起来也颇有收获。

最小模型:你的最小收获

每一次上课都会产生大量的认知负荷,经常是听完第一遍视频一脸懵逼。继续听,继续尝试,慢慢的理解一些,又一些。总是有不会的,怎么办?保持自己的最小模型,听懂多少就收获多少。数据班的大牛很多,产生的是同侪动力,千万不要转化为自己行为瘫痪的借口。最后几课有一些跟不上的地方,自己就会告诉自己,理解多少是多少,保证最小的收获。

营造自己的最小故事

故事直达人心。在《鲜活的数据-数据可视化指南》这本书里,作者也提到要用数据来讲故事。在数据班的学习里,我也在讲述自己的“最小故事”。比如说Issue里的7次问题,有5个问题自问自答解决。在自己做大作业被一个问题折磨许久得不到答案的时候,突然想到也许发个Issue就能神逆转了,事实真是如此…发完了Issue自己总想着不要问傻问题,继续琢磨,竟然很快找到了答案。
还有组织北京线下的沟通,制造人与人的连接,原来和我一起上课的人每个人都有自己的兴趣点,都和我一样,经历着一遍又一遍的自我成长和蜕变。那种做不出题的失落是一种共通的情感。然后就告诉自己这个没啥。每一个做过肌肉力量训练人,无论他多么健壮,每一次训练时肌肉的反应和第一天进健身房的人是一样的:肌肉酸痛,乳酸堆积,大脑里会产生消极的感受。但是不同的是,弱者放弃了,因为他被过程的痛苦打败了。强者会觉得这只是身体的正常反应而已,继续训练,才会得到真正的结果。
数据科学对我而言不再是一个个冰冷的数字和函数。他们是智慧的凝结,是数百年来基于人类智慧,基于无数聪明人一个个日日夜夜的奋笔疾书得到的财富。这是一场游戏,让人痴迷。

最小行动:完成作业

保持最小行动,特别是到后期工作繁忙起来,时间有限的时候。哪怕是借鉴同学的作业,也要能实践到底。这也是北京线下聚会大家的共同体会。

时间的复利效应

6月的自己,从来没有想过“像黑客一样写作”是什么样的感受,现在,我自己搭建了博客
7月的自己,从来没有想过写作和科学有什么关联,现在,我知道写作和科学其实紧紧拥抱在一起。一个理工男也可以写出冷白开里看芭蕾这样的文字。
9周前的自己,对数据科学毫无概念,没有写过1行Python的代码。9周之后,自己也可以通过代码解决工作中的实际问题,并且愿意在数据科学的方向上有更多的兴趣继续探索下去。

从文到理,各门课程一路走来,过程中付出的努力自然不用多说。更欣喜的是我看到了时间复利的效应。8月学会的博客现在成为自己主要的输出平台,10月的《认知写作》帮我在《数据科学课》中完成了最后路演的视频制作。刚刚学会的数据科学已经在工作中实践,产生效果。很难想象,持续这样强度的学习,1年后的自己会是什么样的。

Data Science

数据思维

前几天看法证先锋,里面的法证科以事实证据为导向的判案过程与肖凯老师说到的数据科学的学习要有侦探判案的思维如出一辙。
很多看起来有因果关系的事情并非如此,只是由于巧合一起发生了而已。人的主观臆断能力很强大,即使是数据,也要“抽丝剥茧”,做到“铁证如山”才能真正的下结论。对于统计学的理解很大程度上影响到对科学的理解,而数据思维也是基于科学观点下的思维延伸。观点不重要,重要的是鲜活的证据。经过整理的数据,是最鲜活的证据之一。

实质性的收获

直接上数据:

  • 8次作业提交
  • 1次线下活动组织并提交分享感受
  • 7个Issue问题,5个发问后自己解决
  • 刷完《head first 统计学》
  • 结业大作业提交,路演视频如下:

说说遗憾

  • 没有进入前三名是一个遗憾,不过和课程学到的比起来,这个微不足道。
  • 没有及时组织更多的线下沟通。
  • 最后几次课程的内容没有充分的理解,由于前面的课程暴露了自己的一些学习上还需要提到的地方,没有更多的精力来做探索和补充了。
  • 最后的大作业,也是基于之前的不足,探索还比较浅,即使针对可视化本身也没有做出太多有技术含量的内容,好处是虽然粗糙了一些,但是解决了工作中的实际问题,产生了强烈的探索兴趣。

说说未来

肖凯老师在结业时的寄语:

大家好,这门课上完,有两点感受。其一,数据科学,范围极广大。数周的时间内,只够带大家走马观花。这是受时间所限。其二,导游只能在地图上指指点点,哪里可能好玩,哪里可能难行,而大家到底去不去的了,这得看大家的脚力如何,别人没法代劳。
从结果上来看,虽然我们的加油团已尽力摇旗呐喊,奈何同学们进度不一,有人走的步履蹒跚,有人走的大步流星。几周下来,有的同学,仓库里一片荒芜,起点即是终点。有的同学,仓库里收获满满,终点亦是起点。
此刻,跟团游结束了,后面的自由行,更要依靠各位自己,栉风沐雨,砥砺前行。可能还会饱受摧残,也可能有机会一览众山。只是我们都不要忘记,当时起步的初心。
感谢数据时代,感谢大家参与!
Good Luck

在方法章节明确了过去和未来,后面会在这两个方向上持续探索。

  • 向后看,夯实基础:统计学、线性代数、微积分、Python。
  • 先前看,追赶未来:机器学习、深度学习、人工智能

这不是结束,是开始。

声明: 本文转载需标明出处,禁止用于商业目的。

ChangeLog

161108 新建
161110 发布