数据分析?他们早就开始用了?
标题取得很好听,其实就是《数学之美》这本书的读书笔记和读后感。
这是每一个想学编程了解计算机的人都不应该错过的好书,必须推荐
光看这个名字,你可能以为它就是一本讲数学的书,觉得无聊而直接就想扔掉。
但它其实是一本非常适合于机器学习和算法入门的计算机科普书籍。
作者把他搞各种科研,以及在GOOGLE多年工作的所见所闻,都浓缩在这本书里,用浅显易懂的语言,给我们做了一次机器学习科普,厘清了各种概念数学原理算法的前世今生,还明白它们怎么在搜索领域、自然语言识别领域大放光彩。
那么话题扯回来,为什么看完这本书,会有种——数据分析,他们早就开始在做——的感觉呢?
事实上,虽然近些年来数据分析数据挖掘机器学习的概念特别特别火,可能很多人会以为这是近几年才渐渐重视起来并形成一套套方法论的新东西。但是其实早在计算机设计的初端,数据分析与挖掘,就应用于写代码搞算法的方方面面了。
抽象点来说,是算各种算法的复杂度。具体一点,从一个google搜索引擎的开发,需要科研人员反反复复去衡量计算机资源与产品效果间的最佳解,到在各种开发中不停地追求打字速度最优,分析瓶颈,都是统计数据、分析问题、抽象解决的老三套。
曾听人吐槽说,“根本没有什么新的数据科学家,很多学科本来就是建立在数据统计与分析基础上的,数据科学家一直就存在”。
正因如此,我们可以说,数据分析和挖掘,早就被应用在计算机科学的方方面面了。
所以脱离了编程和对计算机理解的机器学习和数据分析是在耍流氓。
反而来,如果数据分析学习遇到瓶颈,通过进一步学习算法及其实际应用,了解数据结构和设计,了解编程,也许能更快速得突破瓶颈期。
而以上这些思考,正是《数学之美》里向我们展示的神奇世界。
另外,在这本书里,作者还把他这些年科研的各种经验道理,穿插在一个个案例中讲述。
譬如说,“简单模型在工业界的实用性”,认为“学技术学‘道’比学‘术’更加重要”等等。
他还反复强调要多分析异常结果,认为简单有效的解决方案,往往建立在对细节充分的研究以及思考上。
这些对于经验不足的人,确实是十分宝贵的财富。
说到最后,我反正是认认真真把这本书看完了。
但是由于《数学之美》有三十一个章节,几乎每个章节都在讲不同的主题,信息量较大。为了以后按图索骥,继续深入学习,特在这里花了些时间梳理了一下各章节的脉络和专业词汇/人名,供大家参考。
End.
作者:尾巴 (中国统计网特邀认证作者)
本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。