专栏名称: 网络大数据
打造中国最专业的网络大数据科学门户网站,提供新闻动态、研究资料、测量工具、数据报告、在线测量等各项信息及服务,供IDC,CDN,ICP和普通大众共同学习进步。
目录
相关文章推荐
大数据分析和人工智能  ·  人到中年才懂:能上班是福气 ·  2 天前  
数据派THU  ·  【ICLR2025】AdaWM:基于自适应世 ... ·  2 天前  
大数据文摘  ·  超强AI代理上线!OpenAI推出“Deep ... ·  3 天前  
数据派THU  ·  独家|人工智能值得信任吗(附链接) ·  5 天前  
数据派THU  ·  【ICLR2025】流媒体视频理解与多轮交互 ... ·  4 天前  
51好读  ›  专栏  ›  网络大数据

80本值得一读的最佳数据科学书籍(二)

网络大数据  · 公众号  · 大数据  · 2019-09-27 16:31

正文


by Paul Black 来源:bigdatanews

数据科学是近几年最受欢迎的概念。我相信很多人都在寻找进入该行业的入口,最近刚读了一篇文章,其中列出了一些对大家可能有帮助的数据科学书籍。因此,我在本文中进行了总结,同时还对书籍进行了简要介绍,以便可以选择要阅读的书籍。部分可以在网上找到一些数据科学书籍,文中给出了链接。但其中大多数可能需要在亚马逊上才能找到。

目录

第一部分:数据科学家的核心技能

  • Data Science

  • Math

  • Probability and Statistics

  • Machine Learning

  • Data Mining

  • SQL

  • R

  • Python

  • Data Scientist Interview

  • Algorithm

  • Handbook

  • Web Scraping and Data Wrangling

  • Data Visualization and Storytelling

  • A/B Testing

第二部分:数据科学高级技能

  • Neural Network and Deep Learning

  • Information Theory

  • Causal Inference

  • Sampling

  • Convex

  • Growth Analytics

  • Text Mining and Natural Language Processing

  • Anomaly Detection

  • Recommender Systems

  • Social Network Analysis

  • Time Series Analysis and Forecasting

  • Reinforcement Learning and Artificial Intelligence

第三部分:休闲阅读


第一部分: 数据科学家的核心技能


第二部分:数据科学高级技能
Data Science Advanced Skills


神经网络与深度学习
Neural Network and Deep Learning

53.建立自己的神经网络Make Your Own Neural Network

本指南将带您进行有趣而轻松的旅程,从非常简单的想法开始,逐步建立起对神经网络如何工作。

54.深度学习Deep Learning

深度学习的广泛主题的介绍,涵盖数学和概念背景,行业中使用的深度学习技术以及研究视角。

55.Hands-On Machine Learning with Scikit-Learn and TensorFlow

这本实用的书展示了如何使用简单有效的工具来实现能够从数据中学习的程序。

信息论Information Theory

56.数据科学与信息理论Data Science and Information Theory

这是一篇文章,介绍了信息理论在数据科学领域的重要性。

57.信息理论:教程简介

这的书插图丰富,在探索更高级的主题之前,使用了一些易于访问的示例来介绍诸如“ 20个问题”之类的日常游戏方面的信息理论。

58.Information, Entropy, Life and the Universe: 我们所知道的和我们所不知道的

如果有兴趣探索信息,Entropy 和概率的世界,或者只是探索整个世界,那么这是一个不错的起点。Arieh为读者详细介绍了这些主题,同时提供了许多常见示例来帮助解决这些有时难以掌握的主题

Causal Inference

59.Causal Inference in Statistics: 入门

Judea Pearl为统计初学者提供了一本理想的书,全面介绍了因果关系领域。

60.Field Experiments: 设计,分析和解释

社会科学领域实验的简要,权威介绍。

Sampling

61.Sampling

采样提供了对经典和现代采样设计和估计方法的最新处理,以及针对稀有,聚类和难以检测的总体的采样方法。

Convex

62.Convex Optimization

本书是对该主题的全面介绍,详细显示了如何以数字方式高效解决这些问题。

Growth Analytics

63.Lean Analytics: 使用数据更快地建立更好的启动 (Lean Series)

该书由Alistair Croll(Coradiant,CloudOps,Startupfest)和Ben Yoskovitz(Year One Labs,GoInstant)共同撰写,列出了切实可行的,切实可行的步骤,使您的创业公司从最初的想法发展到适合产品/市场以及其他方面。

64. Web Analytics 2.0:在线问责制和以客户为中心的科学

Web Analytics 2.0为创建可行的策略,正确地应用分析技术,解决诸如测量社交媒体和多渠道活动之类的挑战,通过利用实验获得最佳成功以及采用策略来真正听取客户的建议提供了具体建议。

文本挖掘和自然语言处理
Text Mining And Natural Language Processing

65.使用Python进行自然语言处理:使用自然语言工具包分析文本

本书提供了对自然语言处理的高度可理解的介绍,自然语言处理是支持各种语言技术的领域,从预测性文本和电子邮件过滤到自动摘要和翻译。

在线阅读:http://www.nltk.org/book/

66.使用Python进行文本分析:一种从数据中获取可行见解的实用现实方法

使用Python进行文本分析可以教您与自然语言处理和文本分析相关的技术,并且您将掌握掌握哪种技术最适合解决特定问题的技能。

67.信息检索导论 Introduction to Information Retrieval

这本具有开创性的新教科书经过了等级测试和连贯性,它教授网络时代的信息检索,包括网络搜索以及有关文本分类和文本聚类的基本概念的相关领域。

在线阅读:https : //nlp.stanford.edu/IR-book/

异常检测 Anomaly Detection

68.Fraud Analytics Using Descriptive, Predictive, and Social Network Techniques:欺诈检测数据科学指南

使用描述性,预测性和社交网络技术进行欺诈分析 是建立全面的欺诈检测分析解决方案的权威指南。

69.Outlier Analysis

本书从计算机科学的角度全面介绍了异常值分析领域。它在计算框架内集成了来自数据挖掘,机器学习和统计的方法,因此吸引了多个社区。

推荐系统

70.推荐系统:The Textbook

本书全面涵盖了推荐系统的主题,该系统根据用户以前的搜索或购买向他们提供个性化的产品或服务推荐。

社交网络分析Social network analysis

71.网络科学

这本开创性的教科书涵盖了从物理学到计算机科学,工程学,经济学和社会科学的广泛主题,向跨学科的读者介绍了网络科学。

72.Social and Economic Networks

在社会经济网络中,马修·杰克逊(Matthew Jackson)借鉴了经济学,社会学,计算机科学,物理学和数学的最新发现,对社会经济网络进行了全面介绍。

73.初创企业的社交网络分析:在社交网络上查找联系







请到「今天看啥」查看全文