专栏名称: 人工智能与大数据技术
分享大数据、云计算、人工智能等高科技先进技术
目录
相关文章推荐
数据派THU  ·  深入解析图神经网络:Graph ... ·  20 小时前  
天池大数据科研平台  ·  谷歌反击,最强Gemini ... ·  昨天  
大数据文摘  ·  《封神2》崩的越惨,DeepSeek的刀就越锋利。 ·  2 天前  
玉树芝兰  ·  对科研工作者来说,OpenAI Deep ... ·  3 天前  
51好读  ›  专栏  ›  人工智能与大数据技术

豆瓣评分9.0!出版20年依然好评如潮,吴恩达都推荐的NLP经典

人工智能与大数据技术  · 公众号  · 大数据  · 2019-11-16 11:11

正文

来自:程序员书库(ID:CodingBook)

链接: https://medium.com/@samon127/book-review-foundations-of-statistical-natural-language-processing-75cda5dea097

今天要和大家推荐的这本书,20年前就已经出版了,但内容对我来说依然是新的,我认为统计学NLP是最跨学科的学科,它涉及了语言学,计算机科学,统计,信息论,甚至哲学和神经科学。


当时读这本书的理由也很简单,我想学习一些关于NLP的知识,了解一些关于NLP的知识对我来说是必要的,而《统计自然语言处理基础》对我来说是一个很好的选择


  • 国外经典教材 豆瓣评分9.0

  • NLP领域最主要的理论入门书


本书的中文版由电子工业出版社出版, 苑春法 / 李伟 / 李庆中翻译:



这是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。 涵盖的内容十分广泛,分为四个部分,十六个章节:


第一部分介绍了数学和语言的基础,其他章节的内容都是基于这部分内容进行深入和拓展,可以说这部分提到的概念和技术贯穿全书。


第二部分介绍了词法,这部本内容包含四个章节,分别是搭配、统计推理、语义消歧、词汇获取等方面的内容,书中的介绍由简到难,但每一章又可以让你独立阅读。


第三部分语法依然有四个章节,马尔可夫模型、词性标注、概率上下文无关文法、概率句法分析,这四个章节有层层递进的关系,所以你最好按顺序阅读,不过词性标注这一章可以单独阅读,虽然里面有时会引用马尔可夫模型章节的内容。


第四部分是应用与技术,分别有以下四个章节: 统计对齐和机器翻译、聚类、信息检索、文本分类、同样,这样章节可以根据兴趣和你自己的时间安排决定。



这本书是克里斯·曼宁(Chris Manning)的主要著作,吴恩达教授也关注他,并推荐过这本书籍。


豆瓣书评:
@Sweetdumplings : 作为NLP领域最主要的理论入门书,这本书深入浅出地展示了很多经典的模型算法,虽然现在看有点偏老了,也没有涉及最近很火的deep learning,但是作为入门绝对是足够的。

@菊: 一些基本理论写得很清楚,对所需的数学基础也解释得很易理解。 只看了部分章节

@寒马: 精巧,这本书很多地方都让我受益匪浅。



关于作者



Christopher Manning是斯坦福大学计算机科学与语言学系的首席教授,他的研究目标是使计算机能够智能地处理、理解和生成人类语言材料。 Manning是将深度学习应用于自然语言处理领域的领军人物,在递归神经网络、情感分析、神经网络依赖分析、词向量模型、神经机器翻译(NMT)、深度语言理解等领域都有著名的研究成果。


此外,猿妹还找到Christopher Manning撰写的有关通过深度学习进行自然语言处理的在线讲座(2017年冬季)(总共18个讲座):



视频地址: https://youtu.be/OQQ-W_63UgQ?list=PL3FW7Lu3i5Jsnh1rnUwq_TcylNr7EkRe


●编号938,输入编号直达本文

●输入m获取文章目录

推荐↓↓↓







请到「今天看啥」查看全文