专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  【[115星]neubig/starter- ... ·  昨天  
黄建同学  ·  这个有意思,Gemini AI + ... ·  2 天前  
爱可可-爱生活  ·  本文创新性地提出了协作式自弈 (CSP) ... ·  2 天前  
爱可可-爱生活  ·  【[46星]Step-Video-TI2V: ... ·  2 天前  
51好读  ›  专栏  ›  机器学习研究会

【推荐】(Python)现代自然语言处理:Yelp百万评论分析实例

机器学习研究会  · 公众号  · AI  · 2017-03-20 18:54

正文



点击上方 “机器学习研究会” 可以订阅哦

摘要

转自:爱可可-爱生活

Our Trail Map

This tutorial features an end-to-end data science & natural language processing pipeline, starting with raw data and running through preparing , modeling , visualizing , and analyzing the data. We'll touch on the following points:

  1. A tour of the dataset

  2. Introduction to text processing with spaCy

  3. Automatic phrase modeling

  4. Topic modeling with LDA

  5. Visualizing topic models with pyLDAvis

  6. Word vector models with word2vec

  7. Visualizing word2vec with t-SNE

...and we might even learn a thing or two about Python along the way.

Let's get started!

The Yelp Dataset

The Yelp Dataset







请到「今天看啥」查看全文