专栏名称: 人工智能与大数据技术
分享大数据、云计算、人工智能等高科技先进技术
目录
相关文章推荐
大数据分析和人工智能  ·  35岁被优化,经济压力大,看DeepSeek ... ·  3 天前  
大数据分析和人工智能  ·  DeepSeek找到了未来最赚钱的6个行业 ·  昨天  
数据派THU  ·  NeurIPS ... ·  2 天前  
软件定义世界(SDX)  ·  Flywheel:2024电商消费趋势年度报告 ·  1 周前  
51好读  ›  专栏  ›  人工智能与大数据技术

包邮送 8本 《Python文本数据分析与挖掘》

人工智能与大数据技术  · 公众号  · 大数据  · 2021-05-16 23:21

正文

查看文章尾部参与赠书活动


出版社:中国青年出版社—北京中青雄狮数码传媒科技有限公司


大数据时代,用Python快速分析挖掘更有价值的信息!

一个以大数据与人工智能技术为核心的新的工业革命时代已经来临,大数据在企业决策中扮演着越来越重要的角色,数据经过高效的智能数据分析与挖掘等人工智能技术处理后,可以产生巨大价值,创造智能,方便生活。现在“统计分析和数据挖掘”已跻身最受欢迎的求职技能行列,数据分析师的薪酬待遇也远远超过平均薪资水平。

《Python文本数据分析与挖掘》数据分析师初学者必备,书中用简单明快的例子演示应用效果,并配有视频展示,下载资料包即可获取视频和二维码,不会让你感觉枯燥摸不到头脑。


本书特点


特点1:

引进外版机器学习领域畅销书!专注于如何快速应用!


特点2 :

作者的实战经验总结!100%干货分享,导入篇→基础篇→实践篇,循序渐进。


特点3:

案例都配对应视频讲解,随时随地学习无压力!下载资料包即可获取视频和案例二维码!


特点4:

提供在线交流群,与志同道合小伙伴一起加油!



内容简介


《Python文本数据分析与挖掘》将自然语言处理技术统计处理技术视为工具,不会涉及到其繁琐的原理、数学定理等。书中利用操作简便的Python程序包来处理文本数据,探索文本挖掘可以帮我们做到的事情,而非用尖端的技术进行程序设计。书中用简单明快的例子演示应用效果,并配有视频展示,下载资料包即可获取视频和案例二维码!

本书通过5个章节介绍相关知识,第1章介绍文本挖掘的整体印象;在第2章中概括介绍了本书后面用到的Python的必要知识;第3章中介绍文本处理相关的基本概念和观点;第4章中利用Python学习作为基础处理的频率分析方法和其能得到的结果;最后,在第5章中介绍文本挖掘需要用到的各种具体方法以及在Python中的处理步骤。



作者简介


【日】山内长承:1975年毕业于东京大学工学部电子工学专业。1977年完成工学专业课程硕士课程。1978年进入斯坦福大学电气工学专业,1984年退出博士课程,进入日本艾比·艾姆东京基础研究所工作。2000年加入到东邦大学理学部情报科学科,任东邦大学理学部情报科学科教授。



精彩文摘


1.1 什么是文本挖掘

文本挖掘是指从文本数据中把信息挖掘出来,如同从大量沙土中找出被掩埋的宝贵钻石,文本挖掘是从大量文本数据中找出被掩埋的“有意义的信息”。

通过使用自然语言处理技术和统计学工具,从大量的文本数据中提取出压缩后有意义的信息。在这里,我们分别使用“文本数据”和“信息”这两个词。先说文本数据,比如各种各样的文件、在社交平台上发布的信息、关于产品或服务的问卷调查结果,这些数据的产生都有原本的目的。也就是说,我们是为了写文件、为了在社交平台上发布信息、为了评价产品或服务等目的,才去写作各种文本,而这些文本就是我们输入的“数据”。文本挖掘,就是从这些数据入手,比如从社交平台中提取出最近的流行趋势,从问卷调查中提取出对某种商品或服务的整体评价和出现的问题(图1-1)。而上面说的从社交平台上提取的流行趋势、通过问卷得到的评价和问题,和原来的文本数据相比,被大幅度地压缩了。我们把压缩后得到的东西称为“信息”。


2.4.3 图表、图形绘制库Matplotlib

Matplotlib主要是绘制二维图表、图形、图像的库。Matplotlib不仅可以绘制画面,还可以直接在文件中输出画面。Matplotlib有很多功能,其中辅助函数pyplot是可以绘制简单图表的程序包,本书也会使用这个功能来绘制图表,下面我们先来看一下绘制点的简单制图程序(例2.3)。


Matplotlib除了可以绘制点,还可以绘制直线图、折线图、柱状图等图形。接下来我们来看一下使用Matplotlib绘制的折线图(例2.4)。

执行程序后可以看到图2-5中的折线图效果。

在之后的数据分析中,我们也可以通过柱形图分析有效信息。使用Matplotlib绘制柱形图的方法如例2.5所示。

可以看到如图2-6所示的效果。


内页展示



目录






请到「今天看啥」查看全文