专栏名称: python
隔天更新python文章,我希望用我的努力换来劳动的成果帮助更多的人掌握一门技术,因此我要更加努力。
目录
相关文章推荐
Python爱好者社区  ·  节后第一个私活,赚了3w ·  昨天  
Python爱好者社区  ·  python接私活,yyds ·  16 小时前  
Python爱好者社区  ·  DeepSeek 最新中国大学排名 ·  16 小时前  
Python开发者  ·  “李飞飞团队50 美元炼出 ... ·  3 天前  
Python爱好者社区  ·  史上最强!PINN杀疯了 ·  3 天前  
51好读  ›  专栏  ›  python

Python数据可视化词云展示周董的歌

python  · 公众号  · Python  · 2018-06-06 22:30

正文


马上开始了,你准备好了么

准备工作

环境: Windows + Python3.6
IDE: 根据个人喜好,自行选择
模块:
Matplotlib是一个 Python 的 2D数学绘图库

pip install matplotlib
import matplotlib.pyplot as plt

jieba中文分词库

pip install jieba
import jieba

wordcloud词云库

pip install wordcloud
from wordcloud import WordCloud

实战具体步骤:

1、读入txt文本数据。
2、结巴中文分词,生成字符串默认精确模式,如果不通过分词,无法直接生成正确的中文词云。
3、生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库。
(无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode='RGBA'和colormap='pink')
4、显示图片。

总体而言只有四个步骤还是比较简单的那咱们先看一下实现的效果图吧!

看到效果图后发现里面的秘密没?

完整代码

# Matplotlib是一个 Python 的 2D数学绘图库
# 安装:pip install matplotlib
import matplotlib.pyplot as plt
# jieba中文分词库
# 安装:pip install jieba
import jieba
# wordcloud词云库
# 安装pip install wordcloud
from wordcloud import WordCloud
# 1.读入txt文本数据
text = open(r'.\jay.txt', "r").read()
#print(text)
# 2.结巴中文分词,生成字符串,默认精确模式,如果不通过分词,无法直接生成正确的中文词云
cut_text = jieba.cut(text)
# print(type(cut_text))
# print(next(cut_text))
# print(next(cut_text))
# print(next(cut_text))
# 必须给个符号分隔开分词结果来形成字符串,否则不能绘制词云
result = " ".join(cut_text)
#print(result)
# 3.生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库
# 无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode='RGBA'和colormap='pink'
wc = WordCloud(
       # 设置字体,不指定就会出现乱码
       font_path=r'.\simhei.ttf',
       # 设置背景色
       background_color='white',
       # 设置背景宽
       width=500,
       # 设置背景高






请到「今天看啥」查看全文


推荐文章
Python爱好者社区  ·  节后第一个私活,赚了3w
昨天
Python爱好者社区  ·  python接私活,yyds
16 小时前
Python爱好者社区  ·  DeepSeek 最新中国大学排名
16 小时前
Python爱好者社区  ·  史上最强!PINN杀疯了
3 天前
中国标准化  ·  【公告】请投出您心中最棒的LOGO!
7 年前