专栏名称: Python中文社区
致力于成为国内最好的Python开发者学习交流平台,这里有关于Python的国内外最新消息,每日推送有趣有料的技术干货和社区动态。 官方网站:www.python-cn.com
目录
相关文章推荐
Python爱好者社区  ·  开源!Transformers 快速入门书 ·  2 天前  
Python爱好者社区  ·  特朗普上台,第一刀再次扎在了留学生身上。。。 ·  2 天前  
Python爱好者社区  ·  20个python3项目源码 ·  5 天前  
51好读  ›  专栏  ›  Python中文社区

Python数据分析之基情的择天记

Python中文社区  · 公众号  · Python  · 2017-07-29 22:36

正文

專 欄


罗罗攀,Python中文社区专栏作者

专栏地址:

http://www.jianshu.com/u/9104ebf5e177




人一生都可能无法逆天改命,但你却是要去奋斗一把。本文章主要通过最简单的共线性关系,利用gephi工具绘制择天记的人物关系图。 
准备工作

在网上下载《择天记》小说以及创建小说人物的txt。

jieba库 
需要下载gephi软件 
注意:安装路径不能有中文字;需要安装java环境,不然无法使用gephi。

定义数据结构

names用于存入小说人物和出场次数;relationships保存人物关系的有向边,该字典的键为有向边的起点,值为一个字典edge,edge的键是有向边的终点,值是有向边的权值,代表两个人物之间联系的紧密程度;linenames存入每行小说出现的人物;all_names是小说所有人物。 
添加人名到jieba词库中

jieba库分词可能并不能把小说的人物都切开,我们需要把这些人名添加到词库中,以便成功分词。

统计出场人数

通过图可以看出,陈长生作为主角,出场最多,而他的好基友是排第二的,而他的女票徐有容却是排到第五,这与一些玄幻小说不一样,注定了这是一部基情的小说。

人物关系及写入文件

绘制人物关系图

最后利用gephi绘制人物关系图。


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS




本文为作者原创作品,未经作者授权同意禁止转载


点击阅读原文加入全国金融行业Python开发者联盟

在公众号底部回复XFJR加入Python消费金融联盟

在公众号底部回复LHJY加入Python量化交易联盟