这一篇纯干货文章,我就不排版了。
上周把之前一直分散运营的几个情报局群整合了一下,拉了个「互联网情报局」群,一百来号人一周干了2000条聊天信息,几乎没有表情包、没有废话。
我想着把群的服务做起来,于是着手把过去一周的聊天信息做了一下分析复盘。用了如下几个工具:
-
iTunes
-
WXBackup
-
Python
-
Word
-
Excel
-
WordArt
先来给大家安利WXBackup这个工具,简直太牛逼了。它可以把群聊记录做成网页版,我截个图:
具体使用方法:
-
百度搜索WXBackup,下载软件,支持win和Mac;
-
使用iTunes备份你的手机(仅支持iPhone);
-
打开WXBackup,定位到你的手机备份,等软件加载;
-
通过下拉菜单找到你的微信号;
-
选择聊天,导出聊天内容。
软件会给你导出一个以群聊名命名的文件夹,里面有一个index.html,双击打开就是全部的聊天内容了。
这个文件夹,拷到任何地方都可以看!
它
所带来的影响就是,当我的朋友没钱
加入某个付费社群的时候
,我可以把我看到的聊天记录导出来给他看。
关于标题党的嫌疑解释完了,下面讲一下如何分析这些聊天记录。
你需要至少安装一个Python环境,如果没有的话,可以退出了。
所有的聊天内容都在“
群名/js/message.js
”
里面,使用随便一个程序编辑软件(我用的是sublime txt,win推荐使用notepad++)打开这个文件。
整个文件的内容分两部分:群聊信息和群成员的ID昵称对应关系(在最后)。
把他们分别拷出来就可以了。
先说群聊信息。
把文件第二行
"message":[
直到最后一个
],
中间的所有内容复制出来(只要[]和它们中间的内容),保存为
liaotian.json
。
顺便解释一下,这种样式的东西在编程里称为数组。
接
下来使
用Python把这个json文件转成Excel。
Python脚本我已经写好了,
可以扫描文章最后的二维码添加
好友以后它会把所有
需要东西自动发给你。
你可以不用懂任何编程语言,按照我下面写的步骤操作就行了。
Python脚本的名字我起名叫
j2e.py
,把这个文件和你刚才保存的
liaotian.json
放在一个文件夹里。
如果你用win电脑,找到powershell应用(win10在任意位置同时按下win+X弹出来的菜单里就有);如果你用Mac,按command+空格,搜索“终端”。
打开这两个软件以后,英文状态下输入
cd 刚才保存的文件路径
(cd和路径之间有空格,不知道路径的话,win点击文件夹上面的地址栏,复制粘贴;Mac右键文件点显示简介,把位置复制下来),然后按回车。
然后输入
python j2e.py
(python和j2e之间有空格),等一会会有一些英语提示,光标又跳动的时候你会发现刚才的文件夹里多出一个
liaotian.xlsx
的Excel文件,打开它就是所有聊天记录了。
这个Excel里只有微信号,但是没有昵称。我们进行下一步。
把刚才message.js最后面的
"member" : {
后面直到倒数第二个
}
之间的所有东西复制下来,粘贴到Word里。
下面教大家一些Word替换大法。
在Word页面,按CTRL+H,呼出替换窗口。
上面的输入框输入
: {^p
,下面的框里输入
$$$
,点击全部替换。理论上你群里有N个人,会提示完成N次替换。(解释一下,^p代表的是换行)
然后上面的输入框里再输入
",^p
,下面的输入框里输入
$$$
,点击全部替换。
然后上面的输入框里再输入
},^p
,下面的输入框里
什么都不输入
,点击全部替换。
最后一步,在上面的输入框里输入
两个空格
,下面的输入框里
什么都不输入
,点击全部替换。
到此,文档处理工作就完成了。按CTRL+A,文字全选复制粘贴到随便一个txt文档里,保存。
新建一个Excel,打开。点击
数据-从文本导入
,找到刚才保存的那个TXT文档,点击导入。选择
分隔符号
,文件原始格式那里下拉选择
UTF-8
,点下一步,勾选
其他
,里面输入
$
,右上角勾选
连续分隔符号视为单个符号处理
。点击完成。
微信号和昵称的对应关系Excel表就做好了。
然后在
liaotian.xlsx