由于作者视野有限,只收录了平常接触多的安全公众号,如果有与安全相关的公众号可以在github项目或微信聚合平台中提交。
目录
-
分析背景与目的
-
数据来源
-
分析思路
-
分析正文
-
每天发发布文章统计
-
公众号发布文章分析
-
文章发布时间段分析
-
阅读原文出处分析
-
文章主题分析
-
作者分析
-
关键字分析
-
总结与建议
分析背景与目的
运营公众号通常会进行数据分析,但把后台的数据复制粘贴,把那些人人看得到的数据写出来,这样也没什么意义。文章、阅读量、新关注人数、取消关注人数、总粉丝数,这些都是单个公众号的指标,重要的是挖掘数据背后的信息,从而对运营进行有效的指导。
结合专注安全领域最新资讯、专题和导航,做高质量聚合的
Secwiki-安全维基
的数据,引用github上一份secwiki安全报告分析。报告指出安全圈从2014年的安全媒体巨头
乌云
、
fb
、
91ri
,到后来增加的
嘶吼
、
i春秋
、
先知
、
e安全
等媒体百花齐放。再到后来
个人博客
的热度下降、知识付费兴起、媒体转战公众号的过程。体现出公众号在知识信息传播的过程终占的比例越来越重。
每年Sec-wiki收录文章来自微信安全公众号文章占比统计表格
年份(年)
|
微信占比(%)
|
综合排名
|
2014
|
0
|
-
|
2015
|
1.82
|
5
|
2016
|
10.34
|
3
|
2017
|
15.06
|
1
|
2018
|
23.05
|
1
|
2019
|
27.31
|
1
|
在2020年一月份secwiki收录信息源占比中发现来自微信公众号的文章已经占据41.98%。超越了
freebuf
、
安全圈
等知名安全媒体的总和。
互联网巨头企鹅对微信进行了流量封锁,web页面API接口限制,对信息敏感部分进行控制。导致微信数据采集一直是一个比较麻烦的事情。
通过这次分析,我们希望得到安全圈内公众号发布文章的规律,挖掘发布文章最多的公众号,公众号阅读原文背后的平台都有哪些,分析发布内容与安全关联程度,得出圈内优秀的公众号推荐给大家,微信公众号平台在安全圈内的重视程度。
数据来源
从2019年下半年,我们运营一个微信公众号聚合平台,关注了圈内常见的安全公众号200个左右,每天对其发布的文章进行采集,对历史数据进行回采。包含了公众号公开的全部数据,标题名称、链接、作者、正文、阅读量、在看数、评论内容等。截至2020年2月1日共实时监控有效公众号
201
个,采集了文章共
49966
篇,各类数据共
2.7G
。
分析思路
-
公众号发布文章数 = 统计2019年
每个公众号
发布文章数量
-
发布文章统计 = 统计2019年安全公众号
每天
发布文章数量
-
公众号发布时间 = 统计2019年安全公众号所有文章
每个小时
发布时间
-
公众号原文来源 = 统计2019年安全公众号文章
阅读原文
的主域名占比
-
安全关联系数 = 统计文章中发布内容包括
cve
,
预警
,
漏洞
,
复现
,
总结
关键字占发布文章的20%比例的总和。
-
发布文章的作者统计 = 统计2019年安全公众号作者发布文章的数量
-
评论内容的情感分析 = 统计出所有评论的正负情感,梯度做一个柱状图
-
云图 = 文章标题的云图、文章评论的云图
特别的剔除了阅读量、在看数、评论量的统计,因为实时采集的阅读量、喜欢、评论不是文章最终的数据,只能代表发表时到采集时的热度。虽然在后台中分析出了有阅读量很高的文章,但采集数据不准确似乎不能很好说明些什么。
分析正文
使用python的pyecharts库对数据做图标处理,效果如下。
每天发发布文章统计
上图为2019年52个周期对应7天每天的发布文章数量,x代表52周期、y代表一周7天、z代表发布数量,红多蓝少。(第一周的前两天是随机的数据,非1月1日)
所有公众号每天发布文章数量的折线统计,折线图呈现锯齿状,每一个缺口对应的都是假期,在图中凸凹呈规律起伏,标红线处有明显大范围空缺,可以根据时间推测处是大的假期:春节、五一、国庆。
为了更加明显辨别处为什么会出现发文较低的状况,我们将每天发布文章数降低到
65
以下,得到上图,一些隐藏的细节也展示出来,蓝色部分分别对应国家法定节假日时间。
36
周以后双休日的柱状图消失,表示后半年双休日的发文频率高于前半年。
-
每周的工作日发布文章的平均数量大于节假日的平均数量,在图1中y截面呈现跳跃断层状态。
-
2019年从年初到年末公众号每天发布文章数据呈递增趋势。
-
每天发布文章最少的阶段在节假日,如春节、劳动节、双休日。每天发布文章数量在8月份之后平均都有升高。
-
安全圈小编多数有着明确的假期。不全是007标准。
公众号发布文章分析
2019年每个公众号发布文章数量统计图
2019年共统计到公众号
262
个,文章
30629
篇,发布平均文章数
116.9
篇。发布文章最多的单个公众号共
1426
篇。大家所熟知的安全媒体平台
FreeBuf
、
极客公园
、
嘶吼专业版
、
安全牛
、
Python开发
、
网信防务
、
邑安全
、
E安全
、
中国信息安全
、
安在
、
看雪学院
、
黑白之道
等等都是高产者。
发布文章数量排名靠前的多数为安全媒体的公众号,平台每天有着大量资讯、新闻、安全研究的文章。排名靠中间的个人公众号每天努力的输出技术文章,实在太多这里抽出几个@
TimelineSec
、
Tide安全团队
、
Ms08067安全实验室
、
HACK学习呀
、
MrLee小师父
、
DROPS攻防训练营
等等。
如果每周发送一篇文章,一年也就发布50篇文章,对于轻轻松松超过平均值的公众号实属不易。有
2/5
的公众号一年内发布的文章超过50篇,可算是“每周一篇”坚持不懈。有
1/3
的公众号发布数量低于10篇坚持不屑。
文章发布时间段分析
2019年所有文章发布时间统计图
公众号发布文章的时间集中在
8:00~11:00
与
17:00~19:00
。其中最多的发布时间在
18:00~19:00
之间共
5114
篇。发布文章在
1:00~5:00
之间最少,最低的只有
4
篇。虽然微信有定时发布功能,但很好奇这
4
篇文章是有多神奇。
有结论得出:上班后用户会划水登录微信更容易查看公众号推送的早报,6点下班后吃饭或地铁上又是用户打发时间的时候,这些时候推送文章更容易让用户看到。6点可谓是公众号的黄金时间,许多公众号的小编用行为证实这一点,如果你是在非黄金时间推送文章,别人再推送后你的文章就会被长长的通知覆盖,当用户吃饭或地铁时需要浏览好大一会才翻牌到你的文章。说不定这时已经下地铁了:(。
阅读原文分析
2019年文章原文平台来源统计图
每篇文章最后有阅读原文的标志,代表着本篇文章有其他平台的出处。2019年无‘后台’的文章
13757
占比
44.91%
,有‘后台’的文章
16872
篇占比
55.09%
。其中‘后台’的个数有
627
个。有大家熟知的主流平台@
freebuf
、
4hou
、
youzan
、
geekpark
、
aqniu
、
easyaq
、
77169
、
anzerclub
、
pediy
、
mottoin
、
hetianlab
等等。一些你连听都没听说过的小众平台有
secist.com
、
duoyinsu.com
、
boombao.net
、
securecomm.org
、
2captcha.com
、
opentestcon.org
、
w2n1ck.com
、
zhenganwen.top
、
p0desta.com
等等。说是百花齐放一点都不夸张。
安全圈内有着巨大资源的后盾。在密密麻麻的每个小平台中都有一颗变强大的内心,它充满活力、充满梦想、充满希望。同时在安全圈内默默贡献出自己的一份力量。
文章主题分析
统计文章中发布内容包括
cve
,
预警
,
漏洞
,
复现
,
总结
,
招聘
关键字的公众号Top20。
可能每个公众号都有自己的特点,如专注预警、复现、总结等方向。有没有公众号是偏全能的呢?
公众号
|
cve (%)
|
预警(%)
|
漏洞(%)
|
复现(%)
|
总结(%)
|
统计(%)
|
FreeBuf
|
7.40
|
2.51
|
11.92
|
11.37
|
9.12
|
8.46
|
邑安全
|
8.50
|
8.39
|
5.61
|
7.84
|
3.15
|
6.70
|
嘶吼专业版
|
13.80
|
1.07
|
9.64
|
2.35
|
4.97
|
6.37
|
山石瞭望
|
5.30
|
11.99
|
2.05
|
0.39
|
0.33
|
4.01
|
360CERT
|
6.03
|
9.71
|
1.94
|
0
|
0.16
|
3.57
|
腾讯御见威胁情报中心
|
4.93
|
8.27
|
2.70
|
0
|
0.66
|
3.31
|
绿盟科技
|
3.93
|
6.83
|
3.57
|
0
|
0.99
|
3.06
|
Timeline Sec
|
1.37
|
0.11
|
0.48
|
11.76
|
0.16
|
2.78
|
长亭安全课堂
|
2.65
|
8.51
|
1.40
|
0
|
0
|
2.51
|
合天智汇
|
1.09
|
0.35
|
1.66
|
3.92
|
5.47
|
2.50
|
绿盟科技安全情报
|
3.65
|
7.07
|
1.18
|
0.39
|
0.16
|
2.49
|
根据每个关键字百分比的平均值排序表,我们看到公众号在这5个关键字中分布不均匀,然后做一张折线图修正存在的问题。