专栏名称: HACK学习呀
HACK学习,专注于互联网安全与黑客精神;渗透测试,社会工程学,Python黑客编程,资源分享,Web渗透培训,电脑技巧,渗透技巧等,为广大网络安全爱好者一个交流分享学习的平台!
目录
相关文章推荐
51好读  ›  专栏  ›  HACK学习呀

2019年安全行业公众号年度总结

HACK学习呀  · 公众号  · 黑客  · 2020-02-05 13:33

正文

由于作者视野有限,只收录了平常接触多的安全公众号,如果有与安全相关的公众号可以在github项目或微信聚合平台中提交。

目录

  • 分析背景与目的

  • 数据来源

  • 分析思路

  • 分析正文

  • 每天发发布文章统计

  • 公众号发布文章分析

  • 文章发布时间段分析

  • 阅读原文出处分析

  • 文章主题分析

  • 作者分析

  • 关键字分析

  • 总结与建议

分析背景与目的

运营公众号通常会进行数据分析,但把后台的数据复制粘贴,把那些人人看得到的数据写出来,这样也没什么意义。文章、阅读量、新关注人数、取消关注人数、总粉丝数,这些都是单个公众号的指标,重要的是挖掘数据背后的信息,从而对运营进行有效的指导。

结合专注安全领域最新资讯、专题和导航,做高质量聚合的 Secwiki-安全维基 的数据,引用github上一份secwiki安全报告分析。报告指出安全圈从2014年的安全媒体巨头 乌云 fb 91ri ,到后来增加的 嘶吼 i春秋 先知 e安全 等媒体百花齐放。再到后来 个人博客 的热度下降、知识付费兴起、媒体转战公众号的过程。体现出公众号在知识信息传播的过程终占的比例越来越重。

每年Sec-wiki收录文章来自微信安全公众号文章占比统计表格

年份(年) 微信占比(%) 综合排名
2014 0 -
2015 1.82 5
2016 10.34 3
2017 15.06 1
2018 23.05 1
2019 27.31 1

在2020年一月份secwiki收录信息源占比中发现来自微信公众号的文章已经占据41.98%。超越了 freebuf 安全圈 等知名安全媒体的总和。

互联网巨头企鹅对微信进行了流量封锁,web页面API接口限制,对信息敏感部分进行控制。导致微信数据采集一直是一个比较麻烦的事情。

通过这次分析,我们希望得到安全圈内公众号发布文章的规律,挖掘发布文章最多的公众号,公众号阅读原文背后的平台都有哪些,分析发布内容与安全关联程度,得出圈内优秀的公众号推荐给大家,微信公众号平台在安全圈内的重视程度。

数据来源

从2019年下半年,我们运营一个微信公众号聚合平台,关注了圈内常见的安全公众号200个左右,每天对其发布的文章进行采集,对历史数据进行回采。包含了公众号公开的全部数据,标题名称、链接、作者、正文、阅读量、在看数、评论内容等。截至2020年2月1日共实时监控有效公众号 201 个,采集了文章共 49966 篇,各类数据共 2.7G

分析思路

  • 公众号发布文章数 = 统计2019年 每个公众号 发布文章数量

  • 发布文章统计 = 统计2019年安全公众号 每天 发布文章数量

  • 公众号发布时间 = 统计2019年安全公众号所有文章 每个小时 发布时间

  • 公众号原文来源 = 统计2019年安全公众号文章 阅读原文 的主域名占比

  • 安全关联系数 = 统计文章中发布内容包括 cve 预警 漏洞 复现 总结 关键字占发布文章的20%比例的总和。

  • 发布文章的作者统计 = 统计2019年安全公众号作者发布文章的数量

  • 评论内容的情感分析 = 统计出所有评论的正负情感,梯度做一个柱状图

  • 云图 = 文章标题的云图、文章评论的云图

特别的剔除了阅读量、在看数、评论量的统计,因为实时采集的阅读量、喜欢、评论不是文章最终的数据,只能代表发表时到采集时的热度。虽然在后台中分析出了有阅读量很高的文章,但采集数据不准确似乎不能很好说明些什么。

分析正文

使用python的pyecharts库对数据做图标处理,效果如下。

每天发发布文章统计

上图为2019年52个周期对应7天每天的发布文章数量,x代表52周期、y代表一周7天、z代表发布数量,红多蓝少。(第一周的前两天是随机的数据,非1月1日)

所有公众号每天发布文章数量的折线统计,折线图呈现锯齿状,每一个缺口对应的都是假期,在图中凸凹呈规律起伏,标红线处有明显大范围空缺,可以根据时间推测处是大的假期:春节、五一、国庆。

为了更加明显辨别处为什么会出现发文较低的状况,我们将每天发布文章数降低到 65 以下,得到上图,一些隐藏的细节也展示出来,蓝色部分分别对应国家法定节假日时间。 36 周以后双休日的柱状图消失,表示后半年双休日的发文频率高于前半年。

  • 每周的工作日发布文章的平均数量大于节假日的平均数量,在图1中y截面呈现跳跃断层状态。

  • 2019年从年初到年末公众号每天发布文章数据呈递增趋势。

  • 每天发布文章最少的阶段在节假日,如春节、劳动节、双休日。每天发布文章数量在8月份之后平均都有升高。

  • 安全圈小编多数有着明确的假期。不全是007标准。

公众号发布文章分析

2019年每个公众号发布文章数量统计图

2019年共统计到公众号 262 个,文章 30629 篇,发布平均文章数 116.9 篇。发布文章最多的单个公众号共 1426 篇。大家所熟知的安全媒体平台 FreeBuf 极客公园 嘶吼专业版 安全牛 Python开发 网信防务 邑安全 E安全 中国信息安全 安在 看雪学院 黑白之道 等等都是高产者。

发布文章数量排名靠前的多数为安全媒体的公众号,平台每天有着大量资讯、新闻、安全研究的文章。排名靠中间的个人公众号每天努力的输出技术文章,实在太多这里抽出几个@ TimelineSec Tide安全团队 Ms08067安全实验室 HACK学习呀 MrLee小师父 DROPS攻防训练营 等等。

如果每周发送一篇文章,一年也就发布50篇文章,对于轻轻松松超过平均值的公众号实属不易。有 2/5 的公众号一年内发布的文章超过50篇,可算是“每周一篇”坚持不懈。有 1/3 的公众号发布数量低于10篇坚持不屑。

文章发布时间段分析

2019年所有文章发布时间统计图

公众号发布文章的时间集中在 8:00~11:00 17:00~19:00 。其中最多的发布时间在 18:00~19:00 之间共 5114 篇。发布文章在 1:00~5:00 之间最少,最低的只有 4 篇。虽然微信有定时发布功能,但很好奇这 4 篇文章是有多神奇。

有结论得出:上班后用户会划水登录微信更容易查看公众号推送的早报,6点下班后吃饭或地铁上又是用户打发时间的时候,这些时候推送文章更容易让用户看到。6点可谓是公众号的黄金时间,许多公众号的小编用行为证实这一点,如果你是在非黄金时间推送文章,别人再推送后你的文章就会被长长的通知覆盖,当用户吃饭或地铁时需要浏览好大一会才翻牌到你的文章。说不定这时已经下地铁了:(。

阅读原文分析

2019年文章原文平台来源统计图

每篇文章最后有阅读原文的标志,代表着本篇文章有其他平台的出处。2019年无‘后台’的文章 13757 占比 44.91% ,有‘后台’的文章 16872 篇占比 55.09% 。其中‘后台’的个数有 627 个。有大家熟知的主流平台@ freebuf 4hou youzan geekpark aqniu easyaq 77169 anzerclub pediy mottoin hetianlab 等等。一些你连听都没听说过的小众平台有 secist.com duoyinsu.com boombao.net securecomm.org 2captcha.com opentestcon.org w2n1ck.com zhenganwen.top p0desta.com 等等。说是百花齐放一点都不夸张。

安全圈内有着巨大资源的后盾。在密密麻麻的每个小平台中都有一颗变强大的内心,它充满活力、充满梦想、充满希望。同时在安全圈内默默贡献出自己的一份力量。

文章主题分析

统计文章中发布内容包括 cve 预警 漏洞 复现 总结 招聘 关键字的公众号Top20。

可能每个公众号都有自己的特点,如专注预警、复现、总结等方向。有没有公众号是偏全能的呢?

公众号 cve (%) 预警(%) 漏洞(%) 复现(%) 总结(%) 统计(%)
FreeBuf 7.40 2.51 11.92 11.37 9.12 8.46
邑安全 8.50 8.39 5.61 7.84 3.15 6.70
嘶吼专业版 13.80 1.07 9.64 2.35 4.97 6.37
山石瞭望 5.30 11.99 2.05 0.39 0.33 4.01
360CERT 6.03 9.71 1.94 0 0.16 3.57
腾讯御见威胁情报中心 4.93 8.27 2.70 0 0.66 3.31
绿盟科技 3.93 6.83 3.57 0 0.99 3.06
Timeline Sec 1.37 0.11 0.48 11.76 0.16 2.78
长亭安全课堂 2.65 8.51 1.40 0 0 2.51
合天智汇 1.09 0.35 1.66 3.92 5.47 2.50
绿盟科技安全情报 3.65 7.07 1.18 0.39 0.16 2.49

根据每个关键字百分比的平均值排序表,我们看到公众号在这5个关键字中分布不均匀,然后做一张折线图修正存在的问题。







请到「今天看啥」查看全文