专栏名称: 编程派
Python程序员都在看的公众号,跟着编程派一起学习Python,看最新国外教程和资源!
目录
相关文章推荐
Python开发者  ·  DeepSeek 杀入全球榜单第 2 ... ·  2 天前  
Python爱好者社区  ·  DeepSeek梁文锋实习往事曝光!月薪1. ... ·  3 天前  
Python爱好者社区  ·  吴恩达,yyds ·  昨天  
Python爱好者社区  ·  清华大学104页《DeepSeek入门到精通 ... ·  昨天  
Python中文社区  ·  量化交易复盘:如何用这套简单的TSI+EMA ... ·  4 天前  
51好读  ›  专栏  ›  编程派

《  打工人分析简报  》

编程派  · 公众号  · Python  · 2020-11-26 11:40

正文

点击上方“ 编程派”,选择设为“设为星标

优质文章,第一时间送达!


最近打工人这个梗和相关的沙雕梗火得直烧眉毛。



微博、b站、知乎、朋友圈...广大东西南北漂们突然找准了定位,大家既不满于听上去毫无人权的社畜,也自知不是满腔热血已经沸腾的奋斗者, 我们的真实身份是——打工人


忽如一夜春风来,千人万人打工仔。


我很好奇, 这个神奇的定位(梗)怎么就火起来了?广大工友们在网上都贡献了哪些优质的工作笔记? 于是我用Python爬取了微博、b站相关话题的数据,来一探究竟。


b站部分爬取代码(直接跳过完全不影响阅读体验)


url = 'https://search.bilibili.com/all?keyword=%E6%89%93%E5%B7%A5%E4%BA%BA&from_source=nav_suggest_new0&page={}'

def get_target(url,num = 10):
    result = pd.DataFrame()

    for i in range(1,num + 1):
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
        html = requests.get(url.format(i),headers = headers)
        bs = etree.HTML(html.text)

        for sig in bs.xpath('//li[@class = "video-item matrix"]'):
            title = sig.xpath('div[@class = "info"]/div/a/@title')[0]
            click = sig.xpath('div[@class = "info"]/div[3]/span[1]')[0].xpath('string(.)').strip('\n        ')
            danmu = sig.xpath('div[@class = "info"]/div[3]/span[2]')[0].xpath('string(.)').strip('\n        ')
            date = sig.xpath('div[@class = "info"]/div[3]/span[3]')[0].xpath('string(.)').strip('\n        ')
            up = sig.xpath('div[@class = "info"]/div[3]/span[4]')[0].xpath('string(.)').strip('\n        ')
            df = pd.DataFrame({'标题':[title],'播放量':[click],'弹幕':[danmu],'日期':[date],'UP主':[up]})
            result = pd.concat([result,df])

        time.sleep(random.random() + 0.5)
        print('已经完成b站第 {} 页爬取'.format(i))

    return result


打工人的火热


马克思曾经没说过:看一个现象有多火,百度指数是最简单粗暴的工具。



对比热度非常高的“特朗普”,“打工人”起于微末,10月20号开始才作为一个独立词条被记录,随后爬坡式增长,到22号和特朗普还有鸿沟般的热度差异。10月23号,“打工人”搜索指数从前一日的8469,飙升至24216,竟然能硬压话题之王“特朗普”一筹。


但是百度指数在新鲜热词的追踪上总是滞后的,我们再看看b站数据,找到这个梗火遍鬼畜区的时间秘密。



9月22日,b站上有了第一声“早安,打工人”的问候,但播放量寥寥。9月23日-10月14日,每天有不到5个新的打工人视频诞生。


10月15号打工人原创视频达到两位数,20号开始,打工人开了狂暴模式,每天原创视频量以阶梯式增长,截止24日,日新增视频达到了258个。


原创视频数量上涨,是拜打工人梗的热度所赐,b站上有哪些魔性又火热的“打工人”视频呢?


从数据上很容易发现有两个明显的爆点,10月16号,“老摸鱼艺术家”的《加油!打工人!》播放量已破320万,充分点燃了打工人的热情。



10月22号up主“三Lu有毒”也在《早安,打工人!》埋伏了一手,把各种打工人优秀的工作笔记串联起来,500万播放量已是唾手可得。



不错,很有精神!


看了一圈鬼畜区的打工人视频,我发现文本都有一些相似的影子,他们都来源于“优秀人打工笔记”。


打工人优秀工作笔记


根据爬取的内容,小z挑选了热度比较高的10条优秀打工人笔记,供各位工友学习,共同进步!


早起的打工人要学会忍受孤独!



靠自己的打工人,才是光荣的!



我爱打工,更爱喝水!



单身,可能是因为打工不够努力!



打工必须得努力!



累吗?累就对了,舒服是留给有钱人的。早安,打工人!


冷吗?冷就对了,温暖是留给开小轿车的人。早安,共享单车人 !







请到「今天看啥」查看全文