Park等人从亚特兰大、丹佛、圣地亚哥和西雅图四个城市的Twitter数据中,收集了2020年4月15日至6月3日之间发布的超过150万条推文。在数据清理过程中,研究者剔除了自动生成的推文(如天气预报、广告等),仅保留与“心理健康”、“抑郁”、“焦虑”等相关的原创推文。经过初步筛选后,最终留下了1,444,474条推文用于进一步的情感分析。
研究者采用了基于词典的情感分析工具TextBlob,对每条推文进行情感极性打分(情感值从-1表示极度负面到1表示极度正面)。为了避免单个用户频繁发布的推文对整体情绪产生偏差,研究者对同一用户的多条推文进行了平均计算,确保每日的情感分数能够更客观地反映集体情绪。
除此之外,研究者还通过计算熵值来衡量每日情绪变化的不可预测性,熵值越高意味着情绪波动越大,越难以预测。这种结合了情感分析和熵值的社会感知指数能够更好地揭示出突发事件引起的情绪变化以及这些变化在一段时间内的持续性。
1. 四个城市的每日平均情感变化
图1展示了四个城市在研究期间(2020年4月至6月)的每日情感变化趋势。可以清楚地看到,随着乔治·弗洛伊德事件的发生,5月25日之后所有城市的情感分数都出现了明显的下降。这一趋势反映了该事件在全国范围内引发的强烈负面情绪。此外,5月16日圣地亚哥的情感分数出现了局部下降,这与当地的“开放圣地亚哥”抗议活动有关,表明当地事件对情感变化的影响同样不可忽视。
图1:四座城市(亚特兰大、丹佛、圣地亚哥和西雅图)的每日平均情绪变化
2、亚特兰大与圣地亚哥每日情感与情感变化幅度
图2与图3详细展示了亚特兰大和圣地亚哥在特定日期的情感变化:
例如,亚特兰大在5月7日(Ahmaud Arbery事件)和5月26日(乔治·弗洛伊德事件)出现了显著的负面情感变化,红色大点表明这些事件引发了强烈的负面情绪。而圣地亚哥在5月16日由于“开放圣地亚哥”抗议活动,情感波动也较为明显。
图2:亚特兰大日均情绪值及情绪变化程度
图3:圣地亚哥日均情绪值及情绪变化程度
3、每日情感变化幅度的热力图
图4是四个城市每日情感变化幅度的热力图,通过颜色表示情感变化的程度。绿色代表正面情感的显著增加,而红色代表负面情感的显著下降。从5月25日开始,多个城市同时出现了红色区域,表明乔治·弗洛伊德事件带来了全国性的负面情绪。
图4:每日情绪变化程度热力图
4、社会感知指数
图5是社会感知指数的图表,它结合了每日的熵值与情感等级。条形图的高度代表熵值,颜色的深浅代表情感的负面程度。较高的熵值和较深的颜色表明该日发生了异常的情绪变化,并且这种变化以负面情绪为主。例如,5月16日圣地亚哥的熵值明显较高,颜色也较深,表示“开放圣地亚哥”事件引发了强烈且不可预测的负面情绪。相比之下,5月26日之后,亚特兰大和圣地亚哥的熵值虽有所下降,但负面情绪持续存在,说明乔治·弗洛伊德事件后的负面情绪延续了数天甚至数周。
图5:心理健康社会感知指数