最近发现了一个神奇的网站,可以查询世界上绝大多数城市的生活成本情况,包括衣食住行等等各个方面,可以让我人在家中坐,便知天下各地人民的生活状况。
害,真是咸吃萝卜淡操心呐!
我们来看看这个网站,大致长这样
可以看到比如生活在北京,一个四口之家每个月的花费就要15W人民币,如果是一个单身汉的话,那么不算房租,也要4K多的开销,看来还真的是大北京,居不易啊!
当然网站上还有很多很好玩的数据,大家可以自行探索
https://www.numbeo.com/cost-of-living/in/Beijing
下面我们就来具体看看,生活在北京,衣食住行到底是怎么样的
最后我们还做成了一个大屏的效果
数据抓取
其实抓取数据还是比较简单的,直接使用 Pandas 的 read_html 函数即可,这真的是一个超级棒的工具
import pandas as pd
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
data = pd.read_html("https://www.numbeo.com/cost-of-living/in/Beijing", header=None)
我们拿到的数据如下
接下来就可以全方位的通过图表来展示大北京的生活啦
北京的衣食住行
首先是北京的购衣成本
可以看出,男士的商务皮鞋是最贵的,而女士的裙子最高才不过400元,看来人们的消费观念有所改变,女人的钱不再那么好赚了
接下来是用餐成本
两人或三人,中等餐厅的人均消费水平是最高的,最高达到了350元,不过对于帝都来说,这好像也不算什么。
难道在吃这方面,北漂们都不特别讲究吗
再来看看果蔬的成本
每千克最高的是苹果和橙子,总体来看,也还好的感脚呢
最后我们看看租房成本
可以说,租房这一项是最能体现帝都生活的数据了,市中心的单室套,最高达到了1.2W,而三室套也能达到2.5W的恐怖数字,看来在北京生活,其他方面都还好,这个住才是大问题呀
全国租房数据大屏
既然住是最为高成本的数据,那么我们来看看全国其他主要城市,租房的费用都是怎么样的呢
我们先获取数据
# coding = utf-8
"""
======================
@author:luobo
@time:2021/9/11:9:44
@email:
@File: main.py
======================
"""
import pandas as pd
import re
import time
import json
city_list = ['Beijing', 'Shanghai', 'Shenzhen', 'Guangzhou', 'Hangzhou', 'Suzhou', 'Nanjing', 'Fuzhou-China', 'Dalian',
'Qingdao', 'Shenyang', 'Jinan-China', 'Changchun', 'Harbin-China', 'Zhengzhou-China', 'Lanzhou-China',
'Chengdu', 'Chongqing', 'Wuhan', 'Tianjin']
city_url = "https://www.numbeo.com/cost-of-living/in/"
rent_dict = {}
rent_range_dict = {}
for city in city_list:
city_url_final = city_url + city
print(city_url_final)
data = pd.read_html(city_url_final)
one_bedroom = data[1].loc[54].tolist()[1]
one_bedroom_range = data[1].loc[54].tolist()[2]
data = re.findall(r'[0-9,.]+', one_bedroom)[0].replace(',', '')
data_range_list = [i.replace(',', '') for i in re.findall(r'[0-9,.]+', one_bedroom_range)]
data_range_list.append(data)
rent_dict[city] = data
rent_range_dict[city] = data_range_list
time.sleep(10)
with open("rent_data1.json", 'w') as f:
json_str = json.dumps(rent_dict, indent=4, ensure_ascii=False)
f.write(json_str)
with open("rent_data_range.json", 'w') as f:
json_str = json.dumps(rent_range_dict, indent=4, ensure_ascii=False)
f.write(json_str)
if __name__ == '__main__':
pass
运行代码,会生成两个json文件,分别是租房平均费用,已经最高最低费用
我们先编写获取柱状图的接口
@app.route("/get_chart_data")
def get_chart_data():
with open("rent_data.json") as load_f:
data = json.load(load_f)
chart_info = {}
chart1_data = get_data(["Beijing", "Shanghai", "Shenzhen", "Guangzhou", "Hangzhou"], data)
chart2_data = get_data(["Suzhou", "Nanjing", "Fuzhou-China", "Dalian", "Qingdao"], data)
chart3_data = get_data(["Shenyang", "Jinan-China", "Changchun", "Harbin-China", "Zhengzhou-China"], data)
chart4_data = get_data(["Lanzhou-China", "Chengdu", "Chongqing", "Wuhan"