专栏名称: Crossin的编程教室
编程世界的新手村。 这里有可能是最简单的 Python 入门教程。 每天5分钟,轻松学编程。
51好读  ›  专栏  ›  Crossin的编程教室

可视化大屏展示北京生活成本有多高

Crossin的编程教室  · 公众号  · 科技自媒体 生活  · 2024-11-27 13:31

主要观点总结

本文主要介绍了一个神奇的网站,可以查询世界上大多数城市的生活成本,包括北京的生活成本和全国主要城市的租房费用。文章还提到了数据抓取、数据分析以及数据可视化的相关过程。

关键观点总结

关键观点1: 网站功能介绍

该网站可以帮助用户了解世界各地的生活成本,包括衣食住行等方面,让用户能够了解不同城市的生活状况。

关键观点2: 数据抓取过程

通过使用Pandas库,可以方便地抓取网站上的数据。具体地,使用read_html函数可以获取网页上的表格数据。

关键观点3: 数据分析与可视化

通过对获取的数据进行分析,可以了解不同城市的生活成本情况。同时,通过编写接口和ECharts代码,可以将数据可视化展示,便于用户更直观地了解数据。

关键观点4: 应用实践

文章介绍了如何使用 Flask 框架完成基本的代码编写,并提到了将数据分析结果应用到实际生活中的例子。

关键观点5: 新书推荐

最后提到了Crossin的新书《码上行动:用ChatGPT学会Python编程》,并介绍了相关内容和购买后的读者交流方式。


正文

最近发现了一个神奇的网站,可以查询世界上绝大多数城市的生活成本情况,包括衣食住行等等各个方面,可以让我人在家中坐,便知天下各地人民的生活状况。 害,真是咸吃萝卜淡操心呐!

我们来看看这个网站,大致长这样

可以看到比如生活在北京,一个四口之家每个月的花费就要15W人民币,如果是一个单身汉的话,那么不算房租,也要4K多的开销,看来还真的是大北京,居不易啊!
当然网站上还有很多很好玩的数据,大家可以自行探索

https://www.numbeo.com/cost-of-living/in/Beijing

下面我们就来具体看看,生活在北京,衣食住行到底是怎么样的

最后我们还做成了一个大屏的效果

数据抓取

其实抓取数据还是比较简单的,直接使用 Pandas 的 read_html 函数即可,这真的是一个超级棒的工具

import pandas as pd


pd.set_option('display.max_rows'None)
pd.set_option('display.max_columns'None)
data = pd.read_html("https://www.numbeo.com/cost-of-living/in/Beijing", header=None)

我们拿到的数据如下

接下来就可以全方位的通过图表来展示大北京的生活啦

北京的衣食住行

首先是北京的购衣成本

可以看出,男士的商务皮鞋是最贵的,而女士的裙子最高才不过400元,看来人们的消费观念有所改变,女人的钱不再那么好赚了

接下来是用餐成本

两人或三人,中等餐厅的人均消费水平是最高的,最高达到了350元,不过对于帝都来说,这好像也不算什么。
难道在吃这方面,北漂们都不特别讲究吗

再来看看果蔬的成本

每千克最高的是苹果和橙子,总体来看,也还好的感脚呢

最后我们看看租房成本

可以说,租房这一项是最能体现帝都生活的数据了,市中心的单室套,最高达到了1.2W,而三室套也能达到2.5W的恐怖数字,看来在北京生活,其他方面都还好,这个住才是大问题呀

全国租房数据大屏

既然住是最为高成本的数据,那么我们来看看全国其他主要城市,租房的费用都是怎么样的呢
我们先获取数据

# coding = utf-8
"""
======================
@author:luobo
@time:2021/9/11:9:44
@email:
@File: main.py
======================
"""


import pandas as pd
import re
import time
import json

city_list = ['Beijing''Shanghai''Shenzhen''Guangzhou''Hangzhou''Suzhou''Nanjing''Fuzhou-China''Dalian',
             'Qingdao''Shenyang''Jinan-China''Changchun''Harbin-China''Zhengzhou-China''Lanzhou-China',
             'Chengdu''Chongqing''Wuhan''Tianjin']
city_url = "https://www.numbeo.com/cost-of-living/in/"

rent_dict = {}
rent_range_dict = {}
for city in city_list:
    city_url_final = city_url + city
    print(city_url_final)
    data = pd.read_html(city_url_final)
    one_bedroom = data[1].loc[54].tolist()[1]
    one_bedroom_range = data[1].loc[54].tolist()[2]
    data = re.findall(r'[0-9,.]+', one_bedroom)[0].replace(',''')
    data_range_list = [i.replace(','''for i in re.findall(r'[0-9,.]+', one_bedroom_range)]
    data_range_list.append(data)
    rent_dict[city] = data
    rent_range_dict[city] = data_range_list
    time.sleep(10)

with open("rent_data1.json"'w'as f:
    json_str = json.dumps(rent_dict, indent=4, ensure_ascii=False)
    f.write(json_str)


with open("rent_data_range.json"'w'as f:
    json_str = json.dumps(rent_range_dict, indent=4, ensure_ascii=False)
    f.write(json_str)


if __name__ == '__main__':
    pass

运行代码,会生成两个json文件,分别是租房平均费用,已经最高最低费用

我们先编写获取柱状图的接口

@app.route("/get_chart_data")
def get_chart_data():
    with open("rent_data.json"as load_f:
        data = json.load(load_f)
    chart_info = {}
    chart1_data = get_data(["Beijing""Shanghai""Shenzhen""Guangzhou""Hangzhou"], data)
    chart2_data = get_data(["Suzhou""Nanjing""Fuzhou-China""Dalian""Qingdao"], data)
    chart3_data = get_data(["Shenyang""Jinan-China""Changchun""Harbin-China""Zhengzhou-China"], data)
    chart4_data = get_data(["Lanzhou-China""Chengdu""Chongqing""Wuhan"






请到「今天看啥」查看全文