* 本文来自群友高飞,公众号:powerBI极客。即将出成绩之际,或许对您有用。如有数据疑问,可咨询该号。
这是一篇解读型报告,我尝试通过图文结合的形式,从多个维度解读高考,报告使用的图表全部来自Power BI图表库,文章结尾提供了web版的报告链接,可以在线体验。
1966年 6 月 中国终止了高等教育招生制度
1977年10月 中国恢复高等院校招生制度
1977年全国报考人数570万, 录取人数27万
1978年全国报考人数610万, 录取人数40.2万
... ...
1. 全国高考报名人数在2008年达到创纪录的1050万人,之后几年持续下降,2014年开始稳定在940万,直到2018年迎来一个小高峰
2. 今年,高考人数创下了自2010年后的新高,975万的报名人数相比去年增加35万人,增幅3.72%
3. 随着高等教育的普及,高考整体录取率在2000年前后开始显著上升(柱形图颜色加深),2013年达到76%的历史高点,之后稳定在75%的水平。
各省变化:西南地区报名人数逆势增长,河南领跑全国无悬念
2018年,有10个省份报名人数超过了2008年的巅峰期,增长最快的省份来自于云、贵、川等西南地区(
将鼠标悬停在地图上方,可以观察到该省份的历史趋势
)
西南地区工业化、城镇化步伐较慢,人口出生率比较高,人口拐点相比发达地区到来的晚,再加上教育发展滞后,高考人数拐点也相应滞后。
户籍人口第一大省河南今年报名总人数98.38万人,逼近百万,比去年增加11.8万人,创历史新高,广东、山东、四川等考生大省紧随其后。
下图你可以观察到最近九年以来各省报考人数的变化(单位:万人)
录取率是衡量一个地区高考难度的主要指标,如果说以总录取率论难度是耍流氓,那么重点院校的录取情况无疑更有代表性。
以含金量较高985院校为例,2017年,河南、安徽和贵州三省(
下图红色
)的录取率最低, 低于1.2%,庞大的考生数量和优质教育资源的缺乏使得这些地区的考生竞争尤为激烈。
集中了全国优质高校资源的北京、上海和天津则毫无悬念的以最高的录取率领跑全国。
抓取了最近10年全国各省的录取线数据,通过稍后给出的报告链接,大家可以自助查询。
“生活就像一盒巧克力,你永远不知道下一秒会得到什么”
这句话原本是阿甘妈妈哄孩子用的,现实则是另一个截然不同的版本,我们曾经以为,走出高考的那一刻,可以暂时松一口气了,不料生活反手就是一巴掌:
慢着,知道志愿怎么填吗?
从过来人的故事中 也许能获得一些启发
对于大多数人,高考填报志愿第一次真正意义上将人生的选择权掌握在自己手中,是顺从长辈意志还是勇敢追随自己的爱好,永远没有标准答案。因为谁都不知道如果当年做出的是另外一个选择,人生将走向何方。
不过,虽然报志愿要考虑的因素非常多,我倾向于认为它们的重要性是有先后的:
城市>学校>专业
毕竟网上流传着这么一句真相:
包邮江浙沪、追星北上广
为了尽可能呈现决策过程需要考虑的变量,我采集了以下数据:
学校数
据
:2600多所本专科院校、包含一流院校/一流学科、985、211、院校类型、直属部门等分类信息
城市数据
:2600多所院校所在城市等级,使用第一财经2017年的城市分级。
专业数据
:教育部学科排名、双一流学科
薪酬数据
:TOP200院校毕业生薪酬及排名(供参考)
录取分数线
:972所院校分省市、分批次、分科目的过去十年的录取分数
经纬度
:2000多所院校的地理坐标,用于定位学校准确位置
基于以上数据,制作了下面的志愿填报辅助工具,
-
通过过滤器之间的交叉筛选,筛选出一批初步符合条件的学校列表,
-
然后自定义每个维度的权重,为每个学校计算得分并以此排名,最终得到符合个人需求的学校。
-
设置一个估分预测功能,手动调整分数,工具对每个院校计算一个过线概率,当然这里面没有什么复杂的预测,结果只作参考。
桑基图统计了两个相邻维度间的院校数量分布,受限于对数据集的要求,多层桑基图不能直接筛选模型,我在
每个类别下面放置了对应的筛选器
,用于初步筛选。例如,筛选位于
一线城市
和
新一线城市
的
211
综合类
大学列表。
基于《教育部2017全国高校学科评估结果》,展示出该专业的全国院校实力排名,从A+ 到C- 一共九个等级。帮助你按照专业进一步筛选学校。同时,上方的初筛结果也会过滤学校,不在初筛条件内的院校不显示在学科排名中。
调高城市级别项目的权重,一线城市院校得分增加
选择学校是极具个性化的选择,为了能模拟这一过程,我引入了5个自定义变量:
-
为每个学校计算权重,总得分是5项滑杆因素的加权平均数。
-
向右拖动滑杆则此项指标的权重增加,反之权重下降;当权重值为0时,此项指标不参与计算;当每项分值相同时,权重相同。
-
每项因素的内部成员已经预设了得分且不能修改,例如重点院校类别:985>211>本科>专科
-
学科级别权重在筛选学科后生效,此时表格将只显示有学科排名的院校
拖动滑杆改变分数,你可以在右侧表格的过线预测字段观察到当前分数的过线概率是高还是低,模型使用你预估的分数为每个院校计算过线概率,并实时返回预测结果,是个很有意思的功能,属于what-if切片器的实战应用。
这个过线概率的预测并没用什么高深的算法,我使用预估分数与每个院校在用户选择的
省份、批次
和
科目
这三个约束条件下的距今最近年份的录取分数进行比较,比最低分高25分或比平均分高15分都算做高过线概率。