专栏名称: 数据猿
关注大数据行业的最前沿资讯,分享最有价值的大数据深度文章,关注“数据猿”就是关注大数据!
目录
相关文章推荐
大数据分析和人工智能  ·  大公司病,太形象了!(漫画版) ·  2 天前  
数据派THU  ·  NeurIPS 2024 | ... ·  3 天前  
大数据与机器学习文摘  ·  GitHub谎报了Copilot的统计数据! ... ·  6 天前  
大数据文摘  ·  满血版 o1 上线两天,被网友玩出来了 ... ·  5 天前  
51好读  ›  专栏  ›  数据猿

奥鹏教育龚亚勋:大数据支持下的远程教育,如何用数据提升教学质量

数据猿  · 公众号  · 大数据  · 2017-08-25 08:00

正文


2017年08月16日,由数据猿、HCR慧辰资讯双方联合主办的主题为“大数据助力个性化教育”活动在酒仙桥东路电子城科技园隆重举行。奥鹏教育的龚亚勋先生特意为大家分享了关于教育大数据工作的一些心得体会,以及一些教学方面的工作。


编辑 | 张宏

官网 | www.datayuan.cn

微信公众号ID | datayuancn


2017年08月16日,由数据猿、HCR慧辰资讯双方联合主办的主题为“大数据助力个性化教育”活动在酒仙桥东路电子城科技园隆重举行。奥鹏教育的龚亚勋先生特意为大家分享了关于教育大数据工作的一些心得体会,以及一些教学方面的工作经验。


分享要点如下:


主要分为四部分,第一部分是我对整个教育大数据观点的一些理解分享。第二部分是奥鹏在教育大数据一些具体实践,第三部分是我们公司的核心问题,跟K12差不多,就是如何通过大数据来提升教育质量,最后一部分是我专门为这次分享会、讨论会列出的问题的观点。


第一部分,关于整个教育大数据观点


第一点是大数据的定义,大数据这个词已经不新鲜,但是到现在为止都没有一个统一的定义,大部分的定义都是从技术角度去出发的,其实我觉得它是一个资产。包括马云也说,大数据在未来10年是非常有价值的。



第二点,大数据大家也经常在谈,我以前是在中国移动总部,去了奥鹏之后,我也在说教育有什么大数据?中国移动都是10亿级别的数据,一个学校教育几千人,但是现在很多人都误解了,认为数据越多越好,然后就去爬虫,去互联网上到处爬。我认为数据最重要的是什么?它能为你的业务、工作带来什么样的价值,这个价值是最重要的,而不是数据量的本身。


大数据在其他行业都有了很多成熟的应用,相信今天来的各位都很清楚,我也就不细讲了,我认为整个教育活动中产生的数据都是大数据。


第二部分,教育大数据有哪些?



第一是教务管理,这块我认为是最容易做,也是最容易入手的地方。现在腾讯在做智慧教育,包括移动做的,也是从教务的管理来出发,好处是非常容易结构化,也很容易给领导进行展示,领导一看就特别炫。


第二块是教学过程,这是学生学习过程的一些数据,这也是教育非常难做的一些数据,教育是线下的,而且是非结构化的,所以,处理起来非常困难。现在科大讯飞也在这块做了很多的工作。


第三块是如何把非结构化的数据变成可以处理的一些东西。最后一点,不仅是我们的教学过程,包括学生在校园里的行为也可以发挥一些价值。从学校里消费、饭卡的使用情况就可以分析出来谁是贫困生,学校就可以不影响学生面子的情况下默默给他钱。


从移动出来以后,我也在试点,跟运营商合作去建立用户的行为特征。从现在来看,数据的精准度还是不错的,如果按照这种方式进行转变的话,招生的成本就会非常低。


第二个是产品,互联网的产品就是靠数据进行运营迭代的。


第三是服务,现在要做个性化的服务。个性化按照以前来说,成本是非常高的,通过大数据的机器学习就可以做到是非常低成本的服务。


第四个是管理,大数据模型建一些模型,就可以做一些招生的预警、预测,包括各个部门业务、财务的数据都可以每天实时的进行展现。最重要的一点就是,如何用数据提升教学质量。


介绍一下奥鹏,奥鹏服务的是什么?



我们是做远程的成人继续教育,我们有两个,一个是中央电大。中央电大在2000年的时候,互联网开放大学已经流行起来了,我们对接各种高校、网络学院、继续教育学院,他们把课程、资源放在我们的平台上。另外,我们再对接各地的电大,这个叫线下学习中心,学生就可以去学习中心报名,在线上学习,考试的时候再去线下进行统计考试,最后就可以拿到国家认可的专科和本科的文凭,目前还没有硕士。


我们公司除了继续教育,也扩大到教师培训,特别是偏远地区教师的培训,在这方面已经做到了第四,远程继续教育做到了第一。职业教育也在初步推进,最后一块是IT生态,上面有很多IT的课程。



奥鹏成立于2014年,我是去年5月份才来到这里,之前也走了很多的弯路。这个部门在公司的价值已经越来越大了,我们把整个大数据平台搭建起来。把各个事业部的数据汇聚整合起来,这块其实是非常痛苦、非常难做的事。从今年开始,我们跟业务部门的关系会越来越好,因为他们对我们的依赖越来越强。如果是技术部门的话,如何没有得到认可,你在公司的价值也体现不出来。


我们公司自己本身就可以生产数据,从01年到现在,所有学生学习的行为,不仅仅是做作业,整个学习过程都有,我们有42个合作高校,有1300多个成人教育的专业,400多万学生。今年,我们拿到的国家发改委资金的支持,拿到了5000万,国家发改委赞助了24个公司,但是我们是唯一一个在教育领域拿到资金的一家公司。



从我们的实践来看,有了数据能够做一些简单的分析,就能起到非常大的作用。一开始不用去追求特别先进的东西,把数据分析做好了就可以起到非常大的作用。当然,现在是在第二步、第三步,第二步已经做得非常好,第三步主要还是做一些监督学习的模型,来预测一下学生的流失,预测一下学生做作业的情况。这些会用到比较复杂的机器学习的算法。


现在的人工智能炒得很火,我也不知道人工智能的清晰定义是什么?现在好像是深度学习就是人工智能,但是深度学习如何在这块应用,应用的效果好不好我也不太清楚,这次我也是来学习一下。


这是我们做的实践,第一是做好教务、公司的管理、做好大屏,我们现在把各个财务的数据、业务的数据,包括关键的一些指标,全部用大屏做出来,外面领导来参观的时候也觉得特别炫。


运营人员包括微信公众号的运营,我们也做了一些分析。我们公司的数据氛围正在形成。去年我刚来的时候,我们平台出问题了,一挂,挂了之后业务人员都没有人管,一到周五需要写周报了才打电话过来,现在我们的平台一出问题,就会实时的有业务人员来问。


其次,就是面向高校,主要是给高校做一些专业的东西,包括专业的招生,学习的情况,以及能不能顺利毕业的情况,来配合他做专业的调整。


我们也做了一些标准化的学生画像,各个学生的基本信息,学习情况这些。我实话实说,我觉得这个画像的东西,第一次看的时候很兴奋,在后面的时候,这种东西不大会变,比如说学生的年龄分布、性别分布,这个变化不会太大。所以,实践的价值不是特别大,大数据的价值一定要去解决业务核心的问题。


第三部分,如何提升教育质量?


我们做了一些初步的探索,其实还有很多的事要做。首先讲了K12,就是高考的成绩。在线教育已经很low了,为什么?在英国很多学生都毕不了业,做线上教育的大学毕业率只有20%左右,远程大学毕业率只有0.5%,中国都能毕业,但是会出现很多违规的情况,这已经出现了一个产业链了,有人代你去考试、代你写作业,这已经出现了很多的风险。上次在清华学堂做了一次分享,清华学堂一门课能学完的都不到5%。



如果要谈质量的话,首先就要谈质量评价。


我也跟很多高校,包括一些很好的高校去做交流,高校现在还是非常传统的,还是老一套的思路,他的评价是去看有没有配电脑,配了多少老师,让专家、学者教授坐在后面去听课,这也有一些问题,这不是直接以学生为核心的,如果涉及到文化,比如说教授做评价的话,教授再好其实也是人,也会受到一定因素的影响,打分的时候非常好是8到9分,比较好就是7到8分。



我也在思考,日本是怎么把质量做起来的(制造业) 这一定是量化,有了量化指标,我就可以做运营了,我可以拿今天和昨天比,明天和今天比,我们传统的方式是什么 我今天请的教授比较好,下一次请的还是比较好,但是我并不知道你有没有进步。互联网的思维一定要用到我们的教育领域里去,这是一种不断迭代的思维,不断迭代就需要有数据做支持。


我认为,教学质量好不好怎么去看?去看学生好不好学,如果学生都不愿意来你这儿学习,就算是他成绩很好,这也说明跟你没有关系,这是他自己的学习能力很强。我们这儿的评判是什么?是学生能不能顺利毕业。


第四部分,对一些问题的解读



1、如何大规模的进行数据采集?数据不够如何分析?你一定要找到有数据的机构,因为没有取得明显效果的话,学校是不愿意付费的,所以你一定要有足够的资金来支持。


2、教育培训机构,我认为教育培训机构是有机会做这件事的。他不仅有考试的题,其实有些过程也是可以采集到的。我认为,中国最牛逼的教育大数据公司一定是学而思,学而思的整个教学过程、科研队伍是非常强大的。学而思已经开始让小朋友用iPad开始做题了,这也是在收集数据。


3、细分领域,从作业题方面来收集数据,我认为也可以,但是这块的数据还是不够的,这还是比较偏向某一个细分领域的。教育涉及到的范围是非常多的。我们可以从考试去入手,但是数据我认为还是远远不够的。我认为大数据的核心就是需要过程数据,然后再把过程数据收集起来,这不仅仅是一个看考试、测验的数据。


仅分析做题成绩是否足以反应学生学习情况?我认为是不足的。过程的数据是非常关键的,我们不可以抛弃掉,虽然收集起来很困难,但是也要想办法收集。


接着就是学而思的方式,学而思让小朋友用iPad来做题,我认为他也是从这个方面去出发的。


人工达标签成本,现在做知识图谱是非常耗成本、耗时间的,从成本效益的角度来说,不应该去追求完美的东西,如果我们可以给老师提供一些比较方便的工具,就是让他随手填一填,让学生随手填一填,事后再来进行分析,我认为这也是大数据的一种分析思路。


分析后的应用,单子上列的课程推荐,在前面的时候大家都没有讲课程推荐。在现在的知识体系下我们是不好推荐课程的,因为知识是非常有逻辑的,是有先后顺序的,不像买东西一样,我买一个肥皂可能还会买一瓶酒,我可以算买过这个东西的人还可能买什么东西,你如果按照这个思路来看,学过这个课本的还需要学什么课,如果这样去绕的话是没有意义的。


我们要做大数据,一定要获得高层的支持,帮助政府、高层、领导去做管理的决策。


最后,最好要做好A/B测试。这次大数据做出来之后,老师会说我在学校用了这些,学生的成绩也已经上去了,但是,他会不会说是老师教的好 所以,在前期我们需要做A/B测试,这两个班一个用,一个不用,这样价值就可以很容易的体现出来了。