本文介绍了清华大学大数据能力提升项目的实施情况,以及参与者孙沛瑜在大数据领域的学习、研究和实践活动。孙沛瑜参与了大数据能力提升项目,学习大数据相关的课程,参与了多个项目和实践,包括政策分析模型开发、大数据挑战赛等,并明确了研究方向,参与了国家重点研发计划课题。此外,他还成为了“数智安全与标准化”课程的助教,体验了不同的学习角度和助教工作。
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,培养具有大数据思维和应用创新的人才,实施了大数据能力提升项目,深受校内师生的认可。
孙沛瑜是清华大学软件学院的学生,参与了大数据能力提升项目,学习大数据相关的课程和实践,包括“数智安全与标准化”、“大数据系统基础(B)”等,并积极参与多个项目和挑战,如政策分析模型开发、大数据挑战赛等。
孙沛瑜明确了在过程挖掘的一致性检测方向上的研究方向,参与了国家重点研发计划课题。他的研究成果被录用为论文并被评为当届的最佳论文。
孙沛瑜在2024年秋季学期成为“数智安全与标准化”课程的助教,体验了不同的学习角度和助教工作,包括讨论课程内容、回答学生问题、参与期末期末答辩等。
智能技术的广泛应用正深刻影响着生活和生产方式,但如何运用和保护数据是目前的难题。作为清华青年,需要担当智慧去攻克这些难题,为实现智能技术的健康创新与应用贡献力量。
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
我叫孙沛瑜,2001年8月出生于浙江温州,在2019年被清华大学软件学院录取。在本科的学习生活中,我完成了数理基础的构建与软件工程方面专业知识的培养。在2023年,我在金涛老师的指导下完成了本科毕业论文《基于束搜索和改进成本函数的过程一致性检测技术》,首次完整实现了调研、选题、设计、实验、优化、总结成文的科研流程,这也激发了我的研究兴趣,以及对数据科学的兴趣。于是在通过清华大学软件学院免试推研入学就读研究生后,我便选择参与了大数据能力提升项目,希望能从中学习到更多与大数据相关的知识,提升自己对大数据的了解与认识。
在大数据能力提升项目的学习过程中,我先是选修了“数智安全与标准化”课程,学习了一些法律标准方面的知识,在课程中,老师也有安排专家授课与出行参访的环节,两次出行参访分别参观访问了中国质量认证中心与腾讯北京总部,了解到了一些行业前沿信息与工业界的企业目前在数智方面做了哪些努力,做到了哪些突破,面临着哪些困难。在课程的大作业上,经过调研、多次讨论、总结成文,我们小组也完成了“智能手环/手表运动监测数据安全要求”标准的编写,在编写的过程中,我们也参考了诸如《个人信息保护法》、《数据保护法》等相关法律,对智能手环/手表在运动数据的收集和上传中所涉及到的标准进行了编写与制定。在下一个学期,我选修了“大数据系统基础(B)”,学习到了一些关于IoTDB和FloK的知识,对数据库有了更深的了解。在这门课的大作业中,我们小组选择的是实现优化一个挖掘机数斗软件app,它能够使用yolo模型对挖掘机挖斗的视频进行识别,检测到视频中的斗、卡车等信息,分析当前挖掘机状态,根据状态变化进行状态机转移以及数斗计数,以此完成所需要实现的数斗功能。在夏季学期选修的“大数据实践课”上,课程团队与中石化进行合作,我在此次实践中参与了“政策分析模型开发”的项目,在两个月的实践中,完成了一个基于chatGLM大模型,fastGPT框架的政策分析模型的开发,该模型能够自动将pdf格式的政策文件转换成文本格式,再通过设计好的提示词与大模型进行交互提取得到所需要的结果。同时我也在2023年参加了大数据挑战赛,在复赛中得到了20名的成绩,并成功获得了当年的全国三等奖,而在2024年,我则是作为志愿者参加了大数据挑战赛决赛的后勤工作中。大数据能力提升项目与我个人专业有较高的重合度,学习到的知识都相当有用,利于我未来的发展,也利于我个人的成长,同时也拓宽了我的个人视野,让我能够接触到更多业内前沿的信息与知识。
在课题组的科研工作中,我也逐渐明确了个人在过程挖掘的一致性检测方向上的研究方向,参与了国家重点研发计划课题“工业互联网业务过程挖掘与持续改进理论研究”,研究如何将事件日志与过程模型进行快速、高效、准确的一致性检测,得到的检测结果能够进一步指导过程的制定与优化。我的部分研究成果也整理成论文《基于束搜索和改进成本函数的过程一致性检测技术》,被第十三届中国业务过程管理大会(CBPM2023)录用,同时也是当届的最佳论文。
在2024年秋季学期,我成为了“数智安全与标准化”课程的助教,从原本的学生身份转化为了助教的身份,从不同的角度来体验这门课程,包括每周的助教会上与老师讨论同学们对这门课的意见以及有什么可以进行改进的地方、以及回答同学们在课前课后问卷中提出的问题、还有在期中期末答辩时作为提出建议的人而非接受建议的人,这些都是与原来完全不同的体验。在助教协助老师教学、组织课程活动的工作中,我也体会到了老师与专家对于课程的重视,同学们对于课程内容的期待与学习。
自古以来,从车轮的发明、造纸术的革新到互联网的普及,每一次技术变革都极大地推动了人类文明的进步。如今,智能技术的广泛应用正深刻影响着我们的生活和生产方式。而智能技术的运用带来的就是大量数据的产生,如何运用这些数据,如何保护这些数据都是目前的难题。作为新时代的清华青年,我们有担当、有智慧去攻克这些难题,为实现智能技术的健康创新与应用贡献自己的力量,书写新的辉煌篇章!
数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。
新浪微博:@数据派THU
微信视频号:数据派THU
今日头条:数据派THU