专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
人工智能与大数据技术  ·  阿里云通义灵码 AI 程序员全面上线,宣称 ... ·  21 小时前  
资质体系认证中心  ·  2025继续升温!多地DCMM鼓励政策持续实 ... ·  昨天  
资质体系认证中心  ·  2025继续升温!多地DCMM鼓励政策持续实 ... ·  昨天  
数据派THU  ·  【AAAI2025】多层次最优传输用于语言模 ... ·  4 天前  
51好读  ›  专栏  ›  数据派THU

大数据能力提升项目|学生成果展系列之五

数据派THU  · 公众号  · 大数据  · 2025-01-08 17:00

正文


导读


为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。



回首2024年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的8位同学代表一起领略他们的风采吧!




代表性成果




机械工程系 邵琦


回顾我在“大数据能力提升项目”中的实践历程,其中最具代表性且能充分体现我大数据方向能力提升与创新成果的经历,便是担任《数据库技术及应用》课程的助教,并在教学过程中对课程内容进行大幅改进与优化的案例。作为一名机械工程专业的博士生,我在加入大数据项目之前,对计算机与数据分析的认知十分有限。然而,通过系统学习《大数据系统基础A》、《人工智能》、《大数据管理与创新》等课程,我掌握了诸如 Python 、numpy 、pandas 、matplotlib 等工具与技术,不仅培养了数据处理与分析的思维模式,更为我在教学实践中开展创新奠定了基础。


我最初参与助教工作是在一门名为《计算机文化基础》的课程中。该课程面向全校范围内缺乏计算机基础的学生,由计算机系李秀老师主讲。当时,我尚未有机会在教学中直接展示我的大数据分析能力,只是协助答疑与批改基础性作业。尽管如此,在与李老师的交流中,我逐渐察觉到自己可为课程创新贡献力量的潜力。李老师对于我跨学科背景与数据处理技能表现出浓厚兴趣,并在 23 年春季学期主动邀请我担任《数据库技术及应用》课程的助教。这门课的定位是为文科与零计算机基础的学生打开数据库与数据分析的大门。面对这批学生,传统教学模式较为抽象与理论化,加之学生普遍缺乏编程与数据分析经验,课程往往难以激发他们的兴趣和自信心。


接手《数据库技术及应用》的利用 python 进行数据分析及可视化部分的15学时的助教任务后,我决定将自己在“大数据能力提升项目”中获得的技能与思维融入教学过程,力求通过更直观、更贴近实际应用场景的方式,让学生亲身体验数据分析的力量与乐趣。我首先对课程的教学资源进行重新梳理与设计。在此之前这门课程的python教学部分侧重于python的基础语法和算法的讲解,但学生常因缺乏可视化手段与情境例子而难以理解。为解决这一难题,我引入了多种交互式学习方法,使用JupyterNotebook作为教学平台,实现代码和说明的无缝结合;设计即时反馈的练习题,帮助学生及时发现和纠正错误。数据处理部分摒弃了不利于理解的numpy的介绍,使用pandas作为主要工具,让学生在实践中轻松加载、清洗和分析数据集,再通过matplotlib 将结果以图表、曲线或散点图等形式呈现出来。通过这样的学习路径,学生不再只是机械记忆语法或概念,而是在数据处理与可视化的过程中逐渐理解数据库结构与数据分析思路。


为了确保教学内容易于上手,我精心挑选了学生感兴趣且贴近生活的实验数据。将这些数据以 CSV 格式导入课堂。在教学演示中,我使用 pandas 对这些数据进行清洗与整理,将冗余信息剔除,将无效值统一处理,然后利用统计函数快速获得平均值、众数、中位数等基本统计指标。学生在看到数据分析的结果时往往露出惊喜的表情,他们对数据库和数据分析不再感到陌生与抽象,反而对数据世界的内在规律产生了浓厚兴趣。


在授课过程中,我还针对学生的不同起点做出差异化指导。有部分学生完全没有编程经验,对命令行窗口和数据结构概念感到畏惧。对此,我在最初几次实验课中编写了详细的操作指引,包括从如何打开Notebook,到如何导入pandas与matplotlib库,再到如何读取CSV文件与进行基础统计分析。我将指引分解为多个小步骤,每个步骤都配有相应代码示例和说明文档。学生在完成这些基础步骤后,能够逐渐在心理上“拆墙”,从“我不会编程”转变为“我可以尝试理解这些代码在做什么”。而对于已有一定计算机基础的学生,我则鼓励他们根据自己的兴趣,尝试更复杂的分析方法,甚至进行简单的数据建模。在这过程中,我像一个引导者,而不是刻板的讲授者。我提供工具箱,也提供示例,但最终让学生们以自己的步调探索数据库与数据分析的广阔天地。


当课程结束时,我设计了一次总结性的实践活动,让学生选择一个他们感兴趣的现实数据集(可以是公共交通数据、学校选课数据、甚至是网络上获取的开源数据集),完成从数据获取、清洗、分析到可视化展示的全流程。这个项目式的作业不仅能考验他们的综合能力,更能检验我在教学中导入大数据思维的成效。最终,许多学生都交出了颇具创意与见解的作品。这些成果让我意识到,将大数据能力注入课程,不仅仅是提升学生的技能,更是激发他们将数据分析作为解决现实问题的利器,从而培养他们面向未来的信息素养和创新思维。


通过这段助教经历,我收获的不仅是教师技能的提升,更是对大数据时代教学创新的深刻认识。在这一过程中,大数据能力提升项目为我提供了坚实的技术与思维根基,使我能够从原本机械工程的学科背景跳脱出来,综合运用数据分析工具与理念,为其他专业领域的学生搭建一座通往数据世界的桥梁。对我而言,这是一项既有创新性又具有先进意义的成果——我不只是在实验室中应用大数据技术,也成功将其带入教学实践,启发更多的学生认识与运用数据力量。这种跨领域的知识转化与创新正是大数据时代赋予我的机遇和挑战,我很荣幸能够在此次助教经历中,将所学所思真正落实于教学场景,为培养更多具备数据思维的人才贡献一份力量。


编辑:文婧

校对:丁玺茗





关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU