为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
两年前,我成为了土木工程系博士研究生。而目前,土木工程专业正面临着前所未有的巨大变革,传统土木领域需求不断降低,土木领域的存量—增量矛盾正日益凸显。在这一潮流下,恰逢“大数据能力提升项目”开始实施,因此我在入学之初便报名了项目,非常感谢项目提供了一个系统性、体系化的大数据及人工智能学习机会,提升了我的大数据思维,并进一步锻炼了使用大数据方法解决实际问题的能力。
1、学习&实践
大数据项目带给我最为明显的提升当属学习科研,由于我此前的基础比较薄弱,对计算机领域知识知之甚少,因此在最初接触时屡屡碰壁。在《数智安全与标准化》课程上,金涛老师深入关心每个同学的项目学习情况,也正是老师和课题组师兄的鼓励,让我坚持下来,并完成了项目课程。《大数据系统基础(A)》是我第一次接触到真实的大数据项目,当时我们小组都是土木系同学,大家认真学习MQTT、Kafka、Flink等相关知识,最终完成了交通领域的大数据项目。后续在《深度学习》课程上,除了GAN、GNN、扩散模型等基本的深度学习算法之外,老师还进一步介绍了最新的生成式算法及大语言模型,这些技术在我之后的科研工作中都得到了应用。《大数据实践课》则给了我第一次项目实习经历,让我深入了解了企业科研与学校科研的不同,并且所做的研究也与我本身的科研产生了紧密的联系,最终也获得了大数据实践优秀团队奖。客观而言,大数据项目所学的内容,极大拓宽了我的科研方向,也提升了我在交叉领域的科研能力。
2、科研
自《深度学习》课程后,我便一直思考做一些土木工程智能化相关工作。在与导师交流后,我的第一个项目是智能计算工作,即利用深度学习方法加速土木工程领域的滞回模拟,或者更准确的说,是复杂滞回模型的标定工作。有了在大数据项目中积累的点点经验,以及在《深度学习》课程中所学的时序模型知识,我的科研起步非常顺利,只用了几个月就完成了这第一项工作,虽然并没有尽善尽美,但也发表在了土木工程与计算机交叉期刊上(SCI),并且项目成果还应用于《大数据实践》课程,有很强的泛用性。尝到甜头后,在与导师进一步讨论后,决定完成剪力墙智能设计工作,即利用目前较火的生成式模型进行剪力墙布置,减少结构工程师的工作量。我选择了当时较火的扩散模型完成这一任务,最终工作顺利发表在土木领域影响因子Top2的SCI期刊CACAIE上。并且还在世界地震工程大会(四年一届,WCEE2024)做报告。这些文章都在课题组公众号上进行了宣传,并且获得了上千的浏览量,业界的同仁对这些工作也深感兴趣。
3、创业
在科研方面取得不错的进展后,我看到大语言模型关注度不断上升。在这一背景下,适逢清华大学举办“清醒杯”大模型应用设计挑战赛,我第一时间报名并参与了这一比赛,想到利用大语言模型的语言解析能力,让用户可以通过聊天界面交互来创建和修改图纸,包括设置尺寸、形状等等,还可以使用AI技术来自动化设计过程,如自动生成机械图纸、建筑结构图纸等。减少人工输入和绘图的时间,提高CAD设计的效率和准确性,从而减少设计成本和提高生产力。最终项目获得了比赛团队优胜奖(12/92),并且目前也合入合木智构科技有限公司。
4、开源项目
在这里我还想说一说题外话,《大数据系统基础(A)》中,IoTDB的维护者曾给我们上了一节IoTDB相关教程课,其中他对开源社区的介绍,深深地影响了我。我后续在GitHub上参与了多个开源项目,也收到了很多开源项目作者的感谢。我这里也非常感谢大数据能力提升项目,宣传了开源精神,也让我感受到开源的魅力并为社区提交相关代码。
总结而言,大数据能力提升计划极大拓宽了我的科研方向,进一步提升了我的科研能力,给我带来了更多的可能性,在此感谢大数据能力提升计划的支持!
数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。
新浪微博:@数据派THU
微信视频号:数据派THU
今日头条:数据派THU