专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
大数据文摘  ·  机器人的“ChatGPT时刻”来临?英伟达带 ... ·  3 天前  
人工智能与大数据技术  ·  网传江西教育厅高考查分网站删库跑路;Kimi ... ·  2 天前  
不跪的世界  ·  一大波数据来袭 ·  2 天前  
51好读  ›  专栏  ›  数据派THU

王露莹:解锁数据价值,走向创新之路 | 提升之路系列(二)

数据派THU  · 公众号  · 大数据  · 2025-01-16 17:00

正文


导读


为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。


王露莹生活照

博士生涯伊始,面对传统建筑研究创新空间日渐饱和的现状,我在选择研究课题和确定学术方向时曾深感困惑。幸运的是,入学时就了解到“大数据能力提升项目”,第一时间报名了项目并选课学习。在该项目的系统化学习与实践过程中,我逐步掌握了Python编程、数据分析和人工智能算法模型等技术,逐渐认识到了大数据和人工智能方法在推动学术创新中的巨大潜力。现在,大数据方法不仅是我科研的重要工具,也在项目推进和其他工作中得到广泛应用。

一、数据赋能成长路

在课程学习过程中,我充分利用每个课程大作业的机会锻炼和拓展自己的学习成果。例如,在大数据分析的课程项目中,我完成了“基于图网络的关联建筑项目案例推荐”的研究,利用大量建筑项目信息的数据库,构建项目信息之间的图网络(图1),应用图特征及相关算法作为关联建筑项目的检索依据,成功实现无直接匹配关键词情况下的建筑项目案例推荐,为建筑案例检索和推荐系统提供了新思路。

图1项目信息图网络可视化

此外,在大数据与城市规划课程中,我完成了“故宫对北京五环内常住人口吸引力变化”的专题研究(图2)。为了提升自己的代码能力,我在课程要求的软件和工具基础上,使用Python编程完成了微博数据爬取以及数据分析与可视化,基于收集到的多源数据,揭示了文化空间对城市吸引力与人口分布变迁的作用,为城市空间规划和文化资源优化提供了科学依据。

图2专题研究成果

同时,在数智安全与标准化课程中,我参与了涉疫数据应用安全方案的研究,和来自不同学院的小组同学们共同探讨了数据隐私保护与开放共享的平衡问题,构建了适用于涉疫数据应用的安全保障框架。这一课程很好地帮助我们认识到了大数据是把双刃剑,我们在利用这些方法完成研究的同时,也应该时刻具有数据安全和隐私保护的意识。

这一系列课程研究与实践显著提升了我的编程能力、数据分析能力以及对社会问题的学术化剖析能力。大数据研究赋予我解锁数据价值的技术手段,这不仅扩展了传统建筑研究的学术边界,也开启了我对大数据与建筑行业融合创新的思考。

二、数据驱动科研探索

科研方面,得益于“大数据能力提升项目”的学习,我参与了多个国家重点重大计划、国自然面上项目及横向合作的研究课题,在项目中充分实践了大数据分析和人工智能相关方法。在“故宫观众游览行为与环境感知调查”项目中,通过大数据分析与人工智能技术,探讨观众在故宫游览过程中的行为模式与环境感知,为故宫优化游览路线与环境设施改造提供了理论支持和科学依据。作为项目核心成员,我深入参与了GPS轨迹数据的收集与分析工作,并运用机器学习算法对游客轨迹行为大数据进行处理和建模,揭示了游客在不同环境场景下的时空行为特征(图3)。研究成果形成了多篇论文,其中3篇文章已发表(A类国际会议+AIR首刊邀稿+A&HCI一区),1篇初稿修改待投[4](目标期刊:SSCI一区)。


图3故宫观众游览轨迹聚类结果可视化

在“基于图机器学习的建筑策划辅助决策方法”项目中,我们构建了1293个商业建筑的多源数据库,包括7993张商场平面图与多维度评价数据等信息。研究旨在利用大数据分析和图机器学习算法,突破传统建筑策划中小样本分析的局限,从海量商场案例中提炼出普适性规律,探索商场空间布局与功能配置的相关设计规律。

这两项研究也为我博士论文研究提供了方向:探索建筑体系中大数据与图机器学习结合的应用。我的博士论文题目拟定为《基于图论的大型商业建筑智能策划方法》,聚焦图论在大型商业建筑中的应用,优化策划流程,提高效益与可行性。

三、数据引领创业突破

除了学习和科研,我还在积极探索科技成果转化方面的创新创业,希望将建筑与大数据及人工智能交叉方向的研究成果转化为实际应用,推动研究室多个技术成果在多个行业的落地与市场化。目前,我们的团队与北京清华长庚医院紧密合作,正在开发基于人体三维姿态识别技术的老年人健康风险监测系统(图4)。我们期望通过这一技术,改善老年人的生活质量,帮助更多的老年人实现更安全、健康的老龄化生活。

图4医院测试现场

我在该项目中承担了核心角色,负责团队管理和项目推进。为了更好地推动科技成果转化,我还参加了清华五道口金融学院的技术转移项目(图5),从相关课程学习实践和初创企业参访过程中,也让我有机会从市场和金融的角度,重新看待大数据和人工智能技术对传统行业的改变与价值提升,也更加期待用我们的技术助力智慧养老技术体系的建设。

图5课程学习与企业参访实践

四、数据萌发科技艺术的新生

个人成长方面,我也尝试将人工智能技术与艺术创作相结合,参加了清华大学的音乐梦想计划,推动了个人音乐梦想的实现。在这一年里,我创作了多首原创作品,并利用AI技术优化了混音和制作效果。在这个过程中,我深刻感受到科技与艺术融合的独特魅力,尤其是在技术助力下,音乐创作的无限可能性和创新空间。

未来展望

未来我希望进一步深化人工智能与大数据技术的学习,推动技术在科研、艺术与社会服务中的多领域应用,为实际问题提供创新解决方案,创造更大价值。

编辑:于腾凯
校对:丁茗玺



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU