专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
软件定义世界(SDX)  ·  2024全球人工智能简史 ·  昨天  
大数据分析和人工智能  ·  26岁OpenAI举报人疑自杀!死前揭Cha ... ·  2 天前  
人工智能与大数据技术  ·  “警告:依赖 AI ... ·  昨天  
大数据文摘  ·  GitHub ... ·  2 天前  
艺恩数据  ·  2024喜剧综艺年度报告 ·  6 天前  
51好读  ›  专栏  ›  数据派THU

大数据能力提升项目|学生成果展系列之二

数据派THU  · 公众号  · 大数据  · 2025-01-04 17:00

正文


导读


为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。



回首2024年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的8位同学代表一起领略他们的风采吧!




代表性成果




大数据方向代表性成果——
《故宫观众游览行为与环境感知调查》研究工作


建筑学院 王露莹


本人以核心成员身份完整参与“故宫观众游览行为与环境感知调查”项目,并形成一系列大数据环境行为分析研究成果,具体包括:项目报告《基于 GPS 轨迹数据的故宫观众游览行为特征与垃圾箱设置策略研究》,以及 3 篇学术文章分别发表 A 类国际会议、AIR 首刊邀稿、A&HCI 一区期刊(Frontiers of Architectural Research)

本项目利用疫情期间限制流量与开放区域的机会,分多个阶段进行了现场数据采集工作,最大限度减少了外部因素对真实环境下游客行为的影响。获取了大量故宫观众的高精度 GPS 轨迹数据,通过大数据方法中的轨迹可视化、数据统计分析、机器学习等,挖掘了故宫观众在游览过程中的时空分布特征与停留行为特征,同时构建了建筑环境中轨迹挖掘的方法框架。在研究的第一阶段,我于 2022 年把初步研究结果在《CEB-ASC 环境行为研究学会国际会议(原 EBRA 国际会议)》上进行了宣讲,以第一作者发表了题为“基于 GPS 轨迹数据的故宫观众游览与停留行为特征初探”的会议论文。在建筑环境行为研究领域采用的大数据分析方法和创新性成果,引发了出色反响。

随着项目推进,依托轨迹数据对时空行为规律研究的不断探索,我在研究中总结并提出了适用于建成环境研究的轨迹分析方法框架。与此同时,导师接到《Architectural Intelligence》新刊首刊约稿,把相关成果整理成学术文章,以第二作者(导师一作)发表了题为“Towards big data behavioral analysis: rethinking GPS trajectory mining approaches from geographic, semantic, and quantitative perspectives ”的综述性方法验证论文。本篇文章综述了面向人群空间使用行为特征分析的轨迹挖掘方法,理清了交通规划、旅游学、生物基因等领域常用的轨迹/序列挖掘方法在建筑学中的适用场景、应用方式及使用效果,完善了从轨迹挖掘结果指向建筑与场所空间中人群行为特征的逻辑链条,为建筑学科大数据行为研究建立了一套适用的轨迹分析方法框架。截至目前期刊官网被引次数 3、阅读量 3370+。文章同步在期刊公众号《Architectural Intelligence》上线宣传,发 布了题为“ARI 研究文章 | 面向大数据行为分析:地理图形、语义信息和量化指标视角下的 GPS 轨迹挖掘方法再思考”的公众号文章,截至目前阅读量 1000+。

在整个项目中,我使用 Python 算法程序完成了主要数据处理和分析工作,完成了项目结题,并且在此过程中对大数据分析的理解更加深入,意识到大数据分析离不开亲自的观察与实践,才能形成对数据的深刻理解,在统计描述的基础上发掘更加普遍的规律。

因此,在项目结束后,我又深化了研究的分析工作,在 GPS 轨迹大数据中发现了更具有普遍意义的一致性游客行为规律,并以第一作者在建筑研究领域的重要期刊《Frontiers of Architectural Research》(A&HCI 一区前 1%,影响因子 3.5)发表了大数据行为研究论文 “ Visitors'  consistent  stay  behavior patterns within  free-roaming  scenic architectural  complexes:  Considering   impacts  of  temporal,  spatial,  and environmental factors ”。并在研究所众号《黄蔚欣研究室》发布了题为“A 论文 | 自由 漫步式观览建筑群中的游客停留行为模式:考虑时间、空间和环境的影响”的公众号文章,截至目前转发量近 350,阅读量近 3000。

该论文通过分析故宫博物院游客的 GPS 轨迹数据,探讨了自由漫步式观览空间内游客游览过程中的停留行为模式。利用疫情期间短暂开放的机会,最大限度减少了外部因素对真实环境下游客行为的影响,揭示了不局限于特定地点、可推广到类似情境、更本质和具有普遍性的行为规律,并为自由漫步式建筑空间设计和环境设施配置提供了重要的启示和全新的视角。论文中的研究结果为提升各种文化和建筑环境下历史景区的设计和管理提供了有价值的见解。例如,在游览的后期阶段,游客倾向于休息更长时间这一心理时间分配的固定模式,可能对于设计满足游客体力需求的休息空间具有普遍意义。深入了解游客选择特定休息区的一致偏好,可以帮助建筑师设计出既灵活又多功能的空间。


编辑:文婧

校对:林亦霖





关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU