专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
艺恩数据  ·  艺恩祝大家中秋节快乐,花好月圆人团圆 ·  2 天前  
艺恩数据  ·  长视频x短剧:“长短联姻”下的新机遇 ·  4 天前  
大数据分析和人工智能  ·  裁员严重,大家做好准备吧! ·  6 天前  
大数据与机器学习文摘  ·  PyTorch官宣:告别CUDA ! ·  1 周前  
软件定义世界(SDX)  ·  新质生产力研究报告(2024年)——从数字经 ... ·  1 周前  
51好读  ›  专栏  ›  数据派THU

2024大数据挑战赛全国六强团队获奖经验+ppt分享(二)

数据派THU  · 公众号  · 大数据  · 2024-09-14 17:00

正文





团队名称

会萤的

团队成员

周文骞(上海第二工业大学)

陈   凯(上海第二工业大学)

潘瑞珺(上海第二工业大学)

团队名次

全国第五名


赛题描述说明介绍


报名 | 2024中国高校计算机大赛——大数据挑战赛报名启动!


关注微信公众号“数据派THU”,后台回复“20240615”,即可获取“赛题描述”




参赛分享与收获





1. 数据处理与特征工程


针对原始数据的处理至关重要。通过对站点周围的气象数据进行特征提取,包括矢量风速的合成、差分和时间序列的引入,有效提升了模型捕捉局部气象特征的能力。增加了特征维度中的均值和方差等统计量,增强了模型对数据模式的泛化能力。这使得模型在面对复杂的时间序列时表现更加稳定。


2. 模型设计与优化


使用 iTransformer,并对其进行改进,去除decoder部分,替换为RNN系列模型,强化了模型对局部时序信息的捕捉能力。在长短期时间序列的处理上,该结构能有效平衡复杂性和预测性能。LSTM被引入作为decoder,通过逐步解码时间序列,提升了模型在面对复杂变化时的适应能力,减少了预测的波动性。该方法证明了在应对长时间预测中的有效性。


3. 模型集成


比赛中,模型在长期预测时表现不如短期预测准确。为此,通过将短期(24小时)的预测结果复制并加权平均,融合为72小时的预测结果。这样做有效减少了长期预测的不稳定性,提高了长时间跨度内的准确性。


4. 总结


这次参赛经历充满了挑战与收获。面对庞大的气象数据和复杂的任务目标,团队深刻意识到数据预处理和分析在整个过程中的关键作用。尽管过程中遇到了许多难题,但通过不断的实验和调整,逐步掌握了如何更好地处理时间序列数据,并探索出了一些提升预测精度的有效策略。在模型设计和优化的过程中,团队始终保持开放的心态,不断尝试新思路,结合讨论和反馈,逐渐优化了模型的整体性能。同时,随着项目的推进,我们意识到在面对复杂问题时,团队合作和跨领域的交流尤为重要,每个人的不同视角都为问题的解决提供了新的可能。整个参赛过程不仅提升了我们在大数据和深度学习方面的能力,也帮助我们更加系统地思考问题。通过与其他团队的交流,我们开阔了视野,学到了很多有价值的经验,这为未来类似的项目奠定了坚实的基础。





决赛答辩ppt分享




编辑:文婧
校对:林亦霖



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。


新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU