在此前的技术周刊
《SAUSG2025版新功能——RC柱构件智能纵向配筋》
中
(点击查看)
,曾介绍了RC柱纵向智能配筋功能的操作流程,并通过实际案例证明了其在配筋设计中的价值。本文重点从试验数据收集、特征工程、模型训练以及模型解释等几个方面介绍了基于机器学习的RC柱构件智能纵向配筋模型的建模过程。
试验数据来源于两部分:1)来源于ACI(American Concrete Institute)数据库,共498个样本;2)广泛收集我国钢筋混凝土矩形截面柱力学性能研究试验数据,共224个样本。
在数据收集及整理形成数据库过程中面临数据缺失问题,现就缺失数据的填充进行说明:1)部分试验没有给出试件的保护层厚度,这部分试件的保护层厚度,根据试验数据库中出现频次最高的保护层厚度值来确定,取为25mm;2)部分试验没有给出箍筋的屈服强度,仅给出了牌号与直径,这部分试件的箍筋屈服强度按试验数据库中同牌号、同直径的箍筋屈服强度确定。
为确保数据库中数据的一致性和适用性,对ACI数据库中的数据进行了筛选,去掉不符合预定结构形式以及受力机理要求的样本,例如:1)去掉纤维增强聚合物(Fiber Reinforced Polymer,下简称FRP)加固样本;2)模型仅对矩形截面RC柱做讨论,去掉数据库中圆形截面样本。经过筛选后,保留ACI数据库试验样本306个以及我国力学性能研究试验样本224个,数据库试验样本总数为530个,涵盖了轴压、压弯与纯弯三种受力模式。
特征参数分布直方图如图1所示。可见数据库覆盖的参数范围较广,涵盖了普通强度和高强度混凝土构件试验数据,确保了机器学习模型在实际工程中的适用性。
模型采用特征选择的包装器方法(Wrapper)进行特征迭代,特征迭代包括如下4个步骤:1)选择特征的子集;2)用选择的特征训练模型;3)评估模型性能;4)决定保留还是移除所选特征。其中每一个特征子集作为输入特征时都会进行一轮超参数调优,选取的四种有代表性的特征子集如下:
以上述四个特征子集分别作为输入特征时, XGBoost模型在测试集上的拟合优度如表1所示。
由表1可知,机器学习模型分别以四种特征子集作为输入特征时,特征子集1、2、3的拟合优度差异不大,特征子集4的拟合优度略低。可进一步从模型泛化性能以及模型复杂程度角度对特征子集进行评价。模型在不同测试集下的拟合优度如图2所示。
由图2可知,测试了模型在80个不同测试集下的表现情况,用拟合优度来衡量模型性能。图中横轴为测试集划分方法,代表不同的测试集,纵轴为模型的拟合优度。可以看出,特征子集1、2、3的性能与稳定性差异不大,特征子集4的性能与稳定性明显差于其他三个子集。通常情况下,随着模型输入特征增加,模型参数空间的维度增加,计算资源消耗呈现上升趋势,进而引发计算复杂性、计算量、内存需求、训练时间以及过拟合风险上升。符合奥卡姆剃刀原则的做法是选择最简单的假设,即特征选择和模型设计应尽量简洁,以维持合理计算成本的同时提高模型的泛化性能。综上所述,选择特征子集3作为模型输入。
数据库被随机分成训练集(80%,424个样本)和测试集(20%,106个样本)。训练集用于训练机器学习模型,测试集用于评估训练好的机器学习模型的性能。选取
共7个特征作为输入参数,输出参数为纵向配筋率。在训练集上训练4个机器学习模型,包括DT、SVR、RF和XGBoost。为达到最优的模型性能,进行了超参数调优。超参数调优通过随机搜索方法实现,每次进行超参数调优时,都伴随着十折交叉验证。采用拟合优度
、平均绝对误差MAE(Mean Absolute Error)、平均绝对百分比误差MAPE(Mean Absolute Percentage Error)、均方根误差RMSE(Root Mean Square Error)四个指标进行评价,以定量比较不同模型预测性能。
DT、SVR、RF和XGBoost四种模型预测值与试验值对比结果如图3所示,横轴为实际纵向配筋率,纵轴为模型预测纵向配筋率,数据点分布在45度角的直线附近,模型的预测值与试验值较为一致。