专栏名称: 中国交通信息化
《中国交通信息化》杂志编读互动及交通信息化资讯与学术传播平台。《中国交通信息化》杂志是由中国科学技术协会主管、交通运输部指导、中国公路学会主办,面向全国交通信息化领域的学术期刊。
目录
相关文章推荐
瓦砾村夫  ·  特斯拉Robotaxi的三个专利:自动充电、 ... ·  2 天前  
龙船风电网  ·  5000T海上风电船!完成试航 ·  5 天前  
龙船风电网  ·  5000T海上风电船!完成试航 ·  5 天前  
51好读  ›  专栏  ›  中国交通信息化

高速公路稽核数据分析系统构建

中国交通信息化  · 公众号  · 科技创业 科技自媒体  · 2024-09-23 10:21

正文


论   文

作者:李晓晨四川智能交通系统管理有限责任公司

摘要:目前,高速公路稽核工作在提高数据分析结果精准度、提升数据分析覆盖面和增强稽核业务智能化方面需持续优化和进步。本文对数据分析在高速公路稽核中的应用进行了探讨,介绍了融合多源数据搭建的大数据逃费漏费分析模型,并对多种类型的偷逃嫌疑数据进行了分析,以期为严厉打击偷逃通行费行为提供有力数据支撑。


省界收费站撤销之后,在高速公路原有入、出口收费数据的基础上,增长了10倍以上的门架计费流水和门架牌识流水[1]。数据量激增和通行里程变长引发了层出不穷的新的逃费方式,使稽核难度大大增加[2]。随着撤站后路网复杂度的提高、逃费行为的多变,针对某一个逃费行为的逃费嫌疑算法受到的干扰项也越来越多,数据分析复杂度加大。因此,应不断优化数据分析算法,提升数据分析准确度。


1 系统架构


稽核数据分析系统从省收费数据管理系统、入口治超平台、发行系统、费率管理系统、在线计费系统、拆分结算系统、日志平台、图像代理系统及部中心系统获取稽核分析相关数据,对数据进行分析处理,建立路网模型、路径还原算法及完整的车型信息库,对内部收费规范整改工单和车辆逃费行为工单进行分析,同时与现有的稽核业务系统进行数据交互,实现稽核工单流转和稽核体系运行。系统架构如图1所示。


图1 稽核数据分析系统架构


2 数据源和数据预处理


2.1 数据源



2.1.1  车道流水数据


1)入口车道流水数据:车辆驶入高速公路入口ETC车道,对OBU标签写入入口信息,生成入口ETC车道流水;车辆驶入入口MTC车道,人工录入车牌、车型、车情信息后生成入口MTC车道流水。


2)出口交易流水数据:当车辆完成当次通行驶出收费站时,出口车道对CPC卡或OBU标签进行读取,获取车辆的入口信息、车牌、车型、累计计费金额等信息,生成扣款交易流水数据,主要包括入出口时间、入出口收费站、车牌号、车型、车种、收费金额、轴数、出口重量等。


2.1.2  ETC门架交易流水数据


ETC门架交易流水数据是车辆经过门架时,ETC门架系统对OBU标签、ETC卡和CPC卡进行计费所产生的记录数据,主要包括车辆通行标识ID、计费交易时间、车型、车种、计费里程、交易金额等。


2.1.3  牌识数据


1)门架牌识数据:车辆经过门架时,门架上的摄像机实时抓拍车辆图片,识别生成的流水数据,主要包括门架编号、抓拍时间、识别车牌号、识别车型等。


2)车道牌识数据:车道抓拍后形成的牌识流水数据。


2.1.4  拆分数据


根据门架通行汇总记录和出口交易流水中的收费单元组合信息进行拆分,主要包括通行标识ID、车牌、拆分时间、拆分路段、拆分金额、车型、车种、交易金额等。


2.1.5  治超数据


治超数据为车辆进入治超车道,通过不停车称重设备识别产生的车辆数据,主要包括车牌、车货总重、车辆限重、车辆超限率、轴数、车宽、车高、车长等。


2.2 数据预处理和清洗



1)数据预处理:从文件中提取原始流水,按稽核业务要求映射字段到流水表;流水表按月分表,按日分区存储处理;根据门架交易流水提取省界入口和省界出口流水,实现省内行程闭合。


2)数据清洗:去除入口和省界入口交易失败流水、重复流水、无效流水;去除出口和省界出口交易失败流水、重复流水、无效流水;根据出口流水查询关联入、出口流水,校正出口流水对应的入口信息;根据轴数、车种信息修正流水交易车型;根据不同模型要求清洗不符合规则的车牌流水。


3 构建车辆信息库


通过采集车道出口流水数据、门架数据、治超数据、发行数据、交警数据和稽核工单确认返回数据等多源数据,构建包含车型、车种、轴数等基础信息的车辆统计数据。将流水中的车型、车种、轴数等信息与车辆信息库进行对比分析,不断学习和修订权重配置,构建车辆信息库,同时根据车型识别数据结构化产生的车辆车身颜色、品牌、集装箱等特征数据补充车辆信息库。每月初更新一次车辆信息,统计各类数据的情况,判断车辆的车种、车型、轴数信息。


4 搭建大数据逃费漏费嫌疑分析模型


逃费嫌疑分析模型主要有以下几种。


1)改变车型。改变车型逃费指车主采取不正当手段,通过篡改车辆信息或伪装车辆类型来享受较低的通行费标准,表现为ETC卡及OBU设备中写入的车型与实际车型不符,主要包括大车小标、货车客标分析、货车丢轴、车型不符等。


2)改变路径。改变路径逃费指使用干扰收费设施,导致入出口收费站、计费门架数据丢失,路径缺失严重,主要包括同车牌到卡、屏蔽介质、非法掉头、网内循环行驶、甩挂换挂等。


3)无出口。无出口逃费指车辆通过ETC或其他方式进入高速公路,但在出口处未正常缴费或未通过收费站检测,从而逃避缴纳通行费,主要包括“有入无出”“无入无出”“假冒节假日”。“有入无出”指当次通行未进行正常收费或没有产生出口流水,“无入无出”指车辆没有产生入口流水和出口流水,但是有门架交易或门架牌识流水,存在高速循环行驶、倒挂、换挂等逃费嫌疑。


4)改变车种。变车种逃费即车主采取不正当手段将应缴通行费车辆冒充成绿通车、集装箱、免费车,逃缴通行费。


其中,“有入无出”指车辆进入高速公路网行驶后未进行正常收费且没有产生出口流水的异常交易行为,主要由闯关/跟(蹭)车/拖车、多通行介质通行、屏蔽损坏或丢弃通行介质、私开道口、收费员误放、车道交易失败等情况导致。可根据入口站流水和省界门架入口流水,对车牌号、CPC卡号或通行标识ID进行分析,筛选出没有出口站流水或者省界出口且最后途经门架在省内的数据,定位到当次通行的入口流水,主要算法逻辑如下:


1)获取某时间段的省界门架入口和收费站入口流水,过滤掉重复的入口流水,过滤掉交易失败和不合规则的流水;


2)根据省界门架入口和收费站入口流水的通行标识ID,关联收费站出口和省界出口流水,剔除关联的相关流水记录;


3)根据省界门架入口和收费站入口流水的车牌和时间,关联出口流水,剔除关联的出口流水记录;


4)根据剩余入口流水中的通行标识ID,关联入口时间10天内的拆分数据,剔除关联的拆分流水记录;


5)剔除剩余的入口流水中通行标识ID重复、前后10min内同一收费站且同一车牌重复的流水;


6)根据该时间段出口收费站流水中的车牌、入口收费站和入口时间(前后30min),关联入口流水,剔除关联的入口流水记录;


7)根据剩余入口流水中的车牌、收费站和时间(前后1min),关联出口收费站流水,剔除关联的出口流水和入口流水记录,排除旁道干扰;


8)剔除纸券流水,剔除川A、川G统缴类流水;


9)根据剩余入口流水中的车牌和时间查询往后5天内最近一条交易,包括省界入口、收费站入口、收费站出口和省界出口流水,防止入出口数据之间夹杂另外一次通行记录;


10)根据剩余入口流水中的通行标识ID,查询最后的门架交易记录,时间范围为入口时间到最近一次交易时间,剔除特情为反向干扰交易的流水,将其记录为最后通行门架;


11)根据剩余入口流水中的车牌和时间范围(入口时间到最近一次交易时间),查询最后的门架牌识记录,将其记录为最后通行门架;


12)以上流程完成后,生成稽核嫌疑逃费数据;


13)根据最后通行门架或通行门架所在最多的路段,派发相应嫌疑逃费数据至对应路段。


2023年四川省高速公路路网开展“有入无出”稽核专项行动,按照嫌疑车辆的主要逃费嫌疑路段进行派发逃费嫌疑数据。第一种是按照最后途经门架所属路公司的逃费次数将数据分配给相应路段处理,例如,车辆有入无出100次,但消失的最后门架为A路段,则A路段作为该车辆追缴工单的负责路段。第二种是考虑选取通行门架所在最多的路段,例如,在车辆经过A路段门架10次、B路段门架7次、C路段门架3次,则派发给A路段。


由逃费嫌疑车辆的主要消失路段或通行门架所在最多的路段作为牵头单位,负责该车辆逃费证据的搜集,锁定逃费证据链,并创建稽核工单予以追缴。下表统计了某月四川省高速公路路网“有入无出”逃费嫌疑数据共36316条,分析发现车型为客二、客三、客四、货三、货四的车辆在“有入无出”中占比较大。



5 异常特征数据分析


某些逃费车辆的通行数据存在异常特征,如倒卡换卡逃费车辆可能存在出口车型不一致、一车多介质、无卡坏卡或超时行驶等数据异常特征。可选择一个或多个异常特征进行组合,通过填写时间范围、通行总次数、异常次数范围、异常比例等筛选条件,筛选出特定的异常数据,如图2所示。进一步分析异常数据,结合相关图片和视频判断该车辆是否存在逃费行为。


图2 异常特征数据筛选


常见异常特征数据分析介绍如下。


1)对向门架交易(U/J通行)。车辆通过服务区便道或施工道口非法掉头[3],因路径不可达或路径不完整,出口使用最小费额计费,实现少缴通行费。可对车辆过车记录进行整理,筛选出一次通行过程中同一门架存在不同方向记录的车辆,可通过路网模型进行路径还原,对路径不可达异常进行分析。


2)同一门架多次交易(循环行驶)。车辆通过精心规划行驶路线,短时间内多次通过同一门架,利用时间差和距离差实现少缴通行费。可对车辆过车记录进行整理,筛选出一次通行过程中同一门架存在多次交易记录的车辆,可通过路网模型进行路径还原,对路径不可达异常进行分析。


3)入出口车型不一致(甩挂换挂)。车辆通过使用更小车型出站或换挂,实现少缴通行费。系统通过对比同一次通行入、出口流水或门架流水中车型不一致的情况,进行逃费特征分析。


4)入出口重量不一致(甩挂换挂倒货)。车辆通过倒货实现少缴通行费。系统通过分析并筛选车辆入出口车重量不一致的流水,进行逃费特征分析。


5)车型与重量不一致(假冒入口治超)。货车列车车辆进入高速时,使用套牌的小车在入口治超通道称重,并将称重信息提供给超载车辆使用,小车则通过ETC车道进入高速或离开,实现少缴通行费。系统通过车牌识别等技术,将识别车牌信息与车辆登记信息进行比对,筛选出识别车牌与实际车牌不一致的流水,进行逃费特征分析。


6)有门架交易无牌识(移动标签分析)。车主存在多个ETC标签,车辆使用车型更小的ETC卡行驶出站,实现少缴通行费;车辆获取离出口站最近入口的ETC标签出站,跑长买短,实现少缴通行费,如大车使用小车标签、货车使用客车标签、收费车辆使用免费或优惠车标签、长途车使用就近站标签。系统通过车、卡一致性校验,筛选出介质车牌与实际车牌不一致的流水,进行逃费特征分析。


6 结束语


本文提出的稽核数据分析系统已于2023年10月在四川省高速公路各运营管理单位推广试用,实现了“有入无出”“屏蔽通行卡”等多种逃费嫌疑模型的自动筛查。将筛查出的嫌疑数据推送给路段公司进行稽核数据分析,再结合图片、视频构建完整证据链,不仅大幅减少了稽查人员的工作量,还极大提高了稽核效率,有效维护了高速公路的运营秩序。


参考文献

[1] 梁丽娟,袁红叶.基于门架数据的高速公路稽核平台[J].中国交通信息化,2022(10):101-105.

[2] 王虹.从人工到大数据+AI“一张网”稽核加速中[J].中国交通信息化,2020(11):19-22.

[3] 李超.新收费模式下的数据稽核分析系统设计[J].中国交通信息化,2023(12):83-85.

[4] 谢鹏远.高速公路AI稽核系统建设及数据分析[J].中国交通信息化,2022(7):95-103.

[5] 罗小建,周刚.“后撤站时代”的高速公路稽核分析模型[J].中国交通信息化,2022(S1):218-223.

[6] 徐东彬,张孝铭.基于流处理技术融合多种特征的套牌车辆稽核技术[J].湖南交通科技,2021(12):148-151.


原文刊载于2024年第8期《中国交通信息化》

责任编辑 | 崔雪薇

整理排版 | 申   妍


END