高速公路AI稽核系統(tǒng)建設(shè)及數(shù)據(jù)分析
作者:謝鵬遠(yuǎn)(山西交通控股集團(tuán)有限公司)
摘要:隨著省界收費(fèi)站全部取消,全國(guó)實(shí)現(xiàn)了“收費(fèi)一張網(wǎng)”,極大地提升了高速公路路網(wǎng)通行效率,然而在經(jīng)濟(jì)利益的驅(qū)使下,偷逃通行費(fèi)行為層出不窮并呈現(xiàn)出多樣化、隱蔽化特點(diǎn)。傳統(tǒng)稽核方法存在依賴人工、遏制難度大、運(yùn)營(yíng)服務(wù)能力不足等問(wèn)題,無(wú)法滿足新收費(fèi)模式下的稽核需求。本文基于大數(shù)據(jù)、邊緣計(jì)算、AI算法等技術(shù),對(duì)AI稽核系統(tǒng)平臺(tái)建設(shè)進(jìn)行了探討,提出了多流水融合路徑還原、邊緣計(jì)算實(shí)時(shí)稽查、多維AI稽核引擎等方法,并建立了多種偷逃費(fèi)稽核模型。結(jié)果表明,AI稽核系統(tǒng)可有效核查多種偷逃費(fèi)行為,模型準(zhǔn)確率高,能夠滿足核查需求。
截至2019年底,全國(guó)29個(gè)聯(lián)網(wǎng)收費(fèi)省份487個(gè)省界收費(fèi)站全部取消,實(shí)現(xiàn)了全國(guó)“收費(fèi)一張網(wǎng)”[1]。據(jù)統(tǒng)計(jì),全國(guó)擁有ETC客戶1.92億、門架系統(tǒng)24588套、ETC車道48211條、不停車稱重系統(tǒng)11401套,在大幅提高高速公路通行效率的同時(shí)[2],偷逃通行費(fèi)行為呈不斷增長(zhǎng)態(tài)勢(shì),偷逃通行費(fèi)金額巨大,且呈現(xiàn)出多樣化、隱蔽化、高科技化的特點(diǎn)[3],嚴(yán)重?cái)_亂了高速公路收費(fèi)工作正常秩序。為有效克服傳統(tǒng)稽核手段存在的弊端,本文基于大數(shù)據(jù)、邊緣計(jì)算、AI算法等手段的稽核方法6-7,針對(duì)山西省全過(guò)程、全時(shí)段、全區(qū)域深入挖掘偷逃漏通行費(fèi)行為,通過(guò)深度研究車輛抓拍圖像、通行流水及多維度結(jié)構(gòu)化通行軌跡等方式,真實(shí)還原通行過(guò)程車輛信息,為偷逃漏通行費(fèi)稽核提供證據(jù)鏈判定,達(dá)到維護(hù)高速公路正常收費(fèi)秩序和公平繳費(fèi)環(huán)境、有效防范和遏制偷逃漏通行費(fèi)行為、提升實(shí)時(shí)交易和稽核追繳成功率、有效降低偷逃漏通行費(fèi)比重的目的。
一、傳統(tǒng)稽核方法存在的問(wèn)題
隨著高速公路路網(wǎng)不斷擴(kuò)大,不法車輛利用各種形式偷逃通行費(fèi)且隱蔽性強(qiáng),給國(guó)家、企業(yè)造成了巨大經(jīng)濟(jì)損失。然而,傳統(tǒng)稽核手段[4-5]存在以下問(wèn)題:(1)依賴人工識(shí)別,存在稽核準(zhǔn)確性不高、效率低下、手段單一,且數(shù)據(jù)量大、分散程度高、人工篩選難等問(wèn)題,導(dǎo)致缺乏追繳證據(jù)鏈;(2)遏制難度大,換卡逃費(fèi)、大車小標(biāo)等傳統(tǒng)偷逃通行費(fèi)行為難以遏制,新型偷逃通行費(fèi)行為層出不窮;(3)運(yùn)營(yíng)服務(wù)能力急需提高,由于高速公路通行費(fèi)計(jì)費(fèi)方式不同、計(jì)費(fèi)金額差異等原因,社會(huì)負(fù)面影響大,車主用戶滿意度低,且現(xiàn)場(chǎng)稽查帶來(lái)的擁堵情況難以避免;(4)稽核信用體系缺失,行車信息與社會(huì)信用未形成關(guān)聯(lián),無(wú)法納入不良征信體系并對(duì)人車黑、灰和預(yù)警名單等信用低下車輛規(guī)范行車或駕駛行為??梢钥闯?,傳統(tǒng)稽核手段已無(wú)法滿足當(dāng)前高速公路運(yùn)營(yíng)管理需要。
二、AI稽核系統(tǒng)總體建設(shè)方案
本文重點(diǎn)分析ETC識(shí)讀率低、牌識(shí)流水與抓拍率低、假冒減免車輛、套牌、改變繳費(fèi)路徑作弊等問(wèn)題,從提高數(shù)據(jù)采集的精準(zhǔn)性、數(shù)據(jù)傳輸?shù)目煽啃?、?shù)據(jù)分析的智能性3個(gè)方面出發(fā),創(chuàng)新引入AI流量卸載、人工智能、大數(shù)據(jù)、邊云協(xié)同等技術(shù),充分利用ETC門架、收費(fèi)站等流水和圖像信息,開(kāi)展多流水融合路徑還原、邊緣計(jì)算實(shí)時(shí)稽查、多維AI稽核引擎等方法研究,實(shí)現(xiàn)智能實(shí)時(shí)稽核,解決人工投入大、時(shí)效性差等問(wèn)題,同時(shí)不斷提高稽核追繳成功率,形成稽核業(yè)務(wù)閉環(huán)“一張網(wǎng)”,總體設(shè)計(jì)思路如圖1所示。
(一)數(shù)據(jù)源
數(shù)據(jù)源是開(kāi)展收費(fèi)稽核工作的基礎(chǔ),包括通行、交易、牌識(shí)、視頻等采集數(shù)據(jù)和車輛發(fā)行、路網(wǎng)、費(fèi)率、節(jié)點(diǎn)等基礎(chǔ)數(shù)據(jù),具體如下[8]。1、車道收費(fèi)數(shù)據(jù)具體包括車道收費(fèi)交易數(shù)據(jù)和車道牌識(shí)數(shù)據(jù),其中車道收費(fèi)交易數(shù)據(jù)包括出入口站點(diǎn)、出入口時(shí)間、車牌、車型、軸重、軸數(shù)、行駛里程、收費(fèi)金額等;車道收費(fèi)牌識(shí)數(shù)據(jù)包括收費(fèi)站編號(hào)、抓拍時(shí)間、識(shí)別車牌號(hào)、識(shí)別車型、抓拍圖片等。2、門架計(jì)費(fèi)數(shù)據(jù)和牌識(shí)數(shù)據(jù)具體包括門架計(jì)費(fèi)交易數(shù)據(jù)和門架牌識(shí)數(shù)據(jù),其中,門架計(jì)費(fèi)交易數(shù)據(jù)包括入口信息、交易時(shí)間、車型、車牌、計(jì)費(fèi)里程、計(jì)費(fèi)金額等;門架牌識(shí)數(shù)據(jù)包括門架編號(hào)、抓拍時(shí)間、識(shí)別車牌號(hào)、識(shí)別車型、拍攝位置、抓拍圖片等。3、發(fā)行數(shù)據(jù)包括ETC和OBU的發(fā)行數(shù)據(jù),具體包括發(fā)行省份、發(fā)行時(shí)間、車牌、車型、顏色、圖片、軸數(shù)以及辦理人的相關(guān)信息。4、跨省拆分?jǐn)?shù)據(jù)包括車輛跨省通行的車輛通行數(shù)據(jù)和收費(fèi)數(shù)據(jù),具體包括車輛通行收費(fèi)站出入口數(shù)據(jù)、車道交易數(shù)據(jù)、門架計(jì)費(fèi)數(shù)據(jù)等信息。5、全省治超數(shù)據(jù)和治超牌識(shí)數(shù)據(jù)主要包括車輛通行數(shù)據(jù)、計(jì)重?cái)?shù)據(jù)和牌識(shí)數(shù)據(jù),具體包括車輛通行時(shí)間、車牌、車型、軸重、軸型、圖片等數(shù)據(jù)。(二) AI稽核系統(tǒng)設(shè)計(jì)思路1、AI稽核網(wǎng)絡(luò)拓?fù)銩I稽核系統(tǒng)采用了大數(shù)據(jù)集群服務(wù)器、地圖引擎服務(wù)器、應(yīng)用服務(wù)器,網(wǎng)絡(luò)拓?fù)淙鐖D2所示。其中,大數(shù)據(jù)集群服務(wù)器主要對(duì)收費(fèi)數(shù)據(jù)、發(fā)行數(shù)據(jù)、拆分?jǐn)?shù)據(jù)、治超數(shù)據(jù)、牌識(shí)數(shù)據(jù)接收、存儲(chǔ)以及對(duì)稽核模型、路徑還原等進(jìn)行計(jì)算,還能通過(guò)倒排索引對(duì)數(shù)據(jù)進(jìn)行高性能檢索;地圖引擎服務(wù)器主要實(shí)現(xiàn)地圖圖層加載、路網(wǎng)模型計(jì)算;應(yīng)用服務(wù)器主要實(shí)現(xiàn)對(duì)AI稽核系統(tǒng)的部署和接口的數(shù)據(jù)交互。
2、AI稽核系統(tǒng)架構(gòu)AI稽核系統(tǒng)基于Hadoop框架進(jìn)行開(kāi)發(fā),利用Hadoop大數(shù)據(jù)平臺(tái)的實(shí)時(shí)流計(jì)算能力完成高吞吐量、具備容錯(cuò)機(jī)制的實(shí)時(shí)流數(shù)據(jù)處理,利用HDFS、HBASE、HIVE組件完成關(guān)聯(lián)性數(shù)據(jù)存儲(chǔ),存儲(chǔ)方式為以車牌為中心,圖片、流水、車牌顏色、門架、出入口等相關(guān)屬性數(shù)據(jù)組合,數(shù)據(jù)流向如圖3所示。其中,HBASE中主要按照車牌、時(shí)間等設(shè)計(jì)主鍵來(lái)實(shí)現(xiàn)分區(qū)的均勻分布和快速檢索,并通過(guò)HBASE的觸發(fā)插件在數(shù)據(jù)插入過(guò)程中,將以車牌為中心的屬性異步發(fā)送到分布式倒排索引模塊。分布式倒排索引模塊負(fù)責(zé)按需要業(yè)務(wù)查詢的屬性進(jìn)行索引倒排處理,把數(shù)據(jù)導(dǎo)入到ES中。
同時(shí),鑒于數(shù)據(jù)存儲(chǔ)介質(zhì)、數(shù)據(jù)存儲(chǔ)類型和數(shù)據(jù)傳輸方式的差異,通過(guò)不同工具實(shí)現(xiàn)異源、異構(gòu)數(shù)據(jù)的導(dǎo)入。其中,對(duì)實(shí)時(shí)性要求較高的監(jiān)測(cè)數(shù)據(jù)以分布式消息隊(duì)列的形式由Kafka分發(fā);關(guān)系型數(shù)據(jù)庫(kù)由Sqoop等工具直接將數(shù)據(jù)導(dǎo)入HDFS;非實(shí)時(shí)性數(shù)據(jù)選擇MapReduce計(jì)算引擎,實(shí)時(shí)性要求較高的數(shù)據(jù)選擇Spark或Storm計(jì)算框架。3、AI稽核系統(tǒng)流程AI稽核系統(tǒng)流程如圖4所示,可分為4個(gè)步驟:(1)省中心數(shù)據(jù)、拆分?jǐn)?shù)據(jù)、治超數(shù)據(jù)、發(fā)行數(shù)據(jù)等接收匯聚至大數(shù)據(jù)平臺(tái),通過(guò)稽核模型數(shù)據(jù)驗(yàn)證,得到疑似偷逃費(fèi)數(shù)據(jù);(2)系統(tǒng)根據(jù)疑似偷逃費(fèi)數(shù)據(jù),自動(dòng)匹配生成稽核工單和證據(jù)鏈,并推送至省中心稽核平臺(tái)及稽核應(yīng)用;(3)省中心稽核平臺(tái)將稽核工單和證據(jù)鏈推送至收費(fèi)站,一線稽核人員確認(rèn)后提交追繳工單,工單提交至路段和省中心進(jìn)行審核;(4)省中心稽核平臺(tái)審核完畢后,生成追繳名單,并反饋校驗(yàn)結(jié)果、稽核結(jié)論等至AI稽核系統(tǒng)。
(三)路徑還原路徑還原是開(kāi)展稽核分析工作的前提,本文通過(guò)利用多流水融合路徑擬合方法,通過(guò)利用ETC門架交易數(shù)據(jù)和牌識(shí)數(shù)據(jù)、收費(fèi)站出入口交易數(shù)據(jù)和牌識(shí)數(shù)據(jù)、治超通行數(shù)據(jù)和牌識(shí)數(shù)據(jù)、費(fèi)率數(shù)據(jù)及路網(wǎng)帶權(quán)有向圖等進(jìn)行車輛通行路徑還原,對(duì)通行數(shù)據(jù)和牌識(shí)數(shù)據(jù)損失嚴(yán)重的通行車輛通過(guò)歷史通行數(shù)據(jù)進(jìn)行路徑通行概率預(yù)測(cè),實(shí)現(xiàn)路徑還原。1、GIS地圖標(biāo)注地理信息系統(tǒng)(GIS)是開(kāi)展存儲(chǔ)、管理、分析等與空間相關(guān)的信息系統(tǒng),由于收費(fèi)站、ETC門架是路徑還原的關(guān)鍵節(jié)點(diǎn),基于路網(wǎng)基礎(chǔ)信息將收費(fèi)站、ETC門架、費(fèi)率、隧道、橋梁等高速公路基礎(chǔ)設(shè)施單元及相關(guān)設(shè)備標(biāo)注到GIS地圖上,同時(shí)將每一個(gè)計(jì)費(fèi)單位在GIS進(jìn)行標(biāo)注和劃分,形成基礎(chǔ)信息圖層、門架和收費(fèi)站圖層、計(jì)費(fèi)單元圖層、帶權(quán)有向圖的節(jié)點(diǎn)圖層等。2、路徑還原模型在路徑還原之前應(yīng)先開(kāi)展路徑融合工作,即通過(guò)對(duì)交易流水(交易憑證)/通行流水、圖像流水比對(duì)分析,判斷車輛路徑節(jié)點(diǎn)證據(jù)鏈?zhǔn)欠裢暾?,具體標(biāo)記規(guī)則如表1所示。
路徑節(jié)點(diǎn)證據(jù)鏈符合要求后,即可根據(jù)車輛類型、出入收費(fèi)站、途徑ETC門架等條件,基于帶權(quán)有向圖進(jìn)行車輛路徑還原(通行路徑擬合),如圖5所示。路徑還原后對(duì)合并路徑有效性進(jìn)行判斷,對(duì)于異常路徑,系統(tǒng)自動(dòng)剔除。
(四)稽核模型建立與準(zhǔn)確率驗(yàn)證本文所述AI稽核系統(tǒng)根據(jù)不同逃費(fèi)類型建立對(duì)應(yīng)模型,目前已實(shí)現(xiàn)大車小標(biāo)、有入無(wú)出、屏蔽卡簽入省、屏蔽卡簽出省、跑長(zhǎng)買短、CPC倒卡、CPC入OBU出、一車多卡、一車多簽等近10種偷逃費(fèi)行為稽核。以大車小標(biāo)偷逃費(fèi)行為進(jìn)行舉例說(shuō)明。改變車型(車種):大車小標(biāo)是指發(fā)行車型跟實(shí)際車型不符。通過(guò)非法手段辦理或套取使用與實(shí)際車型不符的車輛標(biāo)簽,達(dá)到偷逃費(fèi)的目的。稽核數(shù)據(jù)驗(yàn)證方式如下:(1)通過(guò)交易數(shù)據(jù)中的車牌、車牌顏色和車型與發(fā)行數(shù)據(jù)對(duì)比,確定大車小標(biāo);(2)利用入口稱重?cái)?shù)據(jù),在收費(fèi)數(shù)據(jù)中的入口交易數(shù)據(jù)搜索軸數(shù)與車型不符的車輛;(3)搜索收費(fèi)數(shù)據(jù)中的入口交易數(shù)據(jù),車型為一型貨車,且車牌顏色為黃色的車輛;(4)篩選車輛通過(guò)ETC專道和人工車道的收費(fèi)車型存在不一致的情況,通過(guò)車牌號(hào)篩選某個(gè)車牌多次出現(xiàn)兩個(gè)及以上的車型的車輛;(5)對(duì)篩選出的車輛,根據(jù)大數(shù)據(jù)平臺(tái)圖片、交易數(shù)據(jù),對(duì)特征點(diǎn)進(jìn)行對(duì)比分析,形成初步結(jié)論。通過(guò)對(duì)稽核模型分析數(shù)據(jù)與稽核人員核實(shí)數(shù)據(jù)對(duì)比分析,進(jìn)行稽核模型分析篩查準(zhǔn)確率驗(yàn)證,稽核模型準(zhǔn)確率如表2所示。屏蔽卡簽、倒卡通行介質(zhì)等稽核模型準(zhǔn)確率較高,達(dá)90%,有入無(wú)出(闖關(guān)、跟車)、跑長(zhǎng)買短(U/J行駛)因系統(tǒng)及計(jì)費(fèi)規(guī)則、現(xiàn)場(chǎng)管理和證據(jù)獲取等多重因素影響,準(zhǔn)確率為50%~60%左右,但能夠滿足稽核業(yè)務(wù)需求?;四P蜏?zhǔn)確率如表2所示。
三、稽核結(jié)果數(shù)據(jù)分析
利用AI 稽核平臺(tái)對(duì)山西省2020年5月6日至2021年12月31日通行數(shù)據(jù)進(jìn)行全量分析,共篩查累計(jì)篩查疑似逃費(fèi)車輛67.3萬(wàn)臺(tái)、涉及行程約141.5萬(wàn)車次、涉及總金額1.05億元,根據(jù)稽核模型準(zhǔn)確率測(cè)算,預(yù)測(cè)逃費(fèi)車次95.8萬(wàn)車次,預(yù)測(cè)逃費(fèi)金額0.75億元,截至2022年1月底,各高速公路運(yùn)營(yíng)公司稽核人員完成全部疑似逃費(fèi)數(shù)據(jù)審核,完善證據(jù)鏈,最終確認(rèn)逃費(fèi)車次93.5萬(wàn)車次,確認(rèn)逃費(fèi)金額0.74億元,已追繳5500余萬(wàn)元。具體按逃費(fèi)類型分析如下。對(duì)大車小標(biāo)、有入無(wú)出(闖關(guān)、跟車)、屏蔽卡簽入省、屏蔽卡簽出省、跑長(zhǎng)買短(U/J行駛)、CPC 自倒卡、CPC 入 OBU 出等7種逃費(fèi)類型進(jìn)行分析,各類型對(duì)應(yīng)涉及行程數(shù)、涉及金額及確認(rèn)逃費(fèi)金額如表3所示,疑似逃費(fèi)涉及金額占比如圖6所示,確認(rèn)逃費(fèi)金額占比如圖7所示。
分析可得,有入無(wú)出(闖關(guān)、跟車)、大車小標(biāo)(丟軸)、屏蔽卡簽出省和跑長(zhǎng)買短(U/J行駛)等4種逃費(fèi)類型分別占據(jù)涉及行程數(shù)的96.87%、疑似損失金額的95.9%,是稽核系統(tǒng)需加大核查力度的逃費(fèi)類型,特別是屏蔽卡簽逃費(fèi)車次占為11%,逃費(fèi)金額占比卻達(dá)25%,以全網(wǎng)聯(lián)網(wǎng)收費(fèi)運(yùn)行模式下出現(xiàn)的新型逃費(fèi)類型,需要從技術(shù)、管理等多方面加強(qiáng)管理。有入無(wú)出(闖關(guān)、跟車)和跑長(zhǎng)買短(U/J行駛)2類逃費(fèi)類型確認(rèn)逃費(fèi)金額占比有所下降,直接原因是稽核模型準(zhǔn)確率不高。下一步應(yīng)持續(xù)優(yōu)化迭代這2類模型,盡可能提高其準(zhǔn)確率,從而不斷提高可追繳比例。
四、結(jié)束語(yǔ)
本文針對(duì)ETC識(shí)讀率低、牌識(shí)流水與抓拍率低、假冒減免車輛、套牌、路徑作弊等收費(fèi)問(wèn)題,搭建了AI稽核系統(tǒng)平臺(tái),實(shí)現(xiàn)了多源異構(gòu)數(shù)據(jù)的采集、存儲(chǔ)、處理與分析。在深度融合ETC門架、收費(fèi)站等流水和圖像信息的基礎(chǔ)上,提出了多流水融合路徑擬合方法真實(shí)還原了通行過(guò)程車輛信息,為偷逃漏通行費(fèi)稽核提供了完整證據(jù)鏈。同時(shí),深度分析了所轄區(qū)域2020年5月至2021年12月間數(shù)據(jù),結(jié)果表明,AI稽核系統(tǒng)模型準(zhǔn)確率較高,可有效防范和遏制偷逃漏通行費(fèi)行為,提升稽核追繳成功率。
參考文獻(xiàn)
[1] 王莫凡,吳烈陽(yáng). 取消高速公路省界收費(fèi)站后稽查方案探討[J]. 中國(guó)交通信息化,2020(12).
[2] 李銀珍.取消高速公路省界收費(fèi)站給社會(huì)經(jīng)濟(jì)帶來(lái)的積極影響運(yùn)用[J].內(nèi)蒙古煤炭經(jīng)濟(jì),2020(19).
[3] 朱彥蓉. 取消省界收費(fèi)站背景下收費(fèi)稽查平臺(tái)研究與設(shè)計(jì)[J].西部交通科技,2020(5).
[4] 譚峰,李密,曾春江,等. 基于中臺(tái)技術(shù)的取消高速公路省界收費(fèi)站系統(tǒng)研究[J].中國(guó)交通信息化,2021(S1).
[5] 劉春成,吳博,倪悝,等. 基于AI的收費(fèi)稽核研究與實(shí)踐[J]. 中國(guó)交通信息化,2021(S1).
[6] 王虹. 從人工到大數(shù)據(jù)+AI:“一張網(wǎng)”稽核加速中[J]. 中國(guó)交通信息化,2020(11).
[7] 楊曉寒,彭亞榮. 面向ETC自由流的收費(fèi)管理探討[J]. 中國(guó)交通信息化,2020(9).
[8] 楊寶靜. 取消高速公路省界收費(fèi)站后的運(yùn)營(yíng)變化及管理措施[J]. 中國(guó)交通信息化,2020(1).
溫馨提示:文章轉(zhuǎn)自網(wǎng)絡(luò),版權(quán)歸原作者,如涉及版權(quán),請(qǐng)聯(lián)系。