□獲取數(shù)據(jù) □駕馭數(shù)據(jù) □運用數(shù)據(jù)
運用數(shù)字思維拓展大數(shù)據(jù)法律監(jiān)督
(資料圖片僅供參考)
近年來,全國檢察機關(guān)以數(shù)字化改革賦能新時代法律監(jiān)督,運用檢察大數(shù)據(jù)思維,推動法律監(jiān)督模式的重塑性變革,從“數(shù)量驅(qū)動、個案為主、案卷審查”的個案辦理式監(jiān)督向“質(zhì)效導(dǎo)向、類案為主、數(shù)據(jù)賦能”的類案治理式監(jiān)督轉(zhuǎn)變,探索出一條大數(shù)據(jù)法律監(jiān)督新路徑。
暢通數(shù)據(jù)來源是大數(shù)據(jù)法律監(jiān)督的根本。經(jīng)過實踐探索,大數(shù)據(jù)法律監(jiān)督的核心內(nèi)容是通過對辦理個案的系統(tǒng)總結(jié),歸納類型化要素,對政法、政務(wù)、社會等所涉數(shù)據(jù)進行采集梳理,經(jīng)過數(shù)據(jù)碰撞和分析,得出具有高度蓋然性的監(jiān)督線索,經(jīng)查實后開展法律監(jiān)督,并由此發(fā)現(xiàn)執(zhí)法司法及社會經(jīng)濟領(lǐng)域中的突出問題,進而推動社會治理。這一“個案辦理—類案監(jiān)督—系統(tǒng)治理”路徑面臨的首要難點即為“數(shù)據(jù)從何而來”,而這正是大數(shù)據(jù)法律監(jiān)督有別于傳統(tǒng)法律監(jiān)督之處,也是實現(xiàn)法律監(jiān)督模式重塑性變革的關(guān)鍵之舉。
加強數(shù)據(jù)管理、提升數(shù)據(jù)質(zhì)量是大數(shù)據(jù)法律監(jiān)督的關(guān)鍵。大數(shù)據(jù)法律監(jiān)督中的“數(shù)據(jù)難題”主要體現(xiàn)在三個方面:
一是數(shù)據(jù)獲取渠道有限。一方面,數(shù)據(jù)來源匱乏,共享渠道不暢通。對此,檢察機關(guān)目前通過建立偵查信息查詢機制、與執(zhí)法司法領(lǐng)域建立數(shù)據(jù)共享目錄等途徑減少信息壁壘,但是大量政務(wù)數(shù)據(jù)、社會數(shù)據(jù)共享仍較為有限。另一方面,自有資源未被充分利用。大量檢察數(shù)據(jù)散落在不同的“信息孤島”上,呈現(xiàn)分散化、碎片化等特點,缺乏統(tǒng)一管理與應(yīng)用,形成大量“沉睡的數(shù)據(jù)”。
二是數(shù)據(jù)安全亟待重視。一方面,部分在法律監(jiān)督中確實需要的數(shù)據(jù)字段,由于涉及客戶隱私、公民信息等,數(shù)據(jù)提供方以保護信息安全、數(shù)據(jù)邊界難以厘清等理由拒絕共享,導(dǎo)致監(jiān)督陷入瓶頸。另一方面,無論是執(zhí)法司法數(shù)據(jù)還是社會數(shù)據(jù),均會涉及個人或者單位的敏感信息。隨著大數(shù)據(jù)法律監(jiān)督的不斷深入,如何對已有數(shù)據(jù)加強安全管理、規(guī)范數(shù)據(jù)使用將成為重要課題。
三是數(shù)據(jù)質(zhì)量尚待提高。一方面,數(shù)據(jù)本身存在局限性。由于共享權(quán)限有限、數(shù)據(jù)涉密等原因,部分已獲取的數(shù)據(jù)信息存在信息不全、格式混亂等問題,導(dǎo)致部分數(shù)據(jù)雖然量大但是不精、不全,且清洗工作耗時耗力。另一方面,數(shù)據(jù)與監(jiān)督需求的關(guān)聯(lián)度欠缺。部分監(jiān)督模型需要大量信息,但是海量信息中只有部分信息是有用信息,如何縮小數(shù)據(jù)范圍、提高匹配精度是提高監(jiān)督質(zhì)效的關(guān)鍵,共享信息的質(zhì)量直接影響數(shù)字監(jiān)督效果。
以數(shù)字思維拓展大數(shù)據(jù)法律監(jiān)督的深度和廣度。檢察干警需要充分運用數(shù)字思維提高獲取數(shù)據(jù)、駕馭數(shù)據(jù)、運用數(shù)據(jù)的能力。在數(shù)字經(jīng)濟時代,數(shù)字化是一種思維方式、一種行為能力,將數(shù)字思維和相應(yīng)技術(shù)引入檢察監(jiān)督,破解“數(shù)據(jù)難題”,將大大拓展大數(shù)據(jù)法律監(jiān)督的深度和廣度。
一要激活自有資源,以數(shù)據(jù)喚醒數(shù)據(jù)?!八拇髾z察”“十大業(yè)務(wù)”本身具有豐富的信息數(shù)據(jù),深挖自有數(shù)據(jù)是首要工作。一方面,一體化管理檢察數(shù)據(jù)。歷經(jīng)多年積累,無論是刑事檢察,還是民事檢察、行政檢察、公益訴訟檢察,都通過各種途徑積累了大量的數(shù)據(jù),但數(shù)據(jù)分散導(dǎo)致數(shù)據(jù)利用率低。因此,應(yīng)實現(xiàn)檢察數(shù)據(jù)的貫通共享,將已獲取的數(shù)據(jù)進行一體化、系統(tǒng)化管理,實現(xiàn)融合監(jiān)督。另一方面,統(tǒng)一數(shù)據(jù)形式和標準。除檢察業(yè)務(wù)應(yīng)用系統(tǒng)、偵查監(jiān)督平臺中填錄的案卡、報表數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)外,檢察數(shù)據(jù)中還有大量卷宗材料、圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)容易采用常規(guī)方式進行分析處理,但對于非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù)需要通過特定的技術(shù)轉(zhuǎn)化后利用,統(tǒng)一數(shù)據(jù)標準,整合多源數(shù)據(jù)。
二要創(chuàng)新共享方式,以非共享實現(xiàn)共享。在檢察大數(shù)據(jù)戰(zhàn)略下,檢察機關(guān)目前已開展了多類專項數(shù)字監(jiān)督,但在更廣闊領(lǐng)域因數(shù)據(jù)權(quán)限、數(shù)據(jù)安全等原因仍存在不同程度外部阻力。對此,應(yīng)運用數(shù)字思維,改變傳統(tǒng)的導(dǎo)出共享方式為聯(lián)邦學(xué)習(xí)(一種重要的面向隱私保護的機器學(xué)習(xí)框架,可以在不收集數(shù)據(jù)的情況下協(xié)同進行模型的訓(xùn)練,實現(xiàn)數(shù)據(jù)的“可用不可見”,從而保護隱私信息)下的共享模式:一方面,通過聯(lián)邦學(xué)習(xí),可實現(xiàn)在不暴露真實數(shù)據(jù)的情況下完成合作建模,能夠讓AI算法借助位于不同站點的數(shù)據(jù)獲得經(jīng)驗,摒棄將數(shù)據(jù)進行歸集的方法,使得各方均能憑借本地數(shù)據(jù)獲取全局數(shù)據(jù)。對于大數(shù)據(jù)法律監(jiān)督而言,這將大大拓展監(jiān)督數(shù)據(jù)的來源。另一方面,聯(lián)邦學(xué)習(xí)這種“數(shù)據(jù)可用不可見”“數(shù)據(jù)不動模型動”的方式也會大大加強數(shù)據(jù)的隱私保護,減少數(shù)據(jù)泄露風險。
三要類型化治理,以數(shù)據(jù)驅(qū)動數(shù)據(jù)。大數(shù)據(jù)法律監(jiān)督的核心是類型化的思維方式,這除了體現(xiàn)在“類案治理監(jiān)督”上,同樣可以用于數(shù)據(jù)治理以提升數(shù)據(jù)質(zhì)量。一方面,可以將部分數(shù)據(jù)治理的模式推廣到整個類型化數(shù)據(jù)上,形成主題數(shù)據(jù)庫。在數(shù)據(jù)標準統(tǒng)一的基礎(chǔ)上形成易于檢索、碰撞便利的標準庫和主題庫,如毒品犯罪數(shù)據(jù)庫、電信詐騙犯罪數(shù)據(jù)庫、涉稅犯罪數(shù)據(jù)庫、集資類犯罪數(shù)據(jù)庫等,充分聯(lián)結(jié)監(jiān)督需求與現(xiàn)有數(shù)據(jù),把已有數(shù)據(jù)挖深、用盡。另一方面,建立專項監(jiān)督數(shù)據(jù)庫,以數(shù)據(jù)驅(qū)動數(shù)據(jù)??蓪⒁验_展的專項監(jiān)督類型化,如檢察機關(guān)已開展的“空殼公司”清理專項監(jiān)督活動,通過梳理無稅款、無社保繳納等特點,調(diào)取一批具有監(jiān)督針對性的企業(yè)信息、稅務(wù)信息,這部分信息相較于海量的“純數(shù)據(jù)”而言更具監(jiān)督價值。類似的如對強制戒毒、司法網(wǎng)拍等的專項檢察監(jiān)督中積累的“初步排查數(shù)據(jù)”,均能為各地檢察機關(guān)提供更有針對性的數(shù)據(jù)支持。
(作者單位:浙江省余姚市人民檢察院)