- +1
央行支付司副司長:征信不是超級警察,不能用于管理私生活
“你答應(yīng)了我上個周五晚上請我吃飯,可你沒請,你言而無信!”“你當初追我的時候答應(yīng)過不抽煙,可你不守信用!” 又如一個人開車闖了紅燈,不遵守交通規(guī)則,被開了罰單。這算不算失信?類似這種數(shù)據(jù)能不能當作信用數(shù)據(jù)或征信數(shù)據(jù)?
近日,中共中央、國務(wù)院發(fā)布支持民營企業(yè)的28條意見,其中明確提出“要進一步規(guī)范失信聯(lián)合懲戒對象納入標準和程序,建立完善信用修復(fù)機制和異議制度,規(guī)范信用核查和聯(lián)合懲戒”。中央文件發(fā)出了糾偏的信號,意味著目前無限制擴大化的失信聯(lián)合懲戒措施將受到規(guī)制。
百行征信成立時,人民銀行領(lǐng)導(dǎo)取這個名字之意,來自于周敦頤《通書》:”誠,五常之本,百行之源也?!蹦敲催@個誠或者征信到底是什么意思?
要回答這個問題,先來看什么是征信,國際金融公司給過一個定義,Credit reporting systems are essential to creating sound financial infrastructures that facilitate lending and help expand access to credit to a significant share of individuals,microfinance,and small and medium enterprises. Also,they help satisfy lenders'need for accurate,credible information that reduces the risk of lending and the cost of loan losses。(征信報告對于建立健全的金融基礎(chǔ)設(shè)施是至關(guān)重要的,這些基礎(chǔ)設(shè)施能夠促進貸款,并擴大很大一部分個人和小微企業(yè)獲得信貸的渠道。它們也有助于滿足貸款人對準確、可信信息的需求,從而降低貸款風(fēng)險和貸款損失成本。)
中國人民銀行征信中心對征信給出的定義,是指對企業(yè)、事業(yè)單位等組織的信用信息和個人的信用信息進行采集、整理、保存、加工,并向信息使用者提供的活動。而這里說的信用信息,特指在交易的一方承諾未來償還的前提下,另一方為其提供商品或服務(wù)的行為,是隨著商品流轉(zhuǎn)與貨幣流轉(zhuǎn)相分離,商品運動與貨幣運動時空分離而產(chǎn)生的。可見,征信最重要的目的是落在經(jīng)濟層面上,是用于預(yù)測一個人在非即付并無抵押的經(jīng)濟活動中是否守約。需要強調(diào)的是,征信系統(tǒng)也是金融基礎(chǔ)設(shè)施的一部分,是一個公共產(chǎn)品,有很強的外部性,直接影響社會大眾的隱私保護、信貸公平性等公共利益,應(yīng)該本著“最少、必要”的原則進行信息采集、保存和加工,這樣才符合公共產(chǎn)品的要求。
通俗的說,個人信用數(shù)據(jù)基本上指的就是借債還錢的數(shù)據(jù),而征信就是減少有人借錢不還的風(fēng)險,同時也幫助有還錢習(xí)慣的人順利地借錢。
反過來說,征信不是超級警察,不能管大家的私生活,也不是為了評選社會道德楷模。信用數(shù)據(jù)的加工,不管是原始的征信報告,還是信用評分,還是別的各種創(chuàng)新產(chǎn)品,都要停留在個人金融信用領(lǐng)域,不應(yīng)過界,不要把個人征信這個事兒搞得像是非要算出來誰是好人一樣,沒有人有這個權(quán)利。
大數(shù)據(jù)的推導(dǎo)結(jié)果是相關(guān)關(guān)系,并非因果關(guān)系
什么是大數(shù)據(jù)(big data)?大數(shù)據(jù)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)就是巨量數(shù)據(jù)集合,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。其中,非結(jié)構(gòu)化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分。因此,大數(shù)據(jù)無法用單機進行處理,必須依托云計算進行分布式處理。
大數(shù)據(jù)分析是將實時數(shù)據(jù)流分析和歷史相關(guān)數(shù)據(jù)相結(jié)合,然后分析并發(fā)現(xiàn)其中隱藏的模式、相關(guān)性、趨勢、偏好等等,并建立所需的數(shù)學(xué)模型,就是找規(guī)律,并運用從過去數(shù)據(jù)中得到的規(guī)律,來預(yù)測未來。需要注意的是,大數(shù)據(jù)分析模型顯示的是數(shù)據(jù)相關(guān)關(guān)系,并不是因果關(guān)系 。
這兩者有何區(qū)別,舉例而言:有人收集了一年內(nèi)冰激淋銷量與溺水死亡人數(shù)的大量數(shù)據(jù),發(fā)現(xiàn)冰激淋銷量高的月份里,溺水死亡的人數(shù)就多;冰激淋賣的不好的月份里,溺水死亡的人就少。這能不能得出結(jié)論:為了減少溺水的人數(shù),這些月份里不要賣冰激淋了?大家都知道:絕對不行!這是因為,冰激淋銷量和溺水死亡人數(shù)的關(guān)系, 只是相關(guān)關(guān)系 ,并不是因果關(guān)系!
那么大數(shù)據(jù)分析到底能不能應(yīng)用在征信上?是李逵還是李鬼?根據(jù)前述,“個人信用數(shù)據(jù)基本上是指借債還錢的數(shù)據(jù)”,從性質(zhì)上來說,征信數(shù)據(jù)必須是與合同、契約有關(guān)的因果關(guān)系數(shù)據(jù)。如果在征信模型中應(yīng)用大數(shù)據(jù)分析,需要把一個人方方面面的信息都收集起來,包括本人信息、生活習(xí)慣、社交關(guān)系等等,大而全、細而精,恨不得無孔不入、挖祖宗三代,然后對大量的相關(guān)數(shù)據(jù)進行分析,來找到做信貸決策的模型。但需要強調(diào)的是,這是相關(guān)關(guān)系,不是因果關(guān)系;以大數(shù)據(jù)分析建立的征信模型并不符合金融基礎(chǔ)設(shè)施的信息收集原則!而且這些非金融信息的行為數(shù)據(jù)既不能用于分析一個人的還款意愿、也不能用于判斷借款人的償還能力。
再比如,一個人闖了紅燈,不遵守交通規(guī)則,這個數(shù)據(jù)算不算信用數(shù)據(jù)?如前所述,征信數(shù)據(jù)用于預(yù)測一個人在非即付并無抵押的經(jīng)濟活動中是否守約。由于這個闖紅燈的人之前并沒有向任何人承諾遵守交通規(guī)則,并不能算失信;同時,這個行為數(shù)據(jù)與經(jīng)濟活動無關(guān)。所以,開車闖紅燈可以開罰單扣分,走路闖紅燈可以罰款,幫助協(xié)警管理交通,但這種數(shù)據(jù)不能用于征信!
又有人說,“通過我們對各種大數(shù)據(jù)的研究,我們發(fā)現(xiàn),很多看起來與信用沒關(guān)系的事件之間,是存在著關(guān)聯(lián)的?!卑此@個邏輯,這不是征信數(shù)據(jù),屬于大數(shù)據(jù)。
假如根據(jù)大數(shù)據(jù)分析,有可能發(fā)現(xiàn)愛闖紅燈的人,還款的信用表現(xiàn)確實不怎么樣,但這只能證明兩者的相關(guān)關(guān)系,而不是因果關(guān)系。因為如果在這個愛闖紅燈的人每天必經(jīng)路口全修上立交橋,他再也不用闖紅燈了,那么,他的信用分或者信用表現(xiàn)就會因此提高。而如果銀行據(jù)此進行信貸決策,貸款就可能會打水漂。正像冰淇淋和溺水死亡率的例子一樣,就算其中存在強相關(guān)性,也不能拿闖紅燈的數(shù)據(jù)去判斷一個人的信用,更不能用于征信。
同樣,如果一個人開車闖紅燈或超速,吃了罰單,交通局再三催促也不交罰款,甚至這一記錄被移交給催債公司。這個數(shù)據(jù)算不算信用記錄?大多數(shù)人覺得這個算,比如美國征信局就收集這個數(shù)據(jù)。但準確地說,美國征信局曾經(jīng)收集過這些闖紅燈的數(shù)據(jù),那些不交罰款的司機的信用評分會下降。但是2016年6月,美國三大征信局和31個州的檢察長們達成庭外和解,個人征信機構(gòu)不得收集任何與合同或協(xié)議無關(guān)的付款信息,包括罰款、罰單等數(shù)據(jù)。因為征信機構(gòu)在收集這些闖紅燈的行為數(shù)據(jù)時,數(shù)據(jù)質(zhì)量可能存在問題,比如拍照機器誤讀、數(shù)據(jù)不準、缺乏證據(jù)等,這違反了消費者保護法中關(guān)于行業(yè)欺騙和不公平操作的有關(guān)條款,將面臨整頓和600萬美元的罰款。而且,前述和解協(xié)議的效力是可以回溯的,就是說征信機構(gòu)之前收集的那些記錄都將刪除。
這個和解協(xié)議對征信業(yè)的影響是深遠的。對于征信機構(gòu)來說,權(quán)力受到約束,而消費者的征信權(quán)益則受到了保護。
再舉個例子,超級網(wǎng)購的大買家和“信用好”這兩者是否存在相關(guān)性,這還需要數(shù)據(jù)驗證。但可以確定的是,這兩者之間根本談不上因果關(guān)系。這不僅不符合征信原則,還對無網(wǎng)購行為的消費者和其他網(wǎng)購平臺的消費者造成了歧視。如果僅僅因為闖紅燈或者沒有網(wǎng)購被剝奪借貸權(quán)利,就如同要降低溺水死亡率而禁止銷售冰淇淋一樣可笑,老百姓的征信權(quán)益因此受到侵害。所以說,大數(shù)據(jù)分析用于征信是有邊界的,因為要保護消費者權(quán)益,反對不公平競爭。
信用評分怎么來的?
一個人在征信機構(gòu)里的數(shù)據(jù)是很多的,信用報告內(nèi)容很豐富,包含了這個人在過去幾年的信用記錄,審貸人員從頭到尾看一遍要花不少時間,如果兩個審貸人員去看同一個申請人的信用記錄,就算他們是雙胞胎,也很有可能會由于個人的經(jīng)驗和主觀判斷不同而得出不一樣的決定。所以,單純用信用報告來做決定,既不能達到審批標準的一致性,也無法提高效率,畢竟個人信用產(chǎn)品的申請人數(shù)目特別大,信貸審核成本也會無法承受。于是,信用評分閃亮登場!
信用評分,指的是征信機構(gòu)在收集了數(shù)據(jù)以后,通過對信用記錄數(shù)據(jù)的清洗、加工和分析,輸入到數(shù)學(xué)模型里得到的一個非常直觀的分數(shù)。根據(jù)傳統(tǒng)習(xí)慣,分數(shù)越高越好,高分表示信用風(fēng)險低。分數(shù)的范圍是可以事先界定的,蘿卜青菜,各有所愛,有人喜歡百分制,有人喜歡300-900這個范圍。
信用評分模型是怎么得來的?首先,巧婦難為無米之炊,做飯需要原材料。開發(fā)數(shù)學(xué)模型的原材料,就是信用數(shù)據(jù)。
一個人的信用數(shù)據(jù)有很多項,比如:這個人有幾張信用卡、信用卡的最早開卡日期等很多“變量”。在開發(fā)數(shù)學(xué)模型的時候,不僅僅會用收集來的變量,還會根據(jù)已有數(shù)據(jù)再加工出來一些變量,比如:最早的信用卡開卡日期距今天的天數(shù)等。至少涉及上千個變量。
接下來,數(shù)學(xué)家們要決定需要開發(fā)多少個數(shù)學(xué)模型。舉個例子,信用污點嚴重的、輕微的和沒有信用污點的就需要分開建模;信用歷史比較長、剛有信用記錄的菜鳥,也需要分開建模。
確定好建模型對象和建模數(shù)量之后,數(shù)學(xué)家要確定模型變量和參數(shù),他們不會把所有的變量都放進模型,并不是因為算不過來,而是因為變量之間的關(guān)系比較復(fù)雜,有的變量之間互相干擾;也有的變量需要進一步考察再決定,比如,如果一個人的信用記錄在一段時間內(nèi)被查詢了很多次,說明這個人可能最近很缺錢,是比較負面的信息,會帶來信用評分的下降;但是在進一步考察后,應(yīng)剔除來自招聘單位的查詢,因為招聘單位查個人信用的目的并不是要給他貸款。此外,有些變量值需要做組合,比如上個月實際還款金額占應(yīng)還款金額的百分比,就需要分成從0到100%之間好幾檔,而不是直接用百分比。這種組合分檔是為了讓使模型更加穩(wěn)健,不至于因為一點小變化帶來分數(shù)的大幅度變動。最終進入到一個模型里的變量在10-20個之間。
建好一個數(shù)學(xué)模型,把各種參數(shù)和模型使用的條件都輸入到電腦系統(tǒng)里,就像做了一個“月光寶盒”。根據(jù)個人情況選定適用模型,算出來一個分數(shù)。金融機構(gòu)根據(jù)分數(shù)的高低來決定是不是貸款,收多少利息,貸款多長期限等。
究竟哪些因素是信用評分模型中最重要的,是不是網(wǎng)購時多買點東西就能改變我們的信用評分呢?再舉個例子,根據(jù)公開信息,著名的FICO評分是這樣算的:35%的信息來源是個人還款記錄,30%是欠款金額,15%是信用歷史長度,10%是信用產(chǎn)品類型,10%是近期內(nèi)開始使用的信用產(chǎn)品。
怎么來理解FICO評分中信息來源的構(gòu)成?對信用評分的正確解讀是:對那些與貸款申請人有類似信貸行為表現(xiàn)的人,根據(jù)按時還款比例的高低,類推該申請人將來按時還款的可能性高低。請注意,信用評分高的張三不一定會按時還錢;而信用評分低的李四也不一定就一定不會按時還錢。只能說,信用分高的張三,將來按時還錢的可能性高,信用分低的李四,將來按時還錢的可能性低。于是,銀行就設(shè)個分數(shù)線,低于這個分數(shù)線的人都不給貸款。同理,銀行的行長也不一定信用分就高,因為信用分從來就不是近水樓臺先得月的事。
所以信用分是個歷史表現(xiàn)的標尺,相對穩(wěn)定,不會大起大落。所謂“青山易改,本性難移”,要提高自己的信用分,要靠多年的表現(xiàn)好換來的。如果說一個征信公司的信用分,可以靠在一個購物平臺血拼一個月暴漲,這不叫信用分,這是網(wǎng)購積分。
如何使用信用評分
《西游記》里有一個故事,唐僧師徒過平頂山,遇到金角、銀角大王拿著紫金葫蘆和凈瓶,把悟空裝了進去。后來悟空從里面出來,用一個假葫蘆換了妖怪的寶貝。那么信用評分是不是個無所不能的寶葫蘆呢?
最近幾年,中國的一些機構(gòu)發(fā)明了信用評分的新用途:比如信用評分高的人可以走快速安檢通道;信用評分高的人可以快速拿到某國簽證;信用評分還被用于征婚平臺,說評分高的人肯定會是個浪漫的人,可以托付終身。
但是這真的靠譜嗎?通常,數(shù)學(xué)模型的使用原則是,在什么數(shù)據(jù)條件上開發(fā)出來的模型,就在什么數(shù)據(jù)條件下使用。拿上面的例子說,即使模型采集了安檢的歷史數(shù)據(jù),放在評分模型里,也不能完全決定是否此人在未來可以走快速安檢通道,更何況信用評分并不是安全評分。假如這個信用評分高的人是個恐怖分子呢?而前述諸多怪現(xiàn)象,無非是為了夸大其信用評分產(chǎn)品的作用,屬于誤導(dǎo)消費者的娛樂化營銷,甚至侵犯消費者的權(quán)益。
首先,信用評分這個寶貝不是隨便一個路人甲拿來就能用的,使用者主要是信用產(chǎn)品的提供者,比如銀行、信貸公司等。這些放貸機構(gòu)通常在四個方面使用信用評分。
第一個方面是信貸決策。比如,銀行收到信用卡申請表之后,去征信局查申請人的信用報告,然后做出是否發(fā)卡的決定。銀行如果希望獲得風(fēng)險很低的客戶,就設(shè)定一個較高的征信分及格線,如果銀行愿意多承擔(dān)一些風(fēng)險,就可以降低及格線。
這里要注意了,根據(jù)征信業(yè)的最佳實踐,對金融機構(gòu)依據(jù)信用評分做出的不利決策,貸款申請人有知情權(quán)。如果金融機構(gòu)拒絕貸款申請,要給出原因,就是要把模型里丟分最多的變量內(nèi)容告知申請人。實踐中,征信局在提供信用評分的同時,會提供幾個代碼,表示申請人丟分多的評分項,銀行會把這些代碼所代表的含義翻譯成大白話告訴申請人,比如:“你最近開了太多新信用卡”,但不能僅僅敷衍說評分不及格。此外,銀行還會書面告訴申請人:如果覺得告知信息不對,可以去征信局申訴。另外,拒貸的原因不能與性別、年齡、種族、出生地等有關(guān),這可能涉及歧視。比方說,銀行不能因為有人姓穆罕默德而推測這個人的種族或宗教,然后拒絕信貸申請。換句話說這些因素也不能用于征信評分。
第二個方面,是判定現(xiàn)有客戶整體信用風(fēng)險。金融機構(gòu)一般只知道客戶在本行的信用狀況,要了解整體信用風(fēng)險,一種方法是查詢客戶的整體信用報告,但價格貴,也看不過來。比較簡單的方法是定期查詢現(xiàn)有客戶的信用評分,并重點關(guān)注評分快速下降的客戶。因為這種客戶很可能拖欠其他銀行的錢了。
第三個方面,是選擇催收方式。對于有拖欠行為的客戶,銀行要根據(jù)其信用評分決定是自己花時間、精力催收,還是按分數(shù)高低定好價格,把貸款轉(zhuǎn)賣給催債公司。
第四個方面,是市場營銷。這種應(yīng)用比較復(fù)雜,也容易造成誤解。舉個例子,一家放貸機構(gòu),推出了一個信貸產(chǎn)品,目標客戶是信用評分600-700分之間的中等風(fēng)險的人。但根據(jù)消費者保護規(guī)定,征信局不能直接提供符合條件的客戶名單,放貸機構(gòu)只能委托征信局把促銷信息發(fā)給符合條件的客戶。這個過程要有第三方監(jiān)督,以確保合規(guī)。
除去以上四個方面,信用評分一般來說是不能用于其他領(lǐng)域的,也就是說,信用評分并不是什么都還能做的“寶葫蘆”。比如,信用評分不能用于招聘,這種做法會讓目前沒錢還債的人找不到工作,會因此被截斷收入來源,相當于遭到雙重懲罰。
可見,用大數(shù)據(jù)做征信就像“從公牛身上擠奶”,是否能得出準確的結(jié)果值得商榷,但是,這些大數(shù)據(jù)可以用來做內(nèi)部風(fēng)控,由于不屬于公共產(chǎn)品范疇,只要能夠保護消費者權(quán)益,不造成隱私保護問題和信貸歧視,可以根據(jù)企業(yè)自身的決策來決定。(作者穆長春系中國人民銀行數(shù)字貨幣研究所所長、支付司副司長。 本文屬于個人觀點,與所屬供職機構(gòu)無關(guān)。本文首發(fā)于財新網(wǎng),經(jīng)授權(quán)刊發(fā)。)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司