近日,多家通過爬蟲技術開展大數(shù)據(jù)信貸風控的公司被查。短短幾天時間,“爬蟲”技術被推上了風口浪尖,大數(shù)據(jù)風控行業(yè)也迎來了前所未有的“震蕩”。業(yè)內(nèi)人士透露,這些被調(diào)查的大數(shù)據(jù)公司基本都是涉嫌利用網(wǎng)絡爬蟲技術侵犯個人隱私,并將這些數(shù)據(jù)信息轉(zhuǎn)賣給其他機構(gòu)獲利。
“爬蟲”變成了“害蟲”?
何為爬蟲?百度百科給出的定義是,網(wǎng)絡爬蟲,是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。
據(jù)了解,爬蟲的發(fā)展歷史可以追溯到20年前,搜索引擎、聚合導航、數(shù)據(jù)分析、人工智能等業(yè)務都需要基于爬蟲技術。隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡資源有大量信息的載體,如何更好更有效地提取并利用它,爬蟲技術起到關鍵作用。爬蟲技術在信息定位也比較準確,可以根據(jù)客戶的搜索需求爬取最合適的數(shù)據(jù)推送出去。而且現(xiàn)在大數(shù)據(jù)處理方面,爬蟲技術可以對爬取的數(shù)據(jù)進行分析從而得出比較準確的數(shù)據(jù)。
爬蟲技術的優(yōu)勢不言而喻。技術是中立的、無罪的,但技術被頗有用心的人亂用就會出現(xiàn)問題。近期暴露出來的事件就是最大的警示。
事實上,自2016年開始,大數(shù)據(jù)風控、智能風控、智能催收逐漸成熟,并且開始應用于互聯(lián)網(wǎng)金融領域。從金融發(fā)展的角度來講,這是一件好事兒,大大降低了行業(yè)成本。而且隨著大數(shù)據(jù)的出現(xiàn)和興起,第三方大數(shù)據(jù)風控平臺也迎來一波發(fā)展高潮。
然而,提供信用評估類服務的第三方風控商在解決小額信貸多頭借貸、欺詐等風險問題的同時,也在無形中掌握了用戶貸前、貸后等各類信息數(shù)據(jù)。
“風險來源于過分地獲取用戶數(shù)據(jù),并且利用這些數(shù)據(jù)干一些‘見不得人’的事兒?!?a target="_blank">知名金融科技分析人士畢研廣告訴記者。
畢研廣分析道,其實,很多數(shù)據(jù)公司從一開始最為基礎的業(yè)務是“爬蟲業(yè)務”,后來演變到給金融機構(gòu)或者互金平臺做風控系統(tǒng),或者幫助平臺開發(fā)設計“線上放貸系統(tǒng)”。做系統(tǒng)不賺錢,還是賣數(shù)據(jù)賺錢。但是這一舉措也讓“爬蟲”變成了“害蟲”,非法獲取、銷售個人隱私數(shù)據(jù),必定涉及到了違法犯罪。
據(jù)了解,爬蟲技術的數(shù)據(jù)采集主要包括:公開的第三方數(shù)據(jù);抓取用戶主動授權的個人基本信息、聯(lián)系人信息、銀行卡信息等數(shù)據(jù);授權抓取數(shù)據(jù),如設備號、IP地址、運營商/電商等用戶授權后合規(guī)采集數(shù)據(jù);經(jīng)授權的平臺數(shù)據(jù),如用戶在平臺的歷史借款、還款情況等用戶已在注冊協(xié)議或隱私協(xié)議中授權業(yè)務方進行分析的數(shù)據(jù)。
那爬蟲技術在數(shù)據(jù)采集過程中是否經(jīng)過用戶授權、是否存在過度爬取信息、爬取到的信息用途不明等也成為當下人們關注的焦點。
對此,中國社會科學院金融研究所法與金融研究室副主任尹振濤表示,一方面公共數(shù)據(jù)的爬取是不允許商業(yè)利用的,并不是說互聯(lián)網(wǎng)的數(shù)據(jù)可以隨便爬取。另一方面有些客戶提供淘寶號,甚至密碼授權爬取,在爬取時就侵入了對方的計算機,這其實也是一種犯罪行為,叫作侵入計算機犯罪。
以“爬蟲”為主的大數(shù)據(jù)公司稱不上金融科技公司
不可否認,當前大數(shù)據(jù)風控行業(yè)對個人隱私缺乏保護,存在廣泛的數(shù)據(jù)濫用問題。對此,業(yè)內(nèi)普遍呼吁監(jiān)管的加強。
近兩年,很多互聯(lián)網(wǎng)金融平臺轉(zhuǎn)型,也有一些做數(shù)據(jù)的平臺,他們都強調(diào)自己做的是金融科技。是真科技還是假科技?轉(zhuǎn)型助貸、網(wǎng)絡小額貸業(yè)務,是合規(guī)的還是不合規(guī)的?
在畢研廣看來,現(xiàn)在的互聯(lián)網(wǎng)金融、金融科技還處在一個相對的“混沌期”。相信隨著政策的不斷清晰化、監(jiān)管對行業(yè)整治的不斷深化,也將逐漸清晰起來。以“爬蟲”為主的大數(shù)據(jù)公司稱不上金融科技公司。
事實上,今年以來,監(jiān)管逐漸趨嚴。5月28日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)據(jù)安全管理辦法(征求意見稿)》明確規(guī)定,網(wǎng)絡運營者通過網(wǎng)站、應用程序等產(chǎn)品收集使用個人信息,應當分別制定并公開收集使用規(guī)則;網(wǎng)絡運營者以經(jīng)營為目的收集重要數(shù)據(jù)或個人敏感信息的,應向所在地網(wǎng)信部門報備收集使用規(guī)則、使用目的和保存期限等。
日前,浙江發(fā)布《中國銀保監(jiān)會浙江監(jiān)管局辦公室關于進一步規(guī)范個人消費貸款有關問題的通知》(浙銀保監(jiān)辦發(fā)〔2019〕213號),明確提出,不得將授信審查、風險控制等核心業(yè)務外包。
國家發(fā)展改革委9月16日發(fā)布《關于推送并應用市場主體公共信用綜合評價結(jié)果的通知》,根據(jù)通知,國家發(fā)展改革委組織國家公共信用信息中心會同相關大數(shù)據(jù)機構(gòu)對全國3300萬家市場主體開展了第一期公共信用綜合評價,現(xiàn)將評價結(jié)果推送,并就充分應用公共信用綜合評價結(jié)果,推動落實以信用為基礎的新型監(jiān)管機制。
“一系列監(jiān)管政策的下發(fā)對行業(yè)的長遠發(fā)展起到了積極作用?!笔Y韜說,“當前監(jiān)管機構(gòu)并不是采取了所謂一刀切的態(tài)度和做法,而且依法對于沒有合規(guī)經(jīng)營、侵犯個人隱私的企業(yè)進行調(diào)查,對于加速清退劣質(zhì)企業(yè)、保護用戶權益、促進優(yōu)質(zhì)企業(yè)發(fā)展有重要意義?!?/p>
蔣韜認為,長久來看,隨著金融機構(gòu)第一方數(shù)據(jù)積累以及第三方數(shù)據(jù)源壁壘降低,輸出數(shù)據(jù)分析能力將成為風控公司更好的商業(yè)模式,提供標準評分卡產(chǎn)品+數(shù)據(jù)科學家咨詢能力,將成為更有競爭力的商業(yè)模式。
-
人工智能
+關注
關注
1807文章
49029瀏覽量
249603 -
數(shù)據(jù)分析
+關注
關注
2文章
1473瀏覽量
35044 -
大數(shù)據(jù)
+關注
關注
64文章
8960瀏覽量
140261
發(fā)布評論請先 登錄
爬蟲可以采集哪些數(shù)據(jù)
什么語言適合寫爬蟲
什么語言適合寫爬蟲
網(wǎng)絡爬蟲nodejs爬蟲代理配置
python網(wǎng)絡爬蟲概述
python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎
爬蟲是如何實現(xiàn)數(shù)據(jù)的獲取爬蟲程序如何實現(xiàn)

評論