一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

爬蟲技術為什么變成了害蟲?爬蟲技術到底犯了什么錯?

Wildesbeast ? 來源:未知 ? 作者:新金融報道 ? 2019-09-21 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,多家通過爬蟲技術開展大數(shù)據(jù)信貸風控的公司被查。短短幾天時間,“爬蟲”技術被推上了風口浪尖,大數(shù)據(jù)風控行業(yè)也迎來了前所未有的“震蕩”。業(yè)內(nèi)人士透露,這些被調(diào)查的大數(shù)據(jù)公司基本都是涉嫌利用網(wǎng)絡爬蟲技術侵犯個人隱私,并將這些數(shù)據(jù)信息轉(zhuǎn)賣給其他機構(gòu)獲利。

“爬蟲”變成了“害蟲”?

何為爬蟲?百度百科給出的定義是,網(wǎng)絡爬蟲,是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。

據(jù)了解,爬蟲的發(fā)展歷史可以追溯到20年前,搜索引擎、聚合導航、數(shù)據(jù)分析、人工智能等業(yè)務都需要基于爬蟲技術。隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡資源有大量信息的載體,如何更好更有效地提取并利用它,爬蟲技術起到關鍵作用。爬蟲技術在信息定位也比較準確,可以根據(jù)客戶的搜索需求爬取最合適的數(shù)據(jù)推送出去。而且現(xiàn)在大數(shù)據(jù)處理方面,爬蟲技術可以對爬取的數(shù)據(jù)進行分析從而得出比較準確的數(shù)據(jù)。

爬蟲技術的優(yōu)勢不言而喻。技術是中立的、無罪的,但技術被頗有用心的人亂用就會出現(xiàn)問題。近期暴露出來的事件就是最大的警示。

事實上,自2016年開始,大數(shù)據(jù)風控、智能風控、智能催收逐漸成熟,并且開始應用于互聯(lián)網(wǎng)金融領域。從金融發(fā)展的角度來講,這是一件好事兒,大大降低了行業(yè)成本。而且隨著大數(shù)據(jù)的出現(xiàn)和興起,第三方大數(shù)據(jù)風控平臺也迎來一波發(fā)展高潮。

然而,提供信用評估類服務的第三方風控商在解決小額信貸多頭借貸、欺詐等風險問題的同時,也在無形中掌握了用戶貸前、貸后等各類信息數(shù)據(jù)。

“風險來源于過分地獲取用戶數(shù)據(jù),并且利用這些數(shù)據(jù)干一些‘見不得人’的事兒?!?a target="_blank">知名金融科技分析人士畢研廣告訴記者。

畢研廣分析道,其實,很多數(shù)據(jù)公司從一開始最為基礎的業(yè)務是“爬蟲業(yè)務”,后來演變到給金融機構(gòu)或者互金平臺做風控系統(tǒng),或者幫助平臺開發(fā)設計“線上放貸系統(tǒng)”。做系統(tǒng)不賺錢,還是賣數(shù)據(jù)賺錢。但是這一舉措也讓“爬蟲”變成了“害蟲”,非法獲取、銷售個人隱私數(shù)據(jù),必定涉及到了違法犯罪。

據(jù)了解,爬蟲技術的數(shù)據(jù)采集主要包括:公開的第三方數(shù)據(jù);抓取用戶主動授權的個人基本信息、聯(lián)系人信息、銀行卡信息等數(shù)據(jù);授權抓取數(shù)據(jù),如設備號、IP地址、運營商/電商等用戶授權后合規(guī)采集數(shù)據(jù);經(jīng)授權的平臺數(shù)據(jù),如用戶在平臺的歷史借款、還款情況等用戶已在注冊協(xié)議或隱私協(xié)議中授權業(yè)務方進行分析的數(shù)據(jù)。

那爬蟲技術在數(shù)據(jù)采集過程中是否經(jīng)過用戶授權、是否存在過度爬取信息、爬取到的信息用途不明等也成為當下人們關注的焦點。

對此,中國社會科學院金融研究所法與金融研究室副主任尹振濤表示,一方面公共數(shù)據(jù)的爬取是不允許商業(yè)利用的,并不是說互聯(lián)網(wǎng)的數(shù)據(jù)可以隨便爬取。另一方面有些客戶提供淘寶號,甚至密碼授權爬取,在爬取時就侵入了對方的計算機,這其實也是一種犯罪行為,叫作侵入計算機犯罪。

以“爬蟲”為主的大數(shù)據(jù)公司稱不上金融科技公司

不可否認,當前大數(shù)據(jù)風控行業(yè)對個人隱私缺乏保護,存在廣泛的數(shù)據(jù)濫用問題。對此,業(yè)內(nèi)普遍呼吁監(jiān)管的加強。

近兩年,很多互聯(lián)網(wǎng)金融平臺轉(zhuǎn)型,也有一些做數(shù)據(jù)的平臺,他們都強調(diào)自己做的是金融科技。是真科技還是假科技?轉(zhuǎn)型助貸、網(wǎng)絡小額貸業(yè)務,是合規(guī)的還是不合規(guī)的?

在畢研廣看來,現(xiàn)在的互聯(lián)網(wǎng)金融、金融科技還處在一個相對的“混沌期”。相信隨著政策的不斷清晰化、監(jiān)管對行業(yè)整治的不斷深化,也將逐漸清晰起來。以“爬蟲”為主的大數(shù)據(jù)公司稱不上金融科技公司。

事實上,今年以來,監(jiān)管逐漸趨嚴。5月28日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布的《數(shù)據(jù)安全管理辦法(征求意見稿)》明確規(guī)定,網(wǎng)絡運營者通過網(wǎng)站、應用程序等產(chǎn)品收集使用個人信息,應當分別制定并公開收集使用規(guī)則;網(wǎng)絡運營者以經(jīng)營為目的收集重要數(shù)據(jù)或個人敏感信息的,應向所在地網(wǎng)信部門報備收集使用規(guī)則、使用目的和保存期限等。

日前,浙江發(fā)布《中國銀保監(jiān)會浙江監(jiān)管局辦公室關于進一步規(guī)范個人消費貸款有關問題的通知》(浙銀保監(jiān)辦發(fā)〔2019〕213號),明確提出,不得將授信審查、風險控制等核心業(yè)務外包。

國家發(fā)展改革委9月16日發(fā)布《關于推送并應用市場主體公共信用綜合評價結(jié)果的通知》,根據(jù)通知,國家發(fā)展改革委組織國家公共信用信息中心會同相關大數(shù)據(jù)機構(gòu)對全國3300萬家市場主體開展了第一期公共信用綜合評價,現(xiàn)將評價結(jié)果推送,并就充分應用公共信用綜合評價結(jié)果,推動落實以信用為基礎的新型監(jiān)管機制。

“一系列監(jiān)管政策的下發(fā)對行業(yè)的長遠發(fā)展起到了積極作用?!笔Y韜說,“當前監(jiān)管機構(gòu)并不是采取了所謂一刀切的態(tài)度和做法,而且依法對于沒有合規(guī)經(jīng)營、侵犯個人隱私的企業(yè)進行調(diào)查,對于加速清退劣質(zhì)企業(yè)、保護用戶權益、促進優(yōu)質(zhì)企業(yè)發(fā)展有重要意義?!?/p>

蔣韜認為,長久來看,隨著金融機構(gòu)第一方數(shù)據(jù)積累以及第三方數(shù)據(jù)源壁壘降低,輸出數(shù)據(jù)分析能力將成為風控公司更好的商業(yè)模式,提供標準評分卡產(chǎn)品+數(shù)據(jù)科學家咨詢能力,將成為更有競爭力的商業(yè)模式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    patyon爬蟲技術PDF課件分享

    patyon爬蟲技術PDF課件
    發(fā)表于 10-31 16:08

    patyon爬蟲技術PDF課件分享

    patyon爬蟲技術PDF課件分享
    發(fā)表于 02-14 16:33

    爬蟲可以采集哪些數(shù)據(jù)

    我們想獲取到驗證碼,就需要從這個驗證碼的圖片中分析出來到底是什么字符。這就需要OCR技術。   對于爬蟲可以采集哪些數(shù)據(jù),通過上文的認識,大家都有數(shù)了,使用爬蟲的過程中,為了更有效率的
    發(fā)表于 10-15 17:25

    什么語言適合寫爬蟲

    剛接觸爬蟲的新手經(jīng)常會問,到底需要使用哪種語言做爬蟲,其實,我相信任何語言,只要他具備訪問網(wǎng)絡的標準庫,都可以很輕易的做到這一點。剛剛接觸爬蟲的時候,我總是糾結(jié)于用 Python 來做
    發(fā)表于 01-14 13:51

    什么語言適合寫爬蟲

    剛接觸爬蟲的新手經(jīng)常會問,到底需要使用哪種語言做爬蟲,其實,我相信任何語言,只要他具備訪問網(wǎng)絡的標準庫,都可以很輕易的做到這一點。剛剛接觸爬蟲的時候,我總是糾結(jié)于用 Python 來做
    發(fā)表于 02-03 13:22

    網(wǎng)絡爬蟲nodejs爬蟲代理配置

    隨著互聯(lián)網(wǎng)的發(fā)展進步,現(xiàn)在互聯(lián)網(wǎng)上也有許多網(wǎng)絡爬蟲。網(wǎng)絡爬蟲通過自己爬蟲程序向目標網(wǎng)站采集相關數(shù)據(jù)信息。當然互聯(lián)網(wǎng)的網(wǎng)站會有反爬策略。比如某電商網(wǎng)站就會限制一個用戶IP的訪問頻率,從而出現(xiàn)驗證碼
    發(fā)表于 09-01 17:23

    什么是爬蟲?

    什么是爬蟲爬蟲的價值?最簡單的python爬蟲爬蟲基本架構(gòu)
    發(fā)表于 11-05 06:13

    如何運行imdb爬蟲?

    imdbcn爬蟲實例 imdbcn網(wǎng)站結(jié)構(gòu)分析 創(chuàng)建爬蟲項目 運行imdb爬蟲
    發(fā)表于 11-05 07:07

    python網(wǎng)絡爬蟲概述

    網(wǎng)絡爬蟲(Web Spider)又稱網(wǎng)絡蜘蛛、網(wǎng)絡機器人,是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。網(wǎng)絡爬蟲按照系統(tǒng)結(jié)構(gòu)和實現(xiàn)技術,大致可分為一下幾種類型:通用網(wǎng)絡爬蟲
    發(fā)表于 03-21 16:51

    python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎

    本文檔的主要內(nèi)容詳細介紹的是python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎
    發(fā)表于 08-28 15:32 ?30次下載

    爬蟲是如何實現(xiàn)數(shù)據(jù)的獲取爬蟲程序如何實現(xiàn)

    進入大數(shù)據(jù)時代,爬蟲技術越來越重要,因為它是獲取數(shù)據(jù)的一個重要手段,是大數(shù)據(jù)和云計算的基礎。那么,爬蟲到底是如何實現(xiàn)數(shù)據(jù)的獲取的呢?今天和大家分享的就是一個系統(tǒng)學習
    發(fā)表于 01-02 16:30 ?10次下載
    <b class='flag-5'>爬蟲</b>是如何實現(xiàn)數(shù)據(jù)的獲取<b class='flag-5'>爬蟲</b>程序如何實現(xiàn)

    網(wǎng)絡爬蟲是否合法

    網(wǎng)絡爬蟲在大多數(shù)情況中都不違法,其實我們生活中幾乎每天都在爬蟲應用,如百度,你在百度中搜索到的內(nèi)容幾乎都是爬蟲采集下來的(百度自營的產(chǎn)品除外,如百度知道、百科等),所以網(wǎng)絡爬蟲作為一門
    的頭像 發(fā)表于 03-21 17:20 ?1.3w次閱讀

    Python爬蟲 你真的會寫爬蟲嗎?

    你以為你真的會寫爬蟲了嗎?快來看看真正的爬蟲架構(gòu)!
    的頭像 發(fā)表于 05-02 17:02 ?4264次閱讀
    Python<b class='flag-5'>爬蟲</b> 你真的會寫<b class='flag-5'>爬蟲</b>嗎?

    Web爬蟲現(xiàn)在是不是合法了

    技術無罪?江湖傳言,互聯(lián)網(wǎng)上50%以上的流量都是由爬蟲創(chuàng)造的,很多人都表示:無爬蟲就無互聯(lián)網(wǎng)的繁榮。也正因為此,網(wǎng)上各種爬蟲教程風靡不絕,惹各路大神小白觀之參與之。但是,無節(jié)制的背后往
    的頭像 發(fā)表于 02-04 14:45 ?3013次閱讀

    爬蟲技術涉案大數(shù)據(jù)分析及法律解讀

    ? 爬蟲技術涉案大數(shù)據(jù)分析及法律解讀 爬蟲技術作為一種前端獲取網(wǎng)站信息數(shù)據(jù)的技術,在目前大數(shù)據(jù)應用的背景下,異常火熱。但是由于使用者的不謹慎
    的頭像 發(fā)表于 01-12 16:39 ?4545次閱讀