人工智能模型服務商“布爾數(shù)據(jù)”宣布完成數(shù)千萬元融資,由杭州市政府及財政局成立的杭高投、華甌創(chuàng)投共同投資。創(chuàng)始人肖豐表示,本輪融資將主要用于智能模型研究及產(chǎn)品開發(fā),以進一步完善公司生態(tài)建設(shè)。此前,布爾數(shù)據(jù)曾于2018年底獲和山匯投資近千萬元天使輪融資。
布爾數(shù)據(jù)是杭州首新網(wǎng)絡科技有限公司旗下的是一家人工智能科技公司,基于大數(shù)據(jù)風控、人工智能、區(qū)塊鏈、機器學習算法等技術(shù),為電商平臺、信用租賃、支付、銀行、非銀等行業(yè)提供智能風控解決方案。
公司成立于2017年,總部位于杭州未來科技城。布爾數(shù)據(jù)將人工智能與業(yè)務場景結(jié)合,使人工智能技術(shù)得到場景化落地。
具體來看,其產(chǎn)品主要有以下4種:
1、多頭借貸報告:基于信貸、支付等機構(gòu)的數(shù)據(jù),通過多維度數(shù)據(jù)分析,包括多頭趨勢、申請機構(gòu)、負債風險、信貸逾期等全面分析用戶借貸行為,識別貸前欺詐風險,降低逾期率。應用場景有消費貸、汽車金融、融資租賃等。
2、小微商戶評級報告:基于商戶交易數(shù)據(jù)及資信狀況,綜合分析商戶的經(jīng)營能力及信譽情況,有效識別小微商戶信貸風險。應用場景有商戶信貸服務、融資租賃等。
3、個人貸前評級報告:從欺詐、借貸、司法等維度進行模型分析,有效識別欺詐人群,甄別不良信用記錄,幫助機構(gòu)篩選優(yōu)質(zhì)目標人群,識別潛在風險。
4、信息校驗驗證服務:針對個人及企業(yè)基本信息,提供信息校驗驗證服務。包括人臉驗證、活體識別、OCR識別等驗證功能。
其核心技術(shù)為智能風控引擎技術(shù),可基于風險場景、用戶狀態(tài),Al智能推薦管控策略,實現(xiàn)在線模型智能進化,提升系統(tǒng)整體風控能力。
布爾數(shù)據(jù)還建立動態(tài)反欺詐模型,將機器學習、人工智能應用到風控模型中。其設(shè)備指紋技術(shù)采用機器學習為Android、IOS、H5等設(shè)備定位唯一設(shè)備ID。利用布爾數(shù)據(jù)強大的決策引擎,精準分析一個設(shè)備上用戶的操作行為,發(fā)現(xiàn)多用戶之間的關(guān)聯(lián)情況,并識別模擬器,篡改設(shè)備等風險設(shè)備信息。其地理定位技術(shù)通過IP、基站、wifi、身份證、手機號及銀行卡等多維度的地理位置信息,利用算法等解析地址數(shù)據(jù)進行匹配關(guān)聯(lián),篩查相似地址進行風險判斷,識別基于位置的欺詐行為。
布爾數(shù)據(jù)主要與銀行、保險、第三方支付、電商平臺等大型機構(gòu)合作。據(jù)悉,公司目前已為數(shù)百家金融機構(gòu)、電商平臺及政府部門等提供畫像評級產(chǎn)品。
團隊方面,公司有來自阿里巴巴、螞蟻金服、銀行、支付公司的人工智能領(lǐng)域算法專家。
背景
各種新類型設(shè)備將會導致數(shù)據(jù)量的爆發(fā),其中大部分新設(shè)備目前還不存在。數(shù)據(jù)是有價值的,因為人工智能(AI)可以將數(shù)據(jù)中挖掘出商業(yè)價值。為了實現(xiàn)人工智能,我們將不得不啟用新的計算模型。
關(guān)鍵信息
一共有兩條關(guān)鍵信息。首先,人工智能工作負載(即機器學習、深度學習)需要一種處理數(shù)據(jù)的新方法——我們稱之為新的計算架構(gòu)(即計算模型)。后面將闡述“計算架構(gòu)”的含義,以及AI工作負載需要哪些類型的更改。其次,人工智能計算架構(gòu)需要材料工程的突破。我將討論一些我們遇到的突破類型的例子。在應用材料領(lǐng)域,我們很興奮地預見到人工智能將為材料工程帶來巨大的增長機遇。
在這篇文章中,我的目標是總結(jié)AI工作負載的計算架構(gòu)需求是如何不同于業(yè)界已經(jīng)熟悉了幾十年的傳統(tǒng)計算架構(gòu)(如x86或ARM)。我們將討論為什么傳統(tǒng)的馮?諾依曼計算架構(gòu)對人工智能來說是不夠的。并從一個我們做過的實證分析來說明,如果我們不啟用新的計算架構(gòu),人工智能將無法實現(xiàn)。
人工智能的工作量有什么獨特之處?
有三大不同之處,而且它們是相互關(guān)聯(lián)的。
首先,人工智能需要大量內(nèi)存,因為最流行的AI工作負載操作大量數(shù)據(jù),但是內(nèi)存也需要不同的組織方式。在流行的CPU中使用的傳統(tǒng)多層緩存架構(gòu)對AI來說是不必要的,AI需要更直接、更快速的內(nèi)存訪問。對于通過將數(shù)據(jù)存儲在緩存中來重用數(shù)據(jù),則沒有那么多的關(guān)注。
在人工智能系統(tǒng)中輸入大量的數(shù)據(jù)是非常重要的。以谷歌Translate?翻譯服務為例:在2010年時,谷歌聘請了語言學家和算法專家來實現(xiàn)從英語到漢語的翻譯,最后,他們的翻譯準確率達到了70%。這很好,但不是很好。最近,谷歌采取了一種不同的方法:他們雇傭了很多數(shù)據(jù)科學家,數(shù)據(jù)科學家們將每個可用的英文網(wǎng)頁及其中文譯文輸入到一個相對簡單的深度學習算法中。這給了他們更好的結(jié)果,準確率高達98%!正如您所看到的,這里的重點是使用更簡單的算法來使用更多的數(shù)據(jù),這是支持用大量數(shù)據(jù)驅(qū)動AI的論點。
其次,人工智能涉及大量的并行計算。并行計算意味著您可以并行地處理工作負載的不同部分,而不必擔心相互依賴。以圖像處理為例,可以并行處理圖像的不同部分,最后把圖像拼湊在一起。因此,所有傳統(tǒng)CPU中提供的復雜流水線對AI來說都是不必要的。
第三,人工智能需要大量的低精度計算,無論是浮點運算還是整數(shù)運算。這就是神經(jīng)網(wǎng)絡的力量,它是機器學習或深度學習的核心。傳統(tǒng)的CPU有64位精度,在某些情況下可以達到512位。在很大程度上,AI并不需要這些。
因此,我們在這里有三個基本的和重要的計算架構(gòu)變化,這是人工智能工作負載所需要的。這將我們帶到了同構(gòu)與異構(gòu)計算體系結(jié)構(gòu)的主題。
同構(gòu)計算與異構(gòu)計算
在PC和移動時代,大多數(shù)應用程序(或工作負載)在處理需求(即計算架構(gòu))方面看起來很相似。最初,所有的工作負載都是由CPU處理的,當我們開始使用更多的圖片、視頻和游戲時,我們開始使用GPU。
將來,我們的工作負載看起來會越來越不同,每個工作負載都有自己的計算需求。我們需要的是各種不同的體系結(jié)構(gòu),每種結(jié)構(gòu)都針對特定類型的工作負載進行了優(yōu)化。這就是我們所說的“硬件復興”,因為它推動了針對各種新工作負載的體系結(jié)構(gòu)創(chuàng)新。
還有一個原因可以解釋為什么這個行業(yè)正在從同構(gòu)計算轉(zhuǎn)向異構(gòu)計算。這與功耗密度有關(guān),功耗密度限制了傳統(tǒng)CPU的性能。我們正處在一個用現(xiàn)代多核CPU架構(gòu)來提高性能的困難時期。人工智能工作負載最基本的需求是更高的功耗效率(即每個操作對應的功耗)。隨著登納德定律(Dennard Scaling)的結(jié)束,實現(xiàn)這一點的惟一方法是構(gòu)建特定于域(domain-specific)或特定于工作負載的體系結(jié)構(gòu),從而從根本上提高計算效率。
實證分析:DRAM和NAND出貨量與數(shù)據(jù)生成相關(guān)
為了理解數(shù)據(jù)生成和計算需求之間的關(guān)系,我們將年度DRAM和NAND出貨量與年度數(shù)據(jù)生成進行了比較。經(jīng)驗關(guān)系表明,DRAM和NAND出貨量的增長速度都要高于數(shù)據(jù)生成的增長速度。在我們的分析中引入的數(shù)學關(guān)系是底層計算體系結(jié)構(gòu)的代表。
我們利用所發(fā)現(xiàn)的經(jīng)驗關(guān)系做了一個思維實驗,考慮在1%的智能汽車使用率下增加數(shù)據(jù)生成造成的影響。假設(shè)每輛智能汽車每天產(chǎn)生大約4TB的數(shù)據(jù),我們發(fā)現(xiàn),到2020年與前智能汽車水平相比,智能汽車產(chǎn)生的數(shù)據(jù)總量增加了5倍。
根據(jù)這一分析,使用傳統(tǒng)的計算模型,我們將需要8倍的DRAM裝機容量和25倍的NAND裝機容量(2020年)來處理1%的智能汽車使用。在應用材料行業(yè),我們絕對希望這種情況發(fā)生,但我們不認為會發(fā)生。相反,該行業(yè)將需要采用基于新材料和3D設(shè)計技術(shù)的新型存儲器,以及新的計算架構(gòu)。
綜上,傳統(tǒng)的馮?諾依曼計算架構(gòu)在處理人工智能所需的海量數(shù)據(jù)時是不經(jīng)濟的,甚至是不可行的。我們需要新的計算架構(gòu)。
-
核心技術(shù)
+關(guān)注
關(guān)注
4文章
625瀏覽量
20222 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249673 -
機器學習
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134651
發(fā)布評論請先 登錄
最新人工智能硬件培訓AI 基礎(chǔ)入門學習課程參考2025版(大模型篇)
人工智能是做什么的

評論