摘要:?11月14日,阿里云重磅發(fā)布了實時計算獨享模式,即用戶獨享一部分物理資源,這部分資源在網(wǎng)絡(luò)/磁盤/CPU/內(nèi)存等資源上跟其他用戶完全獨立,是實時計算在原有共享模式基礎(chǔ)上的重大升級。(觀看實時計算發(fā)布會直播:https://yq.aliyun.com/live/591) 獨享模式優(yōu)點更加突出1、UDX開放:實時計算的共享模式是多個用戶共享一個物理機群,在網(wǎng)絡(luò)/磁盤層面沒有辦法做到完全隔離。
11月14日,阿里云重磅發(fā)布了實時計算獨享模式,即用戶獨享一部分物理資源,這部分資源在網(wǎng)絡(luò)/磁盤/CPU/內(nèi)存等資源上跟其他用戶完全獨立,是實時計算在原有共享模式基礎(chǔ)上的重大升級。
(觀看實時計算發(fā)布會直播:https://yq.aliyun.com/live/591)
獨享模式優(yōu)點更加突出
1、UDX開放:實時計算的共享模式是多個用戶共享一個物理機群,在網(wǎng)絡(luò)/磁盤層面沒有辦法做到完全隔離。因此,基于安全考慮,共享模式下無法對您開放UDX/DataStream更靈活、更底層的API。在某些場景下,無法滿足您的業(yè)務(wù)需求。獨享模式在網(wǎng)絡(luò)及物理機層面,有完全的隔離,因此可以開通UDF等更底層的API,滿足您的業(yè)務(wù)需求。
2、豐富的硬件:業(yè)務(wù)越來越豐富,對底層機器的配置會有更多樣化需求,比如CPU:MEM配比,以及GPU、FPGA等硬件的需求。實時計算獨享集群可充分復(fù)用阿里云在硬件層面做的各種優(yōu)化,為您解決各種硬件適配問題。
3、用戶間的隔離:對于ECS獨享集群,您能夠獨享一批計算資源,且從網(wǎng)絡(luò)上進入您的VPC。既滿足了您專網(wǎng)專用、資源獨享的需求,也可以跟您的IDC打通,更貼近您的業(yè)務(wù)需求。
4、更豐富的功能:Data Lake場景下的ETL:通過SQL+UDF的方式,使ETL任務(wù)開發(fā)更加便利。異構(gòu)數(shù)據(jù)源計算:支持從異構(gòu)數(shù)據(jù)源讀取數(shù)據(jù)做分析。例如,遠(yuǎn)程從OSS讀取數(shù)據(jù)歸檔日志,并join hbase中高危ip,做網(wǎng)絡(luò)攻擊分析等等。支持30+數(shù)據(jù)源的源表和結(jié)果表。
2018年雙11,實時計算完成三項世界級挑戰(zhàn)
雙11是購物狂歡,也是對阿里技術(shù)的“大考”。天貓“雙11”的成交額沖破100億元只花了2分05秒,而突破千億大關(guān),僅僅花了1小時47分鐘,比2017年快了7個多小時。這種瘋狂帶來了阿里史上最大的雙11流量洪峰,實時計算處理能力已經(jīng)相當(dāng)于一秒鐘內(nèi)讀完120萬本2018年新版的《新華字典》。
2013年雙11購物狂歡節(jié)第一分鐘成交破億,一千多萬人同時涌入天貓。這些數(shù)據(jù)在杭州淘寶城內(nèi)的數(shù)據(jù)大屏準(zhǔn)實時播報。大屏上跳動的每個數(shù)字,來自于阿里集團內(nèi)部幾十個系統(tǒng)間的緊密合作,當(dāng)在以最快速度秒殺到雙11熱賣商品的同時,這些系統(tǒng)已經(jīng)完成了無數(shù)輪的數(shù)據(jù)采集、傳輸、加工、計算以及反饋到頁面的工作。這也是阿里云實時計算技術(shù)的首次亮相。
在2018年的雙11中,實時數(shù)據(jù)處理技術(shù),包括日志數(shù)據(jù)和交易數(shù)據(jù)的實時采集、分發(fā)、計算,最終在媒體直播大屏上實時渲染和展示,整個鏈路的穩(wěn)定性保障壓力是巨大的??梢哉f,實時計算完成了三項世界級的挑戰(zhàn):
1、低延時,從零點第一筆交易發(fā)生,到媒體大屏上顯示出統(tǒng)計結(jié)果,整個處理過程延時控制在3秒以內(nèi);
2、實時計算處理峰值達(dá)到17.2億條/秒,實時計算的整體性能比去年提升了N倍;
3、高可用,全天服務(wù)不降級、無故障,扛下了高峰期所有的流量。
一站式、高性能實時大數(shù)據(jù)處理平臺
阿里云實時計算是一套基于Apache Flink構(gòu)建的一站式、高性能實時大數(shù)據(jù)處理平臺,廣泛應(yīng)用于流式數(shù)據(jù)處理、離線數(shù)據(jù)處理、DataLake計算等場景,助力企業(yè)向?qū)崟r化、智能化大數(shù)據(jù)計算升級轉(zhuǎn)型。
基于Apache Flink在阿里巴巴搭建的平臺于2016年正式上線,并從阿里巴巴的搜索和推薦這兩大場景開始實現(xiàn)。為了將Apache Flink在阿里巴巴真正運行起來,阿里巴巴實時計算團隊做了大量的優(yōu)化,在阿里云上的產(chǎn)品命名為時時計算,以Flink SQL為主要API,致力于打造一款全球領(lǐng)先的實時計算引擎。
據(jù)了解,阿里云實時計算脫胎于阿里集團內(nèi)部雙11實時大屏業(yè)務(wù),歷經(jīng)長期摸索和發(fā)展,將阿里集團本身沉淀多年的實時計算產(chǎn)品、架構(gòu)、業(yè)務(wù)能夠以云產(chǎn)品的方式對外提供服務(wù),用戶可以完全享受到阿里集團最新最前沿的計算引擎能力,業(yè)務(wù)上可規(guī)避阿里集團多年在流式大數(shù)據(jù)的試錯和教訓(xùn),更快、更輕松地實時化大數(shù)據(jù)處理流程,助力業(yè)務(wù)發(fā)展。
經(jīng)過多年沉淀,目前,阿里云實時計算產(chǎn)品已具有國際領(lǐng)先的產(chǎn)品優(yōu)勢,在吞吐/時延、SQL支持、開發(fā)體驗、窗口支持、亂序支持、上下游對接等多方面都優(yōu)于其他云廠商的相關(guān)產(chǎn)品。相對spark、storm等,阿里云實時計算人力成本低,開發(fā)運維更加便利,還可以無縫對接阿里云數(shù)據(jù)存儲。用戶可以充分利用阿里云實時計算提供的產(chǎn)品優(yōu)勢,方便快捷的解決自身業(yè)務(wù)實時化大數(shù)據(jù)分析的問題。
切實解決用戶痛點
阿里云實時計算可以提供FlinkSQL協(xié)助用戶簡單輕松完成流式計算邏輯的處理。同時,受限于SQL代碼功能有限無法滿足某些特定場景的業(yè)務(wù)需求,阿里云實時計算同時為部分授信用戶提供全功能的UDF函數(shù),幫助用戶完成業(yè)務(wù)定制化的數(shù)據(jù)處理邏輯。在流數(shù)據(jù)分析領(lǐng)域用戶直接使用FlinkSQL+UDF即可完成大部分流式數(shù)據(jù)分析處理邏輯,目前的實時計算更擅長于做流式數(shù)據(jù)分析、統(tǒng)計、處理。主要解決了用戶的三大痛點:
1、流式數(shù)據(jù)的及時性
數(shù)據(jù)的業(yè)務(wù)價值隨著時間的流失而迅速降低,因此在數(shù)據(jù)發(fā)生后必須盡快對其進行計算和處理。而傳統(tǒng)的大數(shù)據(jù)處理模式對于數(shù)據(jù)加工均遵循傳統(tǒng)日清日畢模式,即以小時甚至以天為計算周期對當(dāng)前數(shù)據(jù)進行累計并處理,顯然這類處理方式無法滿足數(shù)據(jù)實時計算的需求。在諸如實時大數(shù)據(jù)分析、風(fēng)控預(yù)警、實時預(yù)測、金融交易等諸多業(yè)務(wù)場景領(lǐng)域,批量(或者說離線)處理對于上述對于數(shù)據(jù)處理時延要求苛刻的應(yīng)用領(lǐng)域而言是完全無法勝任其業(yè)務(wù)需求的。而實時計算作為一類針對流數(shù)據(jù)的實時計算模型,可有效地縮短全鏈路數(shù)據(jù)流時延、實時化計算邏輯、平攤計算成本,最終有效滿足實時處理大數(shù)據(jù)的業(yè)務(wù)需求。
2、一站式的流式數(shù)據(jù)處理
不同于開源或者自建的流式處理服務(wù),阿里云實時計算是完全托管的流式計算引擎,阿里云可針對流數(shù)據(jù)運行查詢,無需預(yù)置或管理任何基礎(chǔ)設(shè)施,用戶可以享受一鍵啟用的流式數(shù)據(jù)服務(wù)能力。阿里云實時計算天然集成數(shù)據(jù)開發(fā)、數(shù)據(jù)運維、監(jiān)控預(yù)警等服務(wù),方便用戶最小成本試用和遷移流式計算產(chǎn)品。
3、SQL化的流式分析
支持標(biāo)準(zhǔn)SQL(產(chǎn)品名稱為:FlinkSQL),提供內(nèi)建的字符串處理、時間、統(tǒng)計等各類計算函數(shù),替換業(yè)界低效且復(fù)雜的Flink開發(fā),讓更多的BI人員、運營人員通過簡單的FlinkSQL可以完成實時化大數(shù)據(jù)分析和處理,讓實時大數(shù)據(jù)處理普適化、平民化。
同時,實現(xiàn)實時的數(shù)據(jù)監(jiān)控/分析。比如BI人員可以看到自己網(wǎng)站實時的訪客數(shù)據(jù)變化,購買情況,交易額波動等,不需要一段時間后才能做統(tǒng)計和分析。之前150人/月的工作,現(xiàn)在只需3個人/月就可以輕松解決,效率提升了50倍。
使用場景廣泛
實時計算擅長解決的幾個領(lǐng)域的應(yīng)用場景包括,實時的網(wǎng)絡(luò)點擊PV、UV統(tǒng)計;統(tǒng)計交通卡口的平均5分鐘通過車流量;水利大壩的壓力數(shù)據(jù)統(tǒng)計和展現(xiàn);網(wǎng)絡(luò)支付涉及金融盜竊固定行為規(guī)則的告警等。特別適合BI人員、大數(shù)據(jù)開發(fā)人員等用戶。
實時計算擅長解決的幾個領(lǐng)域的應(yīng)用場景包括,實時的網(wǎng)絡(luò)點擊PV、UV統(tǒng)計;統(tǒng)計交通卡口的平均5分鐘通過車流量;水利大壩的壓力數(shù)據(jù)統(tǒng)計和展現(xiàn);網(wǎng)絡(luò)支付涉及金融盜竊固定行為規(guī)則的告警等。特別適合BI人員、大數(shù)據(jù)開發(fā)人員等用戶。
大體分為四種典型場景:
**互聯(lián)網(wǎng)點擊流分析:實時分析網(wǎng)站用戶行為,精準(zhǔn)實時把握用戶畫像;
金融實時風(fēng)控:實時監(jiān)控金融惡意行為,實時風(fēng)控避免用戶損失;
物聯(lián)網(wǎng)IOT風(fēng)控:實時監(jiān)控偵測設(shè)備故障,即使避免潛在業(yè)務(wù)風(fēng)險;
電商精準(zhǔn)推薦:實時跟蹤用戶行為變化,精準(zhǔn)推薦提升產(chǎn)品銷量。**
用戶案例豐富
經(jīng)過兩年的發(fā)展,實時計算在集團內(nèi),淘寶、天貓、螞蟻金服、菜鳥、工業(yè)大腦等諸多業(yè)務(wù)均大量應(yīng)用了實時計算技術(shù)。今年以來,眾安保險、全民TV、千尋、新華智云等集團外部客戶也上線了諸多實時計算的典型場景和應(yīng)用。
獨享模式應(yīng)運而生
實時計算今年4月份商業(yè)化以來,一直以“共享模式”的形式對外輸出,在批處理領(lǐng)域,SQL 已經(jīng)經(jīng)歷了幾十年的考驗,是公認(rèn)的經(jīng)典。但另一方面也對用戶造成兩大困擾:
1.僅使用 SQL難以描述自己的業(yè)務(wù)邏輯;
2.將某些已有的存在于代碼中的業(yè)務(wù)邏輯翻譯成SQL,煩不勝煩。
因此,實時計算獨享模式應(yīng)運而生。獨享模式,是實時計算在原有共享模式基礎(chǔ)上的補充。用戶獨享一部分物理資源,這部分資源在網(wǎng)絡(luò)/磁盤/CPU/內(nèi)存等資源上跟其他用戶完全獨立。具備UDX開放、豐富的硬件、用戶間的隔離等特性。
使用流程簡潔方便
實時計算的基本計量單位為CU(Compute Unit,即計算資源),一個CU對應(yīng)于實時計算底層系統(tǒng)是一個CPU的計算能力。實時計算底層使用虛擬化技術(shù)進行資源隔離,保證一個基本的CU消費且最大消費僅能為一個CPU的計算能力。
產(chǎn)品的具體使用也十分方便,具體來說有以下幾步:
了解更多產(chǎn)品詳情,歡迎點擊
https://promotion.aliyun.com/ntms/act/rc.html
觀看實時計算發(fā)布會直播
https://yq.aliyun.com/live/591
點擊聚能聊,暢所欲言:實時計算,獨享模式
https://yq.aliyun.com/roundtable/438652
評論