一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark SQL性能實現(xiàn)17.7倍的提升,是如何做到的

獨愛72H ? 來源:砍柴網(wǎng) ? 作者:砍柴網(wǎng) ? 2019-11-14 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:砍柴網(wǎng))

Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,常用來構(gòu)建大型、低延遲的數(shù)據(jù)分析應(yīng)用程序。Spark一個主要特點在于,其能夠在內(nèi)存中進(jìn)行計算,這使得其數(shù)據(jù)分析效率往往高于其它計算引擎,但是,服務(wù)器內(nèi)存資源的限制也使得其性能的擴(kuò)展存在著一定的瓶頸,在超大規(guī)模負(fù)載中無法充分發(fā)揮其利用內(nèi)存進(jìn)行計算的性能優(yōu)勢。

某全球領(lǐng)先的語音識別服務(wù)提供商是最早將Spark應(yīng)用到生產(chǎn)環(huán)境的團(tuán)隊之一,該公司的語音云通過幾千臺服務(wù)器構(gòu)成的云計算平臺向用戶提供多樣的、實時語音處理能力,日均服務(wù)終端用戶超過15億,日增數(shù)據(jù)超過100TB。2014年該公司基于Spark和AI技術(shù)構(gòu)建了DMP大數(shù)據(jù)平臺(用戶數(shù)據(jù)管理平臺)。DMP平臺的主要功能就是收集、存儲、分析和挖掘龐大的用戶數(shù)據(jù),以實現(xiàn)廣告精準(zhǔn)投放。

Spark在該公司的大數(shù)據(jù)平臺中主要用于海量用戶數(shù)據(jù)分析,每天支撐穩(wěn)定運(yùn)行的Spark SQL統(tǒng)計分析指標(biāo)和SQL腳本有幾千個。但是在將Spark SQL用于海量用戶數(shù)據(jù)分析的過程中,仍然面臨著一些痛點,這些都限制了該公司語音云的數(shù)據(jù)分析能力。

Spark的性能不僅受到CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等硬件設(shè)備的制約,而且Spark SQL目前還不支持索引,也嚴(yán)重影響了Spark SQL在進(jìn)行大規(guī)模數(shù)據(jù)分析時的性能,索引能夠提升數(shù)據(jù)檢索的效率,降低硬盤的IO瓶頸。

隨著數(shù)據(jù)量越來越大,即席分析的需求越來越強(qiáng)烈,即席查詢是用戶根據(jù)用戶自己的需求,靈活選擇查詢條件,系統(tǒng)能夠根據(jù)用戶的選擇生成響應(yīng)的統(tǒng)計報表和結(jié)果集;在數(shù)據(jù)倉庫和大數(shù)據(jù)分析系統(tǒng)中,即席查詢使用的越多,對系統(tǒng)的性能要求也就越高,如果內(nèi)存能夠緩存更多的熱點數(shù)據(jù),能夠極大的提升即席查詢處理速度并降低響應(yīng)延遲。

數(shù)據(jù)既有隨機(jī)讀的需求(即席查詢-Ad-hoc),又有全表掃描的需求(機(jī)器學(xué)習(xí));機(jī)器學(xué)習(xí)就是通過特定算法從海量的歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本進(jìn)行分析并對未來做出預(yù)測,在模型訓(xùn)練的過程中會產(chǎn)生大量的中間結(jié)果數(shù)據(jù),通常情況下需要將中間結(jié)果數(shù)據(jù)持久化到文件系統(tǒng)上,如果內(nèi)存能夠緩存更多的中間結(jié)果數(shù)據(jù),可以提升模型訓(xùn)練的速度。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11249

    瀏覽量

    106375
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25151
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    1.9性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    關(guān)鍵項目中,性能表現(xiàn)卓越。測試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實現(xiàn)了高達(dá)1.9的顯著提升,這也充分顯示了至強(qiáng)6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?278次閱讀

    產(chǎn)品如何做到可靠的防靜電設(shè)計

    眾所周知,工業(yè)產(chǎn)品所應(yīng)用的電磁環(huán)境之惡劣。要想產(chǎn)品在如此惡劣的電磁環(huán)境下正常工作,需要具備強(qiáng)大的抗干擾能力方能勝任。其中以靜電干擾最為常見且棘手。本文將手把手教你如何將工業(yè)產(chǎn)品做到可靠的防靜電
    的頭像 發(fā)表于 01-16 09:16 ?746次閱讀
    產(chǎn)品<b class='flag-5'>如何做到</b>可靠的防靜電設(shè)計

    SSM框架的性能優(yōu)化技巧 SSM框架中RESTful API的實現(xiàn)

    SSM框架的性能優(yōu)化技巧 SSM(Spring + Spring MVC + MyBatis)框架的性能優(yōu)化是提升Java Web應(yīng)用性能的關(guān)鍵環(huán)節(jié)。以下是一些常用的
    的頭像 發(fā)表于 12-17 09:10 ?787次閱讀

    藍(lán)牙AOA定位系統(tǒng)如何做到高精準(zhǔn)度?

    藍(lán)牙AOA定位系統(tǒng)是一種高精度的室內(nèi)定位技術(shù),其高精準(zhǔn)度是通過一系列高科技的技術(shù)和方法實現(xiàn)的。以下是給大家分析的幾點關(guān)于如何做到高精準(zhǔn)度的幾個關(guān)鍵點:
    的頭像 發(fā)表于 12-13 11:42 ?619次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩

    2.0在關(guān)鍵基準(zhǔn)測試中相比前代產(chǎn)品Gemini 1.5 Pro的性能提升了近兩。該模型支持圖像、視頻和音頻等多種輸入與輸出形式,例如可以實現(xiàn)文本與圖像的混合生成以及自定義的多語言文
    的頭像 發(fā)表于 12-12 14:22 ?814次閱讀

    ADC7846如何做到使用手指觸摸有效?

    ADC7846芯片觸摸轉(zhuǎn)換時候,不準(zhǔn),能否通過配置,如何做到使用手指觸摸有效?
    發(fā)表于 12-04 06:47

    兩個高速ADC的CLK時鐘如何做到同步無相位差?

    如何做到同步無相位差,兩個ADC使用同一個時鐘發(fā)生器是否可以滿足同步問題? 2、兩個高速ADC的CLKOUT是否存在時延,如果存在那相位差是多少?我再規(guī)格書中沒有看到CLKOUT引腳關(guān)于這方面的描述
    發(fā)表于 11-18 06:47

    高通驍龍汽車新方案:CPU性能躍升3,AI性能狂飆12

    。   據(jù)了解,驍龍座艙至尊版平臺作為驍龍8295的升級版,被命名為Elite。該平臺搭載了高通專為汽車行業(yè)設(shè)計的自研Oryon CPU架構(gòu),其性能相較于8295提升了3,并集成了最新的NPU,使得AI
    的頭像 發(fā)表于 10-23 14:50 ?1050次閱讀

    工程行業(yè)中如何做到低碳甚至零碳

    低碳的生活方式越來越多地融入我們的日常習(xí)慣當(dāng)中。但是在工程行業(yè)中如何做到低碳甚至零碳呢?
    的頭像 發(fā)表于 10-14 10:31 ?823次閱讀

    TPA3251如何做到180W的功率,電壓12V,電流應(yīng)該多少?

    TPA3251如何做到180W的功率,電壓12V,電流應(yīng)該多少,請推薦DCDC
    發(fā)表于 10-11 06:54

    寫 Verilog 如何做到心中有電路?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:寫 Verilog 如何做到心中有電路?老師說沒電路就不要寫代碼,但我寫個乘法器在綜合前都想不出它電路啥樣,全加器還行。 A
    發(fā)表于 09-26 20:30

    大數(shù)據(jù)從業(yè)者必知必會的Hive SQL調(diào)優(yōu)技巧

    不盡人意。本文針對Hive SQL性能優(yōu)化進(jìn)行深入研究,提出了一系列可行的調(diào)優(yōu)方案,并給出了相應(yīng)的優(yōu)化案例和優(yōu)化前后的SQL代碼。通過合理的優(yōu)化策略和技巧,能夠顯著提升Hive
    的頭像 發(fā)表于 09-24 13:30 ?695次閱讀

    spark為什么比mapreduce快?

    spark為什么比mapreduce快? 首先澄清幾個誤區(qū): 1:兩者都是基于內(nèi)存計算的,任何計算框架都肯定是基于內(nèi)存的,所以網(wǎng)上說的spark是基于內(nèi)存計算所以快,顯然是錯誤的 2;DAG計算模型
    的頭像 發(fā)表于 09-06 09:45 ?515次閱讀

    QPS提升10sql優(yōu)化

    本次慢sql優(yōu)化是大促準(zhǔn)備時的一個優(yōu)化,優(yōu)化4c16g單實例mysql支持QPS從437到4610,今天發(fā)文時618大促已經(jīng)順利結(jié)束,該mysql庫和應(yīng)用在整個大促期間運(yùn)行也非常穩(wěn)定。本文復(fù)盤一下
    的頭像 發(fā)表于 08-21 11:12 ?608次閱讀
    QPS<b class='flag-5'>提升</b>10<b class='flag-5'>倍</b>的<b class='flag-5'>sql</b>優(yōu)化

    使用PYNQ訓(xùn)練和實現(xiàn)BNN

    使用 PYNQ 可以輕松在 FPGA 上實現(xiàn)加速 AI/ML,而無需編寫一行 HDL!讓我們看看如何做到這一點。
    的頭像 發(fā)表于 08-05 17:15 ?1068次閱讀
    使用PYNQ訓(xùn)練和<b class='flag-5'>實現(xiàn)</b>BNN