一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

干貨:直觀地解釋和可視化每個復(fù)雜的 DataFrame 操作

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-14 21:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大多數(shù)數(shù)據(jù)科學(xué)家可能會贊揚Pandas進(jìn)行數(shù)據(jù)準(zhǔn)備的能力,但許多人可能無法利用所有這些能力。操作數(shù)據(jù)幀可能很快會成為一項復(fù)雜的任務(wù),因此在Pandas中的八種技術(shù)中均提供了說明,可視化,代碼和技巧來記住如何做。

Pandas提供了各種各樣的DataFrame操作,但是其中許多操作很復(fù)雜,而且似乎不太平易近人。本文介紹了8種基本的DataFrame操作方法,它們涵蓋了數(shù)據(jù)科學(xué)家需要知道的幾乎所有操作功能。每種方法都將包括說明,可視化,代碼以及記住它的技巧。

Pivot

透視表將創(chuàng)建一個新的“透視表”,該透視表將數(shù)據(jù)中的現(xiàn)有列投影為新表的元素,包括索引,列和值。初始DataFrame中將成為索引的列,并且這些列顯示為唯一值,而這兩列的組合將顯示為值。這意味著Pivot無法處理重復(fù)的值。

旋轉(zhuǎn)名為df的DataFrame的代碼如下:

記住:Pivot——是在數(shù)據(jù)處理領(lǐng)域之外——圍繞某種對象的轉(zhuǎn)向。在體育運動中,人們可以繞著腳“旋轉(zhuǎn)”旋轉(zhuǎn):大熊貓的旋轉(zhuǎn)類似于。原始DataFrame的狀態(tài)圍繞DataFrame的中心元素旋轉(zhuǎn)到一個新元素。有些元素實際上是在旋轉(zhuǎn)或變換的(例如,列“bar”),因此很重要。

Melt

Melt可以被認(rèn)為是“不可透視的”,因為它將基于矩陣的數(shù)據(jù)(具有二維)轉(zhuǎn)換為基于列表的數(shù)據(jù)(列表示值,行表示唯一的數(shù)據(jù)點),而樞軸則相反??紤]一個二維矩陣,其一維為“B”和“C”(列名),另一維為“a”,“b”和“c”(行索引)。

我們選擇一個ID,一個維度和一個包含值的列/列。包含值的列將轉(zhuǎn)換為兩列:一列用于變量(值列的名稱),另一列用于值(變量中包含的數(shù)字)。

結(jié)果是ID列的值(a,b,c)和值列(B,C)及其對應(yīng)值的每種組合,以列表格式組織。

可以像在DataFramedf上一樣執(zhí)行Mels操作:

記?。合裣灎T一樣融化(Melt)就是將凝固的復(fù)合物體變成幾個更小的單個元素(蠟滴)。融合二維DataFrame可以解壓縮其固化的結(jié)構(gòu)并將其片段記錄為列表中的各個條目。

Explode

是一種擺脫數(shù)據(jù)列表的有用方法。當(dāng)一列爆炸時,其中的所有列表將作為新行列在同一索引下(為防止發(fā)生這種情況,此后只需調(diào)用.reset/_index()即可)。諸如字符串或數(shù)字之類的非列表項不受影響,空列表是NaN值(您可以使用.dropna()清除它們)。

在DataFramedf中Explode列“A”非常簡單:

要記?。篍xplode某物會釋放其所有內(nèi)部內(nèi)容-Explode列表會分隔其元素。

Stack

堆疊采用任意大小的DataFrame,并將列“堆疊”為現(xiàn)有索引的子索引。因此,所得的DataFrame僅具有一列和兩級索引。

堆疊名為df的表就像df.stack()一樣簡單。

為了訪問狗的身高值,只需兩次調(diào)用基于索引的檢索,例如df.loc ['dog']。loc ['height']。

要記?。簭耐庥^上看,堆棧采用表的二維性并將列堆棧為多級索引。

Unstack

取消堆疊將獲取多索引DataFrame并對其進(jìn)行堆疊,將指定級別的索引轉(zhuǎn)換為具有相應(yīng)值的新DataFrame的列。在表上調(diào)用堆棧后再調(diào)用堆棧不會更改該堆棧(原因是存在“0”)。

堆疊中的參數(shù)是其級別。在列表索引中,索引為-1將返回最后一個元素。這與水平相同。級別-1表示將取消堆疊最后一個索引級別(最右邊的一個)。作為另一個示例,當(dāng)級別設(shè)置為0(第一個索引級別)時,其中的值將成為列,而隨后的索引級別(第二個索引級別)將成為轉(zhuǎn)換后的DataFrame的索引。

可以按照與堆疊相同的方式執(zhí)行堆疊,但是要使用level參數(shù):df.unstack(level = -1)。

Merge

合并兩個DataFrame是在共享的“鍵”之間按列(水平)組合它們。此鍵允許將表合并,即使它們的排序方式不一樣。完成的合并DataFrame默認(rèn)情況下會將后綴/_x和/_y添加到value列。

為了合并兩個DataFramedf1和df2(其中df1包含leftkey,而df2包含rightkey),請調(diào)用:

合并不是pandas的功能,而是附加到DataFrame。始終假定合并所在的DataFrame是“左表”,在函數(shù)中作為參數(shù)調(diào)用的DataFrame是“右表”,并帶有相應(yīng)的鍵。

默認(rèn)情況下,合并功能執(zhí)行內(nèi)部聯(lián)接:如果每個DataFrame的鍵名均未列在另一個鍵中,則該鍵不包含在合并的DataFrame中。另一方面,如果一個鍵在同一DataFrame中列出兩次,則在合并表中將列出同一鍵的每個值組合。例如,如果df1具有3個鍵foo值,而df2具有2個相同鍵的值,則在最終DataFrame中將有6個條目,其中l(wèi)eftkey = foo和rightkey = foo。

記?。汉喜?shù)據(jù)幀就像在水平行駛時合并車道一樣。想象一下,每一列都是高速公路上的一條車道。為了合并,它們必須水平合并。

Join

通常,聯(lián)接比合并更可取,因為它具有更簡潔的語法,并且在水平連接兩個DataFrame時具有更大的可能性。連接的語法如下:

使用聯(lián)接時,公共鍵列(類似于合并中的right/_on和left/_on)必須命名為相同的名稱。how參數(shù)是一個字符串,它表示四種連接方法之一,可以合并兩個DataFrame:

'left':包括df1的所有元素,僅當(dāng)其鍵為df1的鍵時才包含df2的元素。否則,df2的合并DataFrame的丟失部分將被標(biāo)記為NaN。

'right':'left',但在另一個DataFrame上。包括df2的所有元素,僅當(dāng)其鍵是df2的鍵時才包含df1的元素。

“outer”:包括來自DataFrames所有元素,即使密鑰不存在于其他的-缺少的元素被標(biāo)記為NaN的。

“inner”:僅包含元件的鍵是存在于兩個數(shù)據(jù)幀鍵(交集)。默認(rèn)合并。

記?。喝绻褂眠^SQL,則單詞“ join”應(yīng)立即與按列添加相聯(lián)系。如果不是,則“ join”和“ merge”在定義方面具有非常相似的含義。

Concat

合并和連接是水平工作,串聯(lián)或簡稱為concat,而DataFrame是按行(垂直)連接的。例如,考慮使用pandas.concat([df1,df2])串聯(lián)的具有相同列名的兩個DataFramedf1和df2:

盡管可以通過將axis參數(shù)設(shè)置為1來使用concat進(jìn)行列式聯(lián)接,但是使用聯(lián)接會更容易。

請注意,concat是pandas函數(shù),而不是DataFrame之一。因此,它接受要連接的DataFrame列表。

如果一個DataFrame的另一列未包含,默認(rèn)情況下將包含該列,缺失值列為NaN。為了防止這種情況,請?zhí)砑右粋€附加參數(shù)join ='inner',該參數(shù)只會串聯(lián)兩個DataFrame共有的列。

切記:在列表和字符串中,可以串聯(lián)其他項。串聯(lián)是將附加元素附加到現(xiàn)有主體上,而不是添加新信息(就像逐列聯(lián)接一樣)。由于每個索引/行都是一個單獨的項目,因此串聯(lián)將其他項目添加到DataFrame中,這可以看作是行的列表。

Append是組合兩個DataFrame的另一種方法,但它執(zhí)行的功能與concat相同,效率較低且用途廣泛。

-

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91905
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    開關(guān)柜防誤可視化順控操作為什么有必要做?

    蜀瑞創(chuàng)新科普:開關(guān)柜防誤可視化順控操作(通常指基于可視化技術(shù)的順序控制防誤操作)即使在已有傳統(tǒng)五防系統(tǒng)的基礎(chǔ)上,仍然具有重要的現(xiàn)實意義和必要性,主要原因如下:
    的頭像 發(fā)表于 05-29 09:22 ?105次閱讀
    開關(guān)柜防誤<b class='flag-5'>可視化</b>順控<b class='flag-5'>操作</b>為什么有必要做?

    工業(yè)設(shè)備可視化管理系統(tǒng)是什么

    工業(yè)設(shè)備可視化管理系統(tǒng)是一種基于物聯(lián)網(wǎng)(IoT)、大數(shù)據(jù)、云計算、數(shù)字孿生等技術(shù),對工業(yè)設(shè)備的運行狀態(tài)、性能參數(shù)、維護(hù)信息等進(jìn)行實時監(jiān)測、數(shù)據(jù)整合與可視化呈現(xiàn)的智能管理平臺。它通過將復(fù)雜的設(shè)備數(shù)據(jù)
    的頭像 發(fā)表于 05-27 14:56 ?217次閱讀
    工業(yè)設(shè)備<b class='flag-5'>可視化</b>管理系統(tǒng)是什么

    可視化組態(tài)物聯(lián)網(wǎng)平臺是什么

    可視化含義:組態(tài)是一種用于構(gòu)建復(fù)雜物聯(lián)網(wǎng)系統(tǒng)的工具,它提供了豐富的圖形組件和可視化元素,使得用戶可以通過簡單的拖拽操作來創(chuàng)建自定義的界面。
    的頭像 發(fā)表于 04-21 10:40 ?299次閱讀

    工業(yè)可視化監(jiān)控平臺可以接入哪些設(shè)備數(shù)據(jù)

    隨著工業(yè) 4.0 和智能制造的快速發(fā)展,工業(yè)生產(chǎn)正朝著數(shù)字、智能方向邁進(jìn)。在這一進(jìn)程中,工業(yè)可視化監(jiān)控平臺發(fā)揮著舉足輕重的作用。它就像是工業(yè)生產(chǎn)的 “智慧大腦” 和 “千里眼”,能夠?qū)?b class='flag-5'>復(fù)雜
    的頭像 發(fā)表于 02-25 16:29 ?330次閱讀
    工業(yè)<b class='flag-5'>可視化</b>監(jiān)控平臺可以接入哪些設(shè)備數(shù)據(jù)

    VirtualLab Fusion中的可視化設(shè)置

    摘要 VirtualLab Fusion中的全局選項對話框可以輕松定制軟件的外觀和感覺。還可以保存和加載全局選項文件,以便可以輕松地將偏好設(shè)置從一個設(shè)備轉(zhuǎn)移到另一個設(shè)備。本文檔說明了與可視化和結(jié)果
    發(fā)表于 02-25 08:51

    VirtualLab Fusion應(yīng)用:光波導(dǎo)k域布局可視化(“神奇的圓環(huán)”)

    特定光波導(dǎo)布局的光導(dǎo)和耦合條件。 概念 方向轉(zhuǎn)換器計算器 可以通過“開始”>“計算器”找到方向轉(zhuǎn)換器計算器,這有助于演示指定角度的不同方式。 k域可視化 k域可視化:平面波的傳播
    發(fā)表于 02-21 08:53

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具!

    數(shù)據(jù)量的激增,單純通過數(shù)字和文本來分析數(shù)據(jù)已不再高效。數(shù)據(jù)可視化則提供了一種直觀、互動性強(qiáng)的方式,幫助人們通過視覺元素,如柱狀圖、折線圖、餅圖、熱力圖等圖表形式,理解復(fù)雜的數(shù)據(jù)關(guān)系。 二、數(shù)據(jù)
    發(fā)表于 01-19 15:24

    什么是大屏數(shù)據(jù)可視化?特點有哪些?

    大屏數(shù)據(jù)可視化是指通過大屏幕展示大量數(shù)據(jù)和信息,以直觀、可視化的方式幫助用戶理解和分析數(shù)據(jù)。這種展示方式通常用于展示復(fù)雜的數(shù)據(jù)集、實時監(jiān)控系統(tǒng)、企業(yè)管理儀表盤等。以下是關(guān)于 大屏數(shù)據(jù)
    的頭像 發(fā)表于 12-16 16:59 ?687次閱讀

    如何找到適合的大屏數(shù)據(jù)可視化系統(tǒng)

    選擇合適的大屏數(shù)據(jù)可視化系統(tǒng)是企業(yè)或組織在數(shù)字轉(zhuǎn)型過程中至關(guān)重要的一步。一個優(yōu)秀的大屏數(shù)據(jù)可視化系統(tǒng)能夠?qū)崟r呈現(xiàn)關(guān)鍵業(yè)務(wù)數(shù)據(jù),提升決策效率,同時提供直觀、易于理解的視覺呈現(xiàn),助力企業(yè)
    的頭像 發(fā)表于 12-13 15:47 ?493次閱讀

    天然河道河流生態(tài)流量監(jiān)測系統(tǒng):直觀可視化界面,輕松解讀生態(tài)流量數(shù)據(jù)

    天然河道河流生態(tài)流量監(jiān)測系統(tǒng)的直觀可視化界面是其一大亮點。通過高清顯示屏或在線平臺,用戶可以一目了然地看到河流的實時流速、流量、水位等數(shù)據(jù)
    的頭像 發(fā)表于 12-02 10:14 ?654次閱讀
    天然河道河流生態(tài)流量監(jiān)測系統(tǒng):<b class='flag-5'>直觀</b><b class='flag-5'>可視化</b>界面,輕松解讀生態(tài)流量數(shù)據(jù)

    智慧能源可視化監(jiān)管平臺——助力可視化能源數(shù)據(jù)管理

    博達(dá)可視化大屏設(shè)計平臺在智慧能源領(lǐng)域的價值體現(xiàn)在實時監(jiān)控、數(shù)據(jù)可視化、決策支持和效率提升等方面。借助該平臺,企業(yè)可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產(chǎn)和生活,實現(xiàn)能源的可持續(xù)發(fā)展。
    的頭像 發(fā)表于 11-29 10:00 ?953次閱讀
    智慧能源<b class='flag-5'>可視化</b>監(jiān)管平臺——助力<b class='flag-5'>可視化</b>能源數(shù)據(jù)管理

    智慧樓宇可視化的優(yōu)點

    智慧樓宇可視化是指通過數(shù)據(jù)可視化技術(shù)來展示和分析樓宇的各種數(shù)據(jù),為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化的優(yōu)點,詳細(xì)介紹其在樓宇管理和運營中的重要作用
    的頭像 發(fā)表于 11-19 14:25 ?486次閱讀

    智慧園區(qū)數(shù)據(jù)可視化優(yōu)勢體現(xiàn)在哪些地方

    智慧園區(qū)數(shù)據(jù)可視化是當(dāng)今數(shù)字化時代的重要工具,為園區(qū)管理者和決策者提供了強(qiáng)大的分析和展示數(shù)據(jù)的能力。以下是智慧園區(qū)數(shù)據(jù)可視化的應(yīng)用優(yōu)勢,詳細(xì)介紹: 1.信息呈現(xiàn)清晰直觀:智慧園區(qū)數(shù)據(jù)可視化
    的頭像 發(fā)表于 11-15 10:30 ?521次閱讀
    智慧園區(qū)數(shù)據(jù)<b class='flag-5'>可視化</b>優(yōu)勢體現(xiàn)在哪些地方

    開關(guān)柜可視化操作是什么?

    開關(guān)柜的可視化是指通過圖像、視頻或3D模型等形式將開關(guān)柜內(nèi)部結(jié)構(gòu)和工作狀態(tài)直觀地展示出來,這種技術(shù)在電力行業(yè)和工業(yè)自動領(lǐng)域越來越受到重視
    的頭像 發(fā)表于 07-25 10:15 ?624次閱讀
    開關(guān)柜<b class='flag-5'>可視化</b><b class='flag-5'>操作</b>是什么?

    可視化數(shù)據(jù)大屏的制作流程

    制作可視化數(shù)據(jù)大屏是一項涵蓋數(shù)據(jù)分析、設(shè)計和技術(shù)實現(xiàn)的復(fù)雜任務(wù)。從數(shù)據(jù)處理到展示呈現(xiàn),每個步驟都至關(guān)重要。下面將詳細(xì)介紹可視化數(shù)據(jù)大屏的制作流程,包括數(shù)據(jù)準(zhǔn)備、設(shè)計階段和技術(shù)實現(xiàn)。 ?
    的頭像 發(fā)表于 07-24 13:57 ?1199次閱讀