一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣使用Python創(chuàng)建詞云

ss ? 來源:磐創(chuàng)AI ? 作者:磐創(chuàng)AI ? 2020-11-06 17:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹從開始從事數(shù)據(jù)可視化工作的那一天起,我就愛上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見解。在此之前,我只了解基本圖表,例如條形圖,散點(diǎn)圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤,華夫圖等。

因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來制作詞云,在成功嘗試之后,我想通過使用條形圖,餅圖和其他圖表的代碼來嘗試使用它。詞云是什么?定義:詞云是一個(gè)簡單但功能強(qiáng)大的可視化表示對象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。

詞云的用途

1.社交媒體上的熱門標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢,因此,我們可以獲取人們在其帖子中使用最多的標(biāo)簽來探索最新的趨勢。

2.媒體中的熱門話題:分析新聞報(bào)道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個(gè)需求較高的主題,來獲得所需的結(jié)果,即前n個(gè)熱門媒體主題。

3.電子商務(wù)中的搜索詞:在電子商務(wù)購物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購物商品的詞云,這樣,他就可以了解在特定時(shí)期內(nèi)哪些商品需求量最大。讓我們開始使用Python來實(shí)現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫。在python中,我們將安裝一個(gè)內(nèi)置庫wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud

如果你的anaconda環(huán)境支持conda,請輸入:conda install wordcloud

這可以直接在notebook中實(shí)現(xiàn),只需在代碼的開頭添加“!”即可。像這樣:!pip install wordcloud

但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個(gè)Wikipedia庫來訪問Wikipedia API,可以通過在anaconda命令提示符下安裝Wikipedia來完成,如下所示:pip install wikipedia

現(xiàn)在我們還需要其他一些庫,它們是numpy,matplotlib和pandas。截至目前,我們需要的庫就安裝好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

機(jī)器學(xué)習(xí)維基百科頁面的輸出:

上圖是我們通過檢索Wikipedia的機(jī)器學(xué)習(xí)頁面獲得的輸出圖像,我們還可以看到它可以向下滾動(dòng),這表示將檢索整個(gè)頁面。在這里,我們還可以通過摘要方法得到頁面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

這里我們有句子的參數(shù),因此我們可以用它來檢索特定的行數(shù)。

輸出5個(gè)句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用詞是沒有任何含義的單詞,例如‘is’, ‘a(chǎn)re’, ‘a(chǎn)n’, ‘I’ 等。Wordcloud帶有內(nèi)置停用詞庫,該庫將自動(dòng)從文本中刪除停用詞。同時(shí)我們也可以通過stopwords.add()函數(shù)在python中添加停用詞的選擇。Wordcloud方法可以設(shè)置詞云的寬度和高度,我將它們都設(shè)置為500,背景色設(shè)置為粉紅色。如果不添加隨機(jī)狀態(tài),則每次運(yùn)行代碼時(shí),詞云都會(huì)看起來不同,我們可以將其設(shè)置為任何int值。從上面的代碼中,我們將獲得這樣的詞云:

通過查看上圖,我們可以看到機(jī)器學(xué)習(xí)是最常用的詞,還有一些其他經(jīng)常使用的詞是模型,任務(wù),訓(xùn)練和數(shù)據(jù),因此,我們可以得出結(jié)論,機(jī)器學(xué)習(xí)是訓(xùn)練數(shù)據(jù)模型的任務(wù)。我們還可以在這里通過背景顏色方法更改背景顏色,并通過colormap方法更改字體顏色,還可以在背景顏色中添加顏色的哈希碼,但是mapcolor帶有內(nèi)置的特定顏色。讓我們通過使用哈希碼將背景色更改為藍(lán)綠色,將字體顏色更改為藍(lán)色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在這里,我指定了ocean,如果我添加了一些錯(cuò)誤的顏色圖,jupyter將拋出一個(gè)值錯(cuò)誤,并向我顯示顏色圖的可用選項(xiàng),如下所示:

我們還可以使用PIL庫在任何圖像中實(shí)現(xiàn)詞云。尾注在本文中,我們討論了詞云,詞云的定義,應(yīng)用領(lǐng)域以及使用python實(shí)現(xiàn)詞云。參考鏈接:https://www.a(chǎn)nalyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91867
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86744
  • 數(shù)據(jù)可視化

    關(guān)注

    0

    文章

    476

    瀏覽量

    10801
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)創(chuàng)建配置指南

    。HarmonyOS的AGC平臺(tái)提供靈活配置,支持Node.js、Python、Java等多種語言,還能自定義運(yùn)行環(huán)境哦! ?? 二、手把手創(chuàng)建第一個(gè)函數(shù) ??Step 1:進(jìn)入
    發(fā)表于 05-22 17:08

    使用Python API在OpenVINO?中創(chuàng)建了用于異步推理的自定義代碼,輸出張量的打印結(jié)果會(huì)重復(fù),為什么?

    使用 Python* API 在 OpenVINO? 中創(chuàng)建了用于異步推理的自定義代碼。 遇到輸出張量的打印結(jié)果會(huì)重復(fù)的問題,即使輸入圖像不同。
    發(fā)表于 03-06 07:53

    創(chuàng)建了用于OpenVINO?推理的自定義C++和Python代碼,從C++代碼中獲得的結(jié)果與Python代碼不同是為什么?

    創(chuàng)建了用于OpenVINO?推理的自定義 C++ 和 Python* 代碼。 在兩個(gè)推理過程中使用相同的圖像和模型。 從 C++ 代碼中獲得的結(jié)果與 Python* 代碼不同。
    發(fā)表于 03-06 06:22

    創(chuàng)建OpenVINO? Python腳本,運(yùn)行可執(zhí)行文件時(shí)遇到的報(bào)錯(cuò)怎么解決?

    創(chuàng)建OpenVINO? Python 腳本: from openvino.inference_engine import IECore ie = IECore() print(\"
    發(fā)表于 03-05 10:20

    運(yùn)行OVModelForCausalLM Python模塊時(shí)出錯(cuò)了,怎么解決?

    創(chuàng)建了一個(gè)自定義 Python* 代碼,類似于遵循 240-dolly-2-instruction 的 Jupyter 筆記本。 OVModelForCausalLM Python* 模塊運(yùn)行時(shí)出錯(cuò)。
    發(fā)表于 03-05 06:44

    操作指南:pytorch服務(wù)器怎么設(shè)置?

    設(shè)置PyTorch服務(wù)器需選擇平臺(tái),創(chuàng)建合適的GPU實(shí)例,安裝操作系統(tǒng)、Python及Anaconda,創(chuàng)建虛擬環(huán)境,根據(jù)CUDA版本安
    的頭像 發(fā)表于 02-08 10:33 ?356次閱讀

    搭建電腦,怎樣搭建電腦方便

    統(tǒng),實(shí)現(xiàn)資源的最大化利用,提高工作和學(xué)習(xí)的效率。這次給大家介紹怎樣搭建電腦方便? ? ?怎樣搭建電腦方便? ? ?Windows系統(tǒng)(以Windows10為例),開啟遠(yuǎn)程桌面功能:
    的頭像 發(fā)表于 02-06 10:08 ?431次閱讀
    搭建<b class='flag-5'>云</b>電腦,<b class='flag-5'>怎樣</b>搭建<b class='flag-5'>云</b>電腦方便

    hyper-v 備份,hyper-v怎樣進(jìn)行虛擬機(jī)的創(chuàng)建

    虛擬機(jī)技術(shù)打破了傳統(tǒng)計(jì)算機(jī)的限制,為我們帶來了全新的計(jì)算機(jī)模式。今天給大家介紹hyper-v怎樣進(jìn)行虛擬機(jī)的創(chuàng)建? ? ?hyper-v怎樣進(jìn)行虛擬機(jī)的創(chuàng)建? ? ?使用PowerSh
    的頭像 發(fā)表于 02-05 14:54 ?446次閱讀
    hyper-v 備份,hyper-v<b class='flag-5'>怎樣</b>進(jìn)行虛擬機(jī)的<b class='flag-5'>創(chuàng)建</b>

    私有電腦,怎樣成功搭建私有電腦

    ? ? 在信息時(shí)代,遠(yuǎn)程連接使我們能夠在不同的地點(diǎn)之間建立起緊密的聯(lián)系,實(shí)現(xiàn)資源的共享和協(xié)同工作。這次給大家介紹怎樣成功搭建私有電腦? ? ?怎樣成功搭建私有電腦? ? ?硬件準(zhǔn)備
    的頭像 發(fā)表于 01-24 10:14 ?453次閱讀
    私有<b class='flag-5'>云</b>電腦,<b class='flag-5'>怎樣</b>成功搭建私有<b class='flag-5'>云</b>電腦

    Python Connector for InterBase連接解決方案

    ,以對存儲(chǔ)的數(shù)據(jù)執(zhí)行創(chuàng)建、讀取、更新和刪除操作。該解決方案完全符合 Python DB API 2.0 規(guī)范,并作為 Windows、macOS 和 Linux 的 wheel 包分發(fā)。 特征 高性能
    的頭像 發(fā)表于 01-22 14:34 ?453次閱讀

    Flexus 服務(wù)器 X:Python 安裝的極致便捷之旅

    配置和環(huán)境設(shè)置方面,可能會(huì)遇到各種挑戰(zhàn)。為了幫助開發(fā)者更高效地使用 Flexus 服務(wù)器 X,本文將詳細(xì)介紹如何在 Flexus 服務(wù)器 X 上安裝 Python,并突出其便捷性。 一
    的頭像 發(fā)表于 01-07 17:00 ?348次閱讀
    Flexus <b class='flag-5'>云</b>服務(wù)器 X:<b class='flag-5'>Python</b> 安裝的極致便捷之旅

    華為 Flexus X 實(shí)例下的場景體驗(yàn)——小企業(yè)使用 Python 語言——超迅速搭建簡單公網(wǎng) API 接口服務(wù)

    ? 前言 小企業(yè)為了快速搞定一些接口功能如果不使用 Python 的話相對來說復(fù)雜度還是很高的,這里我來通過【華為 Flexus X 實(shí)例】來迅速的搭建一個(gè) Python 的 WebApi 示例
    的頭像 發(fā)表于 12-27 13:46 ?519次閱讀
    華為<b class='flag-5'>云</b> Flexus X 實(shí)例下的場景體驗(yàn)——小企業(yè)使用 <b class='flag-5'>Python</b> 語言——超迅速搭建簡單公網(wǎng) API 接口服務(wù)

    如何在Python中使用socket

    和UDP。 2. 創(chuàng)建Socket 在Python中,我們使用 socket 模塊來創(chuàng)建socket。以下是創(chuàng)建一個(gè)TCP socket的示例代碼: import socket #
    的頭像 發(fā)表于 11-01 16:10 ?739次閱讀

    利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN

    本文將詳細(xì)介紹如何利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN。
    的頭像 發(fā)表于 08-12 17:59 ?974次閱讀

    中國信通院發(fā)布“2024計(jì)算十大關(guān)鍵

    7月23日,由中國通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦,中國信息通信研究院(簡稱“中國信通院”)承辦的“2024可信大會(huì)”在京召開。大會(huì)上,中國信通院正式發(fā)布“2024計(jì)算十大關(guān)鍵”,中國信通院
    的頭像 發(fā)表于 08-02 08:28 ?1073次閱讀
    中國信通院發(fā)布“2024<b class='flag-5'>云</b>計(jì)算十大關(guān)鍵<b class='flag-5'>詞</b>”