一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Python爬去百度貼吧圖片并保存到本地

馬哥Linux運(yùn)維 ? 來源:lq ? 2018-12-03 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

描述:用Python爬去百度貼吧圖片并保存到本地。本人剛學(xué)爬蟲還不是很熟練,其中難點(diǎn)在于正則表達(dá)式的理解;

說明

01

獲取整個(gè)頁面數(shù)據(jù)

Urllib 模塊提供了讀取web頁面數(shù)據(jù)的接口,我們可以像讀取本地文件一樣讀取www和ftp上的數(shù)據(jù)。首先,我們定義了一個(gè)getHtml()函數(shù):

urllib.urlopen()方法用于打開一個(gè)URL地址。

read()方法用于讀取URL上的數(shù)據(jù),向getHtml()函數(shù)傳遞一個(gè)網(wǎng)址,并把整個(gè)頁面下載下來。執(zhí)行程序就會(huì)把整個(gè)網(wǎng)頁打印輸出。

02

篩選頁面中想要的數(shù)據(jù)

Python 提供了非常強(qiáng)大的正則表達(dá)式,我們需要先要了解一點(diǎn)python 正則表達(dá)式的知識(shí)才行。假如我們百度貼吧找到了幾張漂亮的壁紙,通過到前段查看工具。找到了圖片的地址,如:src=”http://imgsrc.baidu.com/forum……jpg”pic_ext=”jpeg”

我們又創(chuàng)建了getImg()函數(shù),用于在獲取的整個(gè)頁面中篩選需要的圖片連接。re模塊主要包含了正則表達(dá)式:

re.compile() 可以把正則表達(dá)式編譯成一個(gè)正則表達(dá)式對(duì)象.

re.findall() 方法讀取html 中包含 imgre(正則表達(dá)式)的數(shù)據(jù)。

運(yùn)行腳本將得到整個(gè)頁面中包含圖片的URL地址。

03

將頁面篩選的數(shù)據(jù)保存到本地

通過一個(gè)for循環(huán)對(duì)獲取的圖片連接進(jìn)行遍歷,為了使圖片的文件名看上去更規(guī)范,對(duì)其進(jìn)行重命名,命名規(guī)則通過x變量加1。保存的位置默認(rèn)為程序的存放目錄。

程序運(yùn)行完成,將在目錄下看到下載到本地的文件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86739
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    7505

原文標(biāo)題:Python爬取百度貼吧圖片

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    怎樣Labview將AVI視頻轉(zhuǎn)換成圖片序列保存到指定文件夾

    怎么樣Labview 將一段AVI視頻轉(zhuǎn)換成圖片序列保存到指定文件夾。
    發(fā)表于 11-05 17:45

    python實(shí)現(xiàn)網(wǎng)頁爬蟲圖片

    非常強(qiáng)大的正則表達(dá)式,我們需要先要了解一點(diǎn)python 正則表達(dá)式的知識(shí)才行。re模塊中一些重要的函數(shù):假如我們百度找到了幾張漂亮的壁紙,通過到前段查看工具。找到了
    發(fā)表于 04-05 15:32

    百度競(jìng)價(jià)排名這件事你怎么看?

    `魏則西事件炸出了百度競(jìng)價(jià)排名的黑幕但事實(shí)上百度競(jìng)價(jià)排名并不是什么新鮮玩意相信很多喜歡百度一下的親們都知道很多情況下搜索排名的前幾條都不是你想要的答案小編曾經(jīng)年少無知的時(shí)候也曾錯(cuò)信過
    發(fā)表于 05-03 15:24

    Python助力百度無人車 人工智能時(shí)代到來

    今年7月份,在“百度AI開發(fā)者大會(huì)”上,百度CEO李彥宏親自乘坐百度無人車,在真實(shí)路況下演示了百度無人駕駛技術(shù),預(yù)示著人工智能時(shí)代的到來。百度
    發(fā)表于 12-13 14:48

    使用Python爬蟲實(shí)現(xiàn)百度圖片自動(dòng)下載的方法

    如何用Python爬蟲實(shí)現(xiàn)百度圖片自動(dòng)下載?
    發(fā)表于 05-23 14:55

    百度API調(diào)用(三)——語音識(shí)別 精選資料推薦

    需要的服務(wù),簡(jiǎn)單填寫應(yīng)用描述即可創(chuàng)建6、創(chuàng)建完成后可以在應(yīng)用列表中管理或者刪除你所創(chuàng)建的應(yīng)用7、需要開啟對(duì)應(yīng)服務(wù)才可以使用點(diǎn)擊立即領(lǐng)取即可獲得免費(fèi)調(diào)用次數(shù)(十幾萬次對(duì)于個(gè)人學(xué)習(xí)使用足夠了) 二、python實(shí)現(xiàn)百度語音識(shí)別實(shí)例:(發(fā)送已經(jīng)
    發(fā)表于 08-18 06:44

    怎么開通百度語音技術(shù)接口服務(wù)?

    怎么開通百度語音技術(shù)接口服務(wù)?python實(shí)現(xiàn)百度語音識(shí)別的步驟是怎樣的?
    發(fā)表于 11-22 07:18

    百度推出兩大社區(qū)商城 試水虛擬道具交易

    百度推出兩大社區(qū)商城 試水虛擬道具交易 百度昨日下午對(duì)外宣布,正式推出“商城”服務(wù),這也是百度繼“知道商城”之后推出的第二大道具
    發(fā)表于 04-01 09:46 ?691次閱讀

    百度宣布“百度AI加速器”開營(yíng),選擇免費(fèi)開放AI相關(guān)技能

    今年的百度專注于AI研發(fā),據(jù)報(bào)道,百度已經(jīng)宣布“百度AI加速器”開營(yíng),選擇免費(fèi)開放,讓開發(fā)者摸索AI的落地模式。據(jù)悉,目前在語音技術(shù)上跟
    發(fā)表于 12-10 10:55 ?1344次閱讀

    Python就是強(qiáng)大直接無視百度文庫(kù)VIP,付費(fèi)文檔免費(fèi)下載!

    最近要用到百度文庫(kù)查資料,但是很多都需要付費(fèi)VIP或者下載券,還不能復(fù)制,就有點(diǎn)苦逼!還好小編會(huì)Python,在Python面前真的所有VIP都是小意思,啥視頻網(wǎng)站,資料網(wǎng)站等等,統(tǒng)統(tǒng)無視收費(fèi)機(jī)
    發(fā)表于 10-28 20:55 ?8437次閱讀

    百度回應(yīng)身份證事件:高壓打擊相關(guān)違法行為

    速途網(wǎng)11月28日消息(報(bào)道:李楠) 今日,針對(duì)有媒體報(bào)道稱不法分子在百度發(fā)布收售身份證的違法信息,百度
    發(fā)表于 11-30 12:41 ?536次閱讀

    Python將二維數(shù)組輸出為圖片

    使用Python讀取二維數(shù)組,將二維數(shù)組輸出為圖片,保存本地
    的頭像 發(fā)表于 01-11 16:18 ?1719次閱讀
    <b class='flag-5'>Python</b>將二維數(shù)組輸出為<b class='flag-5'>圖片</b>

    Python圖片輸出為二維數(shù)組保存到txt中

    使用Python圖片輸出為二維數(shù)組,保存到txt文件中。
    的頭像 發(fā)表于 01-11 16:21 ?1956次閱讀

    百度搜索重磅推出AI圖片助手

    近日,百度搜索全新上線了一款名為“百度AI圖片助手”的智能工具,該工具賦予了用戶一鍵處理圖片的強(qiáng)大能力。無論是搜索中的圖片還是用戶自主上傳的
    的頭像 發(fā)表于 05-06 10:20 ?2418次閱讀

    HarmonyOS實(shí)戰(zhàn):一招搞定保存圖片到相冊(cè)

    保存圖片功能幾乎是每個(gè)應(yīng)用程序必備的功能之一,當(dāng)用戶遇到喜歡的圖片時(shí)可以保存到手機(jī)相冊(cè)。那么在鴻蒙中保存
    的頭像 發(fā)表于 06-24 17:04 ?176次閱讀