一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python中urllib3庫和requests庫的使用

python爬蟲知識(shí)分享 ? 來源:python爬蟲知識(shí)分享 ? 作者:python爬蟲知識(shí)分享 ? 2022-03-21 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Python3 默認(rèn)提供了urllib庫,可以爬取網(wǎng)頁信息,但其中確實(shí)有不方便的地方,如:處理網(wǎng)頁驗(yàn)證和Cookies,以及Hander頭信息處理。

為了更加方便處理,有了更為強(qiáng)大的庫 urllib3requests, 本節(jié)會(huì)分別介紹一下,以后我們著重使用requests。

1. urllib3庫的使用:

  • 安裝:通過使用pip命令來安裝urllib3
    pip install urllib3
  • 簡單使用:
import urllib3
import re

# 實(shí)例化產(chǎn)生請求對象
http = urllib3.PoolManager()

# get請求指定網(wǎng)址
url = "http://www.baidu.com"
res = http.request("GET",url)

# 獲取HTTP狀態(tài)碼
print("status:%d" % res.status)

# 獲取響應(yīng)內(nèi)容
data = res.data.decode("utf-8")

# 正則解析并輸出
print(re.findall("
",data))
  • 其他設(shè)置: 增加了超時(shí)時(shí)間,請求參數(shù)等設(shè)置
import urllib3
import re

url = "http://www.baidu.com"
http = urllib3.PoolManager(timeout = 4.0) #設(shè)置超時(shí)時(shí)間

res = http.request(
       "GET",
        url,
        #headers={
        #    'User-Agent':'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
        #},
        fields={'id':100,'name':'lisi'}, #請求參數(shù)信息
    )

print("status:%d" % res.status)

data = res.data.decode("utf-8")

print(re.findall("
",data))

2. requests庫的使用:

  • 安裝:通過使用pip命令來安裝requests
    pip install requests
  • 簡單使用:
import requests
import re

url = "http://www.baidu.com"

# 抓取信息
res = requests.get(url)

#獲取HTTP狀態(tài)碼
print("status:%d" % res.status_code)

# 獲取響應(yīng)內(nèi)容
data = res.content.decode("utf-8")

#解析出結(jié)果
print(re.findall("
",data))

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 信息
    +關(guān)注

    關(guān)注

    0

    文章

    407

    瀏覽量

    35949
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86656
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AD封裝安裝教程

    電子發(fā)燒友網(wǎng)站提供《AD封裝安裝教程.pdf》資料免費(fèi)下載
    發(fā)表于 06-19 15:35 ?3次下載

    3D AD文件

    3D文件
    發(fā)表于 05-28 13:57 ?5次下載

    AD封裝3D元件

    AD封裝分享
    發(fā)表于 02-10 15:37 ?30次下載

    使用Python實(shí)現(xiàn)xgboost教程

    裝: bash復(fù)制代碼conda install -c conda-forge xgboost 2. 導(dǎo)入必要的 在你的Python腳本或Jupyter Notebook,導(dǎo)入必要的
    的頭像 發(fā)表于 01-19 11:21 ?1345次閱讀

    適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)

    和 MariaDB 數(shù)據(jù)服務(wù)器以及托管數(shù)據(jù)服務(wù),以對存儲(chǔ)的數(shù)據(jù)執(zhí)行創(chuàng)建、讀取、更新和刪除操作。該解決方案完全實(shí)現(xiàn)了 Python DB API 2.0 規(guī)范,并作為 Windows、macOS
    的頭像 發(fā)表于 01-17 12:18 ?483次閱讀
    適用于MySQL和MariaDB的<b class='flag-5'>Python</b>連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)<b class='flag-5'>庫</b>

    適用于Oracle的Python連接器:可訪問托管以及非托管的數(shù)據(jù)

    適用于 Oracle 的 Python 連接器 適用于 Oracle 的 Python 連接器是一種可靠的連接解決方案,用于從 Python 應(yīng)用程序訪問 Oracle 數(shù)據(jù)服務(wù)器和
    的頭像 發(fā)表于 01-14 10:30 ?461次閱讀

    云數(shù)據(jù)是哪種數(shù)據(jù)類型?

    云數(shù)據(jù)是一種部署在虛擬計(jì)算環(huán)境的數(shù)據(jù),它融合了云計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)服務(wù)。云數(shù)據(jù)主要分為兩大類:關(guān)系型
    的頭像 發(fā)表于 01-07 10:22 ?499次閱讀

    數(shù)據(jù)事件觸發(fā)的設(shè)置和應(yīng)用

    數(shù)據(jù)無論對于生產(chǎn)管理還是很多的實(shí)際應(yīng)用都非常重要。小編這次聊一下數(shù)據(jù)事件觸發(fā)的應(yīng)用。示例使用了postgresql和Python
    的頭像 發(fā)表于 12-13 15:14 ?625次閱讀

    HAL和標(biāo)準(zhǔn)的區(qū)別 HAL與CMSIS的關(guān)系

    在嵌入式系統(tǒng)開發(fā),HAL(硬件抽象層)和標(biāo)準(zhǔn)是兩種常用的軟件,它們在功能和使用場景上有所不同。 1. 標(biāo)準(zhǔn) 標(biāo)準(zhǔn)
    的頭像 發(fā)表于 12-02 14:02 ?3216次閱讀

    KiCon演講回顧(六):Würth Elektronik KiCad 設(shè)計(jì)與管理

    .wrl和.step兩種格式。 需要的操作: 重命名 縮放 改變坐標(biāo)系 導(dǎo)出.wrl和.step文件。 解決方法:使用 Python 腳本實(shí)現(xiàn)自動(dòng)化 挑戰(zhàn)2:封裝 器件信息數(shù)據(jù)Python腳本自動(dòng)化。
    的頭像 發(fā)表于 11-26 01:08 ?619次閱讀
    KiCon演講回顧(六):Würth Elektronik KiCad <b class='flag-5'>庫</b>設(shè)計(jì)與管理

    NVIDIA發(fā)布cuPyNumeric加速計(jì)算

    該加速計(jì)算幫助科研人員無縫地?cái)U(kuò)展到強(qiáng)大的計(jì)算集群,并且無需修改 Python 代碼,推進(jìn)科學(xué)發(fā)現(xiàn)。
    的頭像 發(fā)表于 11-21 10:05 ?652次閱讀

    Python解析:通過實(shí)現(xiàn)代理請求與數(shù)據(jù)抓取

    Python,有多個(gè)可以幫助你實(shí)現(xiàn)代理請求和數(shù)據(jù)抓取。這些提供了豐富的功能和靈活的API,使得你可以輕松地發(fā)送HTTP請求、處理響應(yīng)、解析HTML/XML/JSON數(shù)據(jù),以及進(jìn)
    的頭像 發(fā)表于 10-24 07:54 ?480次閱讀

    如何利用python和API查詢IP地址?

    Python,直接查詢IP地址的地理位置或詳細(xì)信息(如所屬國家、城市等)通常需要依賴外部API服務(wù),因?yàn)?b class='flag-5'>Python標(biāo)準(zhǔn)本身不提供直接查詢IP地址地理位置的功能。以下是一個(gè)使用
    發(fā)表于 08-28 11:55

    擺脫自建的繁瑣,EDA元件轉(zhuǎn)cadence原理圖封裝實(shí)戰(zhàn)技巧

    擺脫自建的繁瑣,EDA元件轉(zhuǎn)cadence原理圖封裝實(shí)戰(zhàn)技巧
    的頭像 發(fā)表于 08-24 12:29 ?6538次閱讀
    擺脫自建<b class='flag-5'>庫</b>的繁瑣,EDA元件<b class='flag-5'>庫</b>轉(zhuǎn)cadence原理圖封裝<b class='flag-5'>庫</b>實(shí)戰(zhàn)技巧

    PADS-3D文件

    PADS-3D文件
    發(fā)表于 08-15 17:20 ?39次下載