一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用Python抓取用戶發(fā)的話題

馬哥Linux運(yùn)維 ? 來源:腳本之家 ? 作者:j_hao104 ? 2021-09-05 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大多數(shù)APP里面返回的是json格式數(shù)據(jù),或者一堆加密過的數(shù)據(jù) 。這里以超級(jí)課程表APP為例,抓取超級(jí)課程表里用戶發(fā)的話題。

1、抓取APP數(shù)據(jù)包

表單:

表單中包括了用戶名和密碼,當(dāng)然都是加密過了的,還有一個(gè)設(shè)備信息,直接post過去就是。

另外必須加header,一開始我沒有加header得到的是登錄錯(cuò)誤,所以要帶上header信息。

2、登錄

登錄代碼:

import urllib2from cookielib import CookieJarloginUrl = ‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’headers = {‘Content-Type’: ‘a(chǎn)pplication/x-www-form-urlencoded; charset=UTF-8’,

‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}loginData =

‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()print loginResult

登錄成功 會(huì)返回一串賬號(hào)信息的json數(shù)據(jù)

和抓包時(shí)返回?cái)?shù)據(jù)一樣,證明登錄成功

3、抓取數(shù)據(jù)

用同樣方法得到話題的url和post參數(shù)

下見最終代碼,有主頁獲取和下拉加載更新??梢詿o限加載話題內(nèi)容。

#!/usr/local/bin/python2.7# -*- coding: utf8 -*-“”“超級(jí)課程表話題抓取”“”import urllib2from cookielib import CookieJarimport json‘’‘ 讀Json數(shù)據(jù) ’‘’def fetch_data(json_data):

data = json_data[‘data’]timestampLong = data[‘timestampLong’]messageBO = data[‘messageBOs’]topicList = []for each in messageBO:topicDict = {}if each.get(‘content’, False):

topicDict[‘content’] = each[‘content’]topicDict[‘schoolName’] = each[‘schoolName’]topicDict[‘messageId’] = each[‘messageId’]topicDict[‘gender’] = each[‘studentBO’][‘gender’]topicDict[‘time’] = each[‘issueTime’]print each[‘schoolName’],

each[‘content’]topicList.append(topicDict)return timestampLong, topicList‘’‘ 加載更多 ’‘’

def load(timestamp, headers, url):headers[‘Content-Length’] = ‘159’loadData = ‘timestamp=%s&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’ % timestampreq = urllib2.Request(url, loadData, headers)loadResult = opener.open(req)

.read()loginStatus = json.loads(loadResult).get(‘status’, False)if loginStatus == 1:print ‘load successful!’timestamp, topicList = fetch_data(json.loads(loadResult))load(timestamp, headers, url)else:print ‘load fail’print loadResultreturn FalseloginUrl =

‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’topicUrl =

‘http://120.55.151.61/V2/Treehole/Message/getMessageByTopicIdV3.action’headers = {‘Content-Type’: ‘a(chǎn)pplication/x-www-form-urlencoded; charset=UTF-8’,‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}

‘’‘ ---登錄部分--- ’‘’loginData = ‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()loginStatus = json.loads(loginResult).get(‘data’, False)if loginResult:print ‘login successful!’else:print ‘login fail’print loginResult‘’‘ ---獲取話題--- ’‘’topicData =

‘timestamp=0&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’headers[‘Content-Length’] = ‘147’topicRequest = urllib2.Request(topicUrl, topicData, headers)topicHtml = opener.open(topicRequest).read()topicJson = json.loads(topicHtml)topicStatus = topicJson.get(‘status’, False)print topicJsonif topicStatus == 1:print ‘fetch topic success!’timestamp, topicList = fetch_data(topicJson)load(timestamp, headers, topicUrl)

結(jié)果:

562957e4-0dd5-11ec-8fb8-12bb97331649.jpg

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91863
  • APP
    APP
    +關(guān)注

    關(guān)注

    33

    文章

    1586

    瀏覽量

    74245
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86741

原文標(biāo)題:利用Python爬蟲抓取手機(jī)APP的傳輸數(shù)據(jù)

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    拼多多電商 API 接口與競(jìng)品,數(shù)據(jù)抓取速度大較量

    在當(dāng)今電商行業(yè),數(shù)據(jù)抓取速度是衡量平臺(tái)競(jìng)爭力的核心指標(biāo)之一。高效的 API(應(yīng)用程序接口)能顯著提升數(shù)據(jù)分析、庫存管理和用戶個(gè)性化推薦的效率。本文將深入比較拼多多電商 API 接口與主要競(jìng)品(如淘寶
    的頭像 發(fā)表于 07-09 15:29 ?132次閱讀

    Allegro Skill布局功能之遠(yuǎn)程抓取器件介紹

    過使用“遠(yuǎn)程抓取器件”功能,用戶可以批量選取多個(gè)器件,隨后通過鼠標(biāo)左鍵逐個(gè)點(diǎn)擊放置,實(shí)現(xiàn)高效精準(zhǔn)的器件布局。該功能特別適用于在大規(guī)模芯片周邊配置去耦電容、電阻等元件,能夠快速將元件定位到目標(biāo)焊盤附近或芯片背面。
    的頭像 發(fā)表于 05-08 10:34 ?529次閱讀
    Allegro Skill布局功能之遠(yuǎn)程<b class='flag-5'>抓取</b>器件介紹

    如何獲取用于開發(fā)fx2的sdk和示例源代碼?

    大家好 我正在使用 FX2 設(shè)備,以前也使用過 FX3 設(shè)備。 使用 FX3 設(shè)備 SDK,當(dāng)我下載它時(shí),我在安裝文件夾中獲得了許多示例源代碼,但是它沒有 FX2 的示例源代碼,我如何獲取用于開發(fā) fx2 的 sdk 和示例源代碼?
    發(fā)表于 05-07 07:25

    復(fù)合機(jī)器人抓取精度的影響因素及提升策略

    復(fù)合機(jī)器人結(jié)合了移動(dòng)機(jī)器人(如AGV)和機(jī)械臂的功能,廣泛應(yīng)用于物流、制造等領(lǐng)域。抓取精度是其核心性能指標(biāo)之一,直接影響作業(yè)效率和產(chǎn)品質(zhì)量。本文將探討復(fù)合機(jī)器人抓取精度的影響因素及提升策略。
    的頭像 發(fā)表于 04-12 11:15 ?339次閱讀

    python入門圣經(jīng)-高清電子書(建議下載)

    和Pygal 等強(qiáng)大的Python 庫和工具介紹,以及列表、字典、if 語句、類、文件與異常、代碼測(cè)試等內(nèi)容; 第二部分將理論付諸實(shí)踐,講解如何開發(fā)三個(gè)項(xiàng)目,包括簡單的Python 2D 游戲開發(fā)如何利用數(shù)據(jù)
    發(fā)表于 04-10 16:53

    鴻蒙應(yīng)用元服務(wù)開發(fā)-Account Kit獲取華為賬號(hào)用戶信息概述

    詳細(xì)接入體驗(yàn)可參考Account Kit提供的SampleCode示例工程。 典型場(chǎng)景: 1、元服務(wù)需要完善用戶頭像信息,參見獲取頭像。 2、元服務(wù)提供的服務(wù)依賴用戶手機(jī)號(hào),需要獲取用戶手機(jī)號(hào),參見獲取
    發(fā)表于 04-02 11:10

    2025年電子行業(yè)值得關(guān)注的話題

    《What's Next》是安富利推出的全新數(shù)字讀物,面向任何想要了解電子行業(yè)未來發(fā)展趨勢(shì)的用戶,安富利憑借在全球市場(chǎng)的深厚積淀與廣泛影響力,為您精選最具前瞻性的議題,呈現(xiàn)精準(zhǔn)的市場(chǎng)趨勢(shì)、深刻的技術(shù)洞察。
    的頭像 發(fā)表于 02-18 17:36 ?906次閱讀

    把YOLOv11和Python Qt做個(gè)用戶界面程序

    早些時(shí)間,小編想把PID控制器優(yōu)化部分通過Py Qt來實(shí)現(xiàn)用戶界面化,不過看著窗口一堆參數(shù),有點(diǎn)發(fā)怵:這玩意誰用?。?參考《PID控制器參數(shù)自動(dòng)優(yōu)化示例和比較》 后來就擱置了。 在通過Python
    的頭像 發(fā)表于 11-28 10:18 ?1604次閱讀
    把YOLOv11和<b class='flag-5'>Python</b> Qt做個(gè)<b class='flag-5'>用戶</b>界面程序

    Python庫解析:通過庫實(shí)現(xiàn)代理請(qǐng)求與數(shù)據(jù)抓取

    Python中,有多個(gè)庫可以幫助你實(shí)現(xiàn)代理請(qǐng)求和數(shù)據(jù)抓取。這些庫提供了豐富的功能和靈活的API,使得你可以輕松地發(fā)送HTTP請(qǐng)求、處理響應(yīng)、解析HTML/XML/JSON數(shù)據(jù),以及進(jìn)行復(fù)雜的網(wǎng)絡(luò)操作。
    的頭像 發(fā)表于 10-24 07:54 ?486次閱讀

    如何利用海外爬蟲IP進(jìn)行數(shù)據(jù)抓取

    利用海外爬蟲IP進(jìn)行數(shù)據(jù)抓取需要綜合考慮多個(gè)方面。
    的頭像 發(fā)表于 10-12 07:54 ?595次閱讀

    如何利用python和API查詢IP地址?

    Python中,直接查詢IP地址的地理位置或詳細(xì)信息(如所屬國家、城市等)通常需要依賴外部API服務(wù),因?yàn)?b class='flag-5'>Python標(biāo)準(zhǔn)庫本身不提供直接查詢IP地址地理位置的功能。以下是一個(gè)使用requests
    發(fā)表于 08-28 11:55

    第二屆大會(huì)回顧第25期 | OpenHarmony上的Python設(shè)備應(yīng)用開發(fā)

    Python以其簡單、易學(xué)和功能強(qiáng)大而聞名,有著廣泛的用戶群體。采用Python開發(fā)有助于降低OpenHarmony的學(xué)習(xí)門檻。如何在OpenHarmony上用Python開發(fā)設(shè)備應(yīng)用
    的頭像 發(fā)表于 08-27 11:53 ?1217次閱讀
    第二屆大會(huì)回顧第25期 | OpenHarmony上的<b class='flag-5'>Python</b>設(shè)備應(yīng)用開發(fā)

    利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN

    本文將詳細(xì)介紹如何利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN。
    的頭像 發(fā)表于 08-12 17:59 ?974次閱讀

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而在深度學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 08-01 15:27 ?3282次閱讀

    如何長時(shí)間抓取DTU設(shè)備實(shí)時(shí)日志?

    如何長時(shí)間抓取DTU設(shè)備實(shí)時(shí)日志?
    發(fā)表于 07-26 06:31