一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

學(xué)習(xí)下如何去抓APP的數(shù)據(jù)

電子工程師 ? 來源:lq ? 2019-01-23 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)語】2019亞洲杯決賽正如火如荼進(jìn)行中,國足的晉級之路可謂用“驚現(xiàn)”二字評論。繼1月16日,國足對戰(zhàn)韓國隊(duì)敗北后,一名Python學(xué)習(xí)者為了一窺網(wǎng)友們的評論,特意爬了懂球帝App的數(shù)據(jù)。

最新喜訊是在20日國足對戰(zhàn)泰國的比賽中,成功逆轉(zhuǎn)戰(zhàn)勝泰國晉級八強(qiáng),無不驚喜。讓我們來學(xué)習(xí)下本文相關(guān)技術(shù)要點(diǎn)。

正文:

如果你是個(gè)足球迷的話,估計(jì)或多或少都會看一下昨晚中國踢韓國的比賽,因?yàn)椴还芩麄兲叩迷鯓?,我們還是深愛著他們,那句話說得好,“國足虐我千百遍,我待國足如初戀”。更何況他們兩場都踢贏了,所以面對第三場實(shí)力有點(diǎn)強(qiáng)的韓國隊(duì)也是希望能贏的,畢竟我們也在十二強(qiáng)賽上贏過他們!

如果你不是個(gè)足球迷,但你也可以看看,可以學(xué)習(xí)下如何去抓APP的數(shù)據(jù)。好了,廢話不多說,開始抓取!

1. 抓包分析請求

手機(jī)抓包我們可以用 Fiddler 軟件來抓取,如果不懂怎樣抓的話,可以看看這篇文章《抓包軟件 Fiddler 了解一下?》(文章鏈接:https://mp.weixin.qq.com/s/G7xjvoh77pwcsP1KNotxjw)

配置好之后,開始抓包。

首先找到需要爬取的文章

懂球帝app截圖

文章鏈接為:https://m.dongqiudi.com/article_share/896482.html

在配置好抓包之后,點(diǎn)擊下方的評論,可以看到

評論截圖

抓包截圖

很容易就找到文章評論的請求,就是下面這個(gè)

可以看到請求的鏈接為:https://api.dongqiudi.com/v2/article/896482/comment?sort=down&version=177,

請求方法為GET,接下來就好辦了,我們再看看滑下去查看更多的評論的請求。

可以看到,向下翻頁多了兩個(gè)參數(shù),不過容易知道,next參數(shù)就是一個(gè)時(shí)間戳,而pn參數(shù)就是頁數(shù)吧,從0開始的。

但是怎樣判斷所有評論已經(jīng)爬完了呢?我們可以看看數(shù)據(jù)的詳情,下面將 json 數(shù)據(jù)格式化,在下圖可以看到在 data 里面有下一頁的數(shù)據(jù),那這就容易了,哈哈

分析了,接下來就是代碼部分了。

2. 代碼部分

這是主體部分,先從第一個(gè)評論鏈接中爬取評論以及找出下一頁的評論地址進(jìn)而繼續(xù)爬取。這里是把數(shù)據(jù)庫存進(jìn) mongodb 中。

主要的爬取邏輯,可以看出來是比較簡單的,因?yàn)闆]有涉及到什么加密參數(shù)之類的,但是有一個(gè)問題,每一次進(jìn)行請求的時(shí)候,有時(shí)候是會返回帶有相同的評論的,所以我們也需要在數(shù)據(jù)庫簡單地進(jìn)行去重。

下面是入庫和去重的代碼部分

剩下的就沒有了。

3. 查看所得的數(shù)據(jù)

由于數(shù)據(jù)分析還不熟悉,所以暫時(shí)只制作詞云圖。

需要先將數(shù)據(jù)寫到文本上

詞云圖是:

可以看出,昨晚國足輸一場,也被很多人噴了,但是還是有很多人是一直支持的,永遠(yuǎn)都為國足加油,里面也說到了,中國和韓國是有一定差距的,而且還有點(diǎn)大,輸了也正常不過了,沒必要噴,再說我覺得昨晚的比賽已經(jīng)比第一場的比賽好很多(第二次沒看),還是有進(jìn)步的,我對國足未來淘汰賽也是充滿期望的,我相信能走得更遠(yuǎn)!

下一場踢泰國,20號,有人看嗎?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • APP
    APP
    +關(guān)注

    關(guān)注

    33

    文章

    1586

    瀏覽量

    74235
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4900

    瀏覽量

    70718
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86710

原文標(biāo)題:為了一窺國足輸韓國之后人們的評論,我爬了懂球帝App

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    CYUSB3014與PC通信幾小時(shí)后斷開,通過bus hound不到任何通信數(shù)據(jù),為什么?

    PC是WIN7系統(tǒng),PC端APP通過USB3與下位機(jī)通信幾個(gè)小時(shí)以后,通信就會斷開,通過bus hound不到任何通信數(shù)據(jù),出錯(cuò)時(shí)CYUSB芯片的心跳燈正常,PC的設(shè)備管理器設(shè)備也正常。 重新插拔 或禁用,再啟用以后,通信立刻
    發(fā)表于 06-04 08:27

    CC2530 packet sniffer 為什么不到,?

    我用packet sniffer 軟件包,芯片用的是CC2530,想協(xié)調(diào)器給終端設(shè)備發(fā)送的信道和pandid值,但是抓取不到,不知道為什么?只有MAXC層有數(shù)據(jù),NWK層和應(yīng)用層都沒有數(shù)據(jù)
    發(fā)表于 03-14 10:53

    Packet Sniffer包遇到的問題

    ??????? 我用的是CCDebuger +CC2531 USB Dongle,按照TI官方文檔的順序進(jìn)行包,每次出來的數(shù)據(jù)基本上全都是錯(cuò)的,按用戶指南說的是數(shù)據(jù)包解析錯(cuò)誤,但是具體要怎么
    發(fā)表于 06-01 02:30

    加密后包分析的問題?

    請問一,我的zigbee設(shè)備全部都開啟了加密, 使用包軟件包的時(shí)候,數(shù)據(jù)都是加密的,我應(yīng)該怎么解密分析這些數(shù)據(jù)呢,謝謝了
    發(fā)表于 06-01 14:22

    無線學(xué)習(xí)型紅外遙控器(APP藍(lán)牙控制,有APP安裝文件)

    ,鍵值保存到手機(jī) c、保存的鍵值用于發(fā)射控制實(shí)現(xiàn)功能1、紅外遙控器解碼功能2、紅外遙控器發(fā)射功能3、解碼保存功能(APP實(shí)現(xiàn))制作實(shí)物 學(xué)習(xí)狀態(tài),按遙控器按鍵,就行解碼,解碼數(shù)據(jù)傳給
    發(fā)表于 03-09 11:27

    wireshark數(shù)據(jù)分析問題

    用網(wǎng)絡(luò)調(diào)試助手作為Tcp Server給STM32F429發(fā)送數(shù)據(jù),每次傳輸完21845bytes后,就出現(xiàn)問題。用WireShark包的數(shù)據(jù)有些不太理解。上圖為用串口調(diào)試助手調(diào)試后的信息,每次傳輸?shù)?1846bytes就接收
    發(fā)表于 04-08 04:35

    如何使用Wireshark包工具呢

    Wireshark是什么?怎樣安裝一種Wireshark包工具?如何使用Wireshark包工具呢?
    發(fā)表于 09-17 06:31

    App是如何實(shí)現(xiàn)重啟的呢

    App是如何實(shí)現(xiàn)重啟的呢?如何實(shí)現(xiàn)App靜默安裝APK呢?
    發(fā)表于 02-10 07:52

    AVR入門: 如何使用App Note實(shí)現(xiàn)USART通訊?

    AVR入門: 使用App Note實(shí)行基于IRQ的USART通訊 (#18)
    的頭像 發(fā)表于 07-09 00:05 ?2556次閱讀

    Wireshark數(shù)據(jù)包網(wǎng)絡(luò)協(xié)議的分析

    Wireshark 是目前最受歡迎的包工具。它可以運(yùn)行在 Windows、Linux 及 MAC OS X 操作系統(tǒng)中,并提供了友好的圖形界面。同時(shí),Wireshark 提供功能強(qiáng)大的數(shù)據(jù)包功能
    發(fā)表于 10-12 08:00 ?1次下載
    Wireshark<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>抓</b>包網(wǎng)絡(luò)協(xié)議的分析

    推薦六款可提高學(xué)習(xí)效率的APP

    工欲善其事,必先利其器。好的學(xué)習(xí)App改變你的人生,開學(xué)了,來看看學(xué)霸們的App配置吧,抄下這份該抄的作業(yè)。
    的頭像 發(fā)表于 03-03 11:55 ?3810次閱讀

    USB數(shù)據(jù)包軟件程序下載

    USB數(shù)據(jù)包軟件程序下載
    發(fā)表于 09-09 16:01 ?9次下載

    淺析一KUKA機(jī)器人

    SPSMAKRO342 = M1-零件檢測沒有時(shí)打開夾,是用來進(jìn)行復(fù)位保證件前所有夾是打開的
    的頭像 發(fā)表于 11-07 10:36 ?1085次閱讀
    淺析一<b class='flag-5'>下</b>KUKA機(jī)器人<b class='flag-5'>抓</b>件

    APP不到包?

    其實(shí)如果不進(jìn)行客戶端安裝證書,也是可以包的,但是沒有信任的證書相當(dāng)于就是在路由上走一次,并沒有加解密過程,實(shí)際上還是客戶端與服務(wù)器端進(jìn)行加解密通信
    的頭像 發(fā)表于 08-03 16:45 ?1853次閱讀
    <b class='flag-5'>APP</b><b class='flag-5'>抓</b>不到包?

    如何抓取app數(shù)據(jù)包 網(wǎng)絡(luò)包原理及實(shí)現(xiàn)

    要實(shí)現(xiàn)對App的網(wǎng)絡(luò)數(shù)據(jù)包,需要監(jiān)控App與服務(wù)器交互之間的網(wǎng)絡(luò)節(jié)點(diǎn),監(jiān)控其中任意一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)(網(wǎng)卡),獲取所有經(jīng)過網(wǎng)卡中的數(shù)據(jù),對這些
    發(fā)表于 08-11 09:30 ?4305次閱讀
    如何抓取<b class='flag-5'>app</b><b class='flag-5'>數(shù)據(jù)</b>包 網(wǎng)絡(luò)<b class='flag-5'>抓</b>包原理及實(shí)現(xiàn)