千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > requests模塊

requests模塊

來源:千鋒教育
發布人:qyf
時間: 2022-09-20 17:01:59 1663664519

requests模塊

  爬蟲中通過什么模擬瀏覽器工作?重點來啦!那就是requests模塊。

  requests模塊

  requests文檔http://docs.python-requests.org/zh_CN/latest/index.html

  requests模塊的作用:

  • 發送http請求,獲取響應數據

  requests模塊是一個第三方模塊,需要在你的python(虛擬)環境中額外安裝

  • pip/pip3 install requests

  安裝完成之后我們就可以模擬瀏覽器向外發出請求了。

  如何實現呢?首先看一下發出get請求的代碼實現:

  # 需求:通過requests向百度首頁發送請求,獲取該頁面的源碼

  # 步驟1: 導入requests模塊

  import requests

  # 步驟2: 確定訪問目標url

  url = 'https://www.baidu.com'

  # 步驟3. 向目標url發送get請求

  response = requests.get(url)

  # 步驟4: 打印響應內容

  print(response.text)

  就這樣輕松的我們通過requests模塊跟百度打了一個“招呼”,但是說真的,挺假的!!!因為假裝的不像唄!

  所有瀏覽器在訪問百度的時候都是該帶都帶著,比如上面提到的請求行,請求頭或者請求體的內容。

  我們這個是赤裸裸的訪問哪,人家百度也挺好脾氣的,沒有說你是爬蟲我就不給你東西了。但是怎樣才能偽裝的更像一些呢。

  最基本的就是添加請求頭了,大家可以通過開發者工具中的Network自行觀察。

  我們這里怎么添加呢?

  大家運行代碼可以發現,會打印出很多的內容,那這個內容是什么呢?這就是服務器收到了你的請求,把你想要的東西給你了。

  我們打印出來看起來很亂,但是瀏覽器可是這些標簽的翻譯專家,所以瀏覽器上你看到的是一個百度的首頁面,但是我們通過程序看到的是像下面一樣的代碼。

  而通過瀏覽器的開發者工具Network看就整齊很多,因為瀏覽器就是干這個沒辦法。

  但是上面大家看到的只是響應體的內容,因為在HTTP協議中,響應也是分成了三部分:就是響應行,響應頭和響應體。我們在瀏覽器中看到的都是響應體的內容顯示。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
久久亚洲中文字幕精品一区四,亚洲日本另类欧美一区二区,久久久久久久这里只有免费费精品,高清国产激情视频在线观看
婷婷琪琪在线中文字幕 | 日韩免费在线中文字幕 | 亚洲人成电影福利在线播放 | 日韩精品中文天天射 | 亚洲AⅤ鲁丝一区二区三区 日韩欧美综合一区二区 | 亚洲日本视频在线观看 |