欧美三级国产三级日韩三级_亚洲熟妇丰满大屁股熟妇_欧美亚洲成人一区二区三区_国产精品久久久久久模特

Python|抓取微信公眾號的問題 - 新聞資訊 - 云南小程序開發(fā)|云南軟件開發(fā)|云南網(wǎng)站建設(shè)-昆明葵宇信息科技有限公司

159-8711-8523

云南網(wǎng)建設(shè)/小程序開發(fā)/軟件開發(fā)

知識

不管是網(wǎng)站,軟件還是小程序,都要直接或間接能為您產(chǎn)生價值,我們在追求其視覺表現(xiàn)的同時,更側(cè)重于功能的便捷,營銷的便利,運營的高效,讓網(wǎng)站成為營銷工具,讓軟件能切實提升企業(yè)內(nèi)部管理水平和效率。優(yōu)秀的程序為后期升級提供便捷的支持!

您當(dāng)前位置>首頁 » 新聞資訊 » 公眾號相關(guān) >

Python|抓取微信公眾號的問題

發(fā)表時間:2020-10-17

發(fā)布人:葵宇科技

瀏覽次數(shù):78

歡迎點擊「算法與編程之美」↑關(guān)注我們!

本文首發(fā)于微信公眾號:"算法與編程之美",歡迎關(guān)注,及時了解更多此系列文章。

歡迎加入團隊圈子!與作者面對面!直接點擊!

前言

對于抓取微信公眾號文章主要通過代理ip抓包進行的操作,總會出現(xiàn)一些問題,以下問題導(dǎo)致無法抓包。

解決方案

微信賬號無法抓包問題:

{'ret': -6, 'errmsg': 'unknownerror', 'home_page_list': []}

對于微信賬號無法抓包問題,主要出現(xiàn)在python請求代碼的問題。

當(dāng)我們所get所返回到的響應(yīng)內(nèi)容出現(xiàn)'msg_count':0值時,代表當(dāng)前頁面所獲取的文章為零,這時如果沒有停止get請求,即一直發(fā)送get請求;

在發(fā)送一定次數(shù)時就會出現(xiàn){'ret':-6, 'errmsg': 'unknown error', 'home_page_list': []}響應(yīng),get不到我們想要得到的數(shù)據(jù)。

我們這時會發(fā)現(xiàn)如果再用該微信賬號去抓取其它的公眾號get就會直接返回{'ret': -6, 'errmsg': 'unknown error', 'home_page_list': []}響應(yīng),猜測:此時賬號被服務(wù)器識別,無法返回響應(yīng)。當(dāng)換了一個微信賬號時,成功返回并抓到了響應(yīng)的數(shù)據(jù)。故得出結(jié)論:當(dāng)我們在返回值中出現(xiàn)'msg_count':0時,未終止程序,繼續(xù)get就會出現(xiàn)賬號無法抓取數(shù)據(jù)包的情況,期限是1天,1天后即可繼續(xù)抓取。

請求發(fā)送過快

當(dāng)請求發(fā)送過快時,也會導(dǎo)致請求響應(yīng)得不到相應(yīng)的數(shù)據(jù)。將sleep的時間設(shè)為1、1.5、2秒分別實驗后,發(fā)現(xiàn)當(dāng)時間設(shè)為1、1.5時,均出現(xiàn)了得不到響應(yīng)數(shù)據(jù)的報錯,只是1.5秒比1秒所得到的數(shù)據(jù)多一些。最后發(fā)現(xiàn)設(shè)為2秒后,沒有出現(xiàn)得不到數(shù)據(jù)包而報錯的情況。結(jié)論:將sleep=2時,即抓取每一篇文章的間隙設(shè)為2秒時,不會出現(xiàn)抓取過快的情況。

總結(jié)

該博客主要是講述小編在抓取微信公眾號所遇到的主要的問題,即發(fā)送請求的相關(guān)問題,希望對讀者有所幫助。

END

編 輯 | 王文星

責(zé) 編 | WZY

能力越強,責(zé)任越大。實事求是,嚴謹細致。

——where2go 團隊



微信號:算法與編程之美

長按識別二維碼關(guān)注我們!

溫馨提示:點擊頁面右下角“寫留言”發(fā)表評論,期待您的參與!期待您的轉(zhuǎn)發(fā)!

相關(guān)案例查看更多