知識
不管是網(wǎng)站,軟件還是小程序,都要直接或間接能為您產(chǎn)生價值,我們在追求其視覺表現(xiàn)的同時,更側(cè)重于功能的便捷,營銷的便利,運營的高效,讓網(wǎng)站成為營銷工具,讓軟件能切實提升企業(yè)內(nèi)部管理水平和效率。優(yōu)秀的程序為后期升級提供便捷的支持!
您當前位置>首頁 » 新聞資訊 » 公眾號相關(guān) >
windows微信公眾號采集系統(tǒng)
發(fā)表時間:2020-11-5
發(fā)布人:葵宇科技
瀏覽次數(shù):91
微信采集系統(tǒng)項目文檔
- 環(huán)境配置
- 1. mitmproxy安裝:
- 2. windows本地代理:
- 3. 數(shù)據(jù)庫
- 4. 本地模塊
- 準備工作
- 啟動測試
- 目錄結(jié)構(gòu)
采集目標: 微信公眾號文章的閱讀數(shù)、在看數(shù)、評論數(shù)、評論列表,還有微信公眾號的賬號基本信息。
采集難點: 采集以上數(shù)據(jù)需要客戶端的一些參數(shù),比如 x-wechat-key 、 __biz 、appmsg_token 、pass_ticket等。
采集方式: 通過Windows客戶端+mitmproxy的方式獲取加密參數(shù)
采集流程:
備注: 一個微信號每天只能獲取5000-8000篇文章的閱讀/點贊/評論等數(shù)據(jù)
github: https://github.com/lixi5338619/weixin-spider
環(huán)境配置
1. mitmproxy安裝:
在python3下直接使用pip進行安裝,如果下載緩慢需要換源下載。
pip install mitmproxy==4.0.4 --use-feature=2020-resolver
安裝完成之后,在cmd命令行中輸入 mitmdump ,默認是8080端口。
mitmdump
啟動成功后,下載mitm證書:訪問 http://mitm.it/
點擊windows,下載安裝。
如果網(wǎng)頁顯示 If you can see this, traffic is not passing through mitmproxy。
按照第二步設(shè)置windows本地代理后再次安裝。
2. windows本地代理:
windows10本地: 設(shè)置 ==> 網(wǎng)絡(luò) ==> 代理 ==> 手動設(shè)置代理 中打開使用代理并將IP地址修改為127.0.0.1 端口修改為默認8080或修改后的端口。 (記得點擊保存)
3. 數(shù)據(jù)庫
mysql: 下載完成之后啟動服務(wù),修改項目settings配置文件,創(chuàng)建數(shù)據(jù)庫weixin_spider,字符集utf8mb4。
create database weixin_spider DEFAULT CHARACTER SET utf8mb4;
redis: 下載安裝后啟動服務(wù),修改項目settings配置文件,以及addons.py文件。
4. 本地模塊
參照 requirements文件安裝 python庫,如有遺漏,根據(jù)提示自行安裝
準備工作
首先確定使用環(huán)境安裝完畢,然后請確保端口(5000、8080)不沖突。
1、確定mysql 、redis服務(wù)開啟狀態(tài),并可正常連接
2、運行 webapp\models.py 文件創(chuàng)建數(shù)據(jù)庫表,查看表結(jié)構(gòu)是否生成正確
3、登錄微信PC版,找到 文件傳輸助手 對話框, 雙擊 文件傳輸助手 ,文件傳輸助手會自動彈出單獨的對話窗口,把對話框鎖死在屏幕左上角,具體位置可能需要根據(jù)顯示器調(diào)整。
4、依次運行py腳本(亦可運行.sh文件代替)
- 運行 wx_monitor.py ,確定程序是否成功啟動
- 運行 manage.py ,打開網(wǎng)頁 http://127.0.0.1:5000/ ,確認成功開啟web服務(wù)。
5、開啟mitmproxy,確保可以攔截到數(shù)據(jù)(需要cd到tools目錄下)
cd tools/ && mitmdump -s ./addons.py --ssl-insecure
啟動測試
準備工作完成之后,訪問 http://127.0.0.1:5000/ 。
添加公眾號,該公眾號需要微信已經(jīng)關(guān)注過。
點擊啟動,即可進行采集。
目錄結(jié)構(gòu)
weixin-spider
│ manage.py (web服務(wù)啟動文件)
│ README.md (項目說明文檔)
│ requirements.txt (項目安裝包)
│ wx_monitor.py (任務(wù)調(diào)度中心)
│
├─api
│ │ crawlerapi.py (爬蟲文件)
│ │ init.py
│ │
├─exceptions (異常捕獲目錄)
│
├─tools
│ │ addons.py (mitm配置)
│ │ handle.py (自動化操作)
│ │ keys.py (redis-keys管理)
│ │ proxy.py (本地代理)
│
├─webapp
│ │ models.py (數(shù)據(jù)庫表模型)
│ │ _init_.py
│ ├─static (靜態(tài)資源目錄)
│ ├─templates(html文件目錄)
│ │
│ ├─wxapp
│ │ │ selffilter.py (過濾器)
│ │ │ views.py (視圖文件、接口)
相關(guān)案例查看更多
相關(guān)閱讀
- 網(wǎng)站排名優(yōu)化
- 昆明網(wǎng)站設(shè)計
- 網(wǎng)站建設(shè)公司地址
- web前端
- 政府網(wǎng)站建設(shè)服務(wù)
- 英文網(wǎng)站建設(shè)公司
- 云南小程序開發(fā)制作公司
- 網(wǎng)站建設(shè)方法
- 保險網(wǎng)站建設(shè)公司
- 手機網(wǎng)站建設(shè)
- 網(wǎng)站建設(shè)案例
- 網(wǎng)頁制作
- 軟件定制
- 汽車拆解管理系統(tǒng)
- 開通微信小程序被騙
- 重慶網(wǎng)站建設(shè)公司
- 商標
- 麗江小程序開發(fā)
- 小程序開發(fā)排名前十名
- 報廢車回收管理系統(tǒng)
- 小程序開發(fā)課程
- 小程序表單
- 報廢車拆解軟件
- SEO
- 網(wǎng)絡(luò)公司排名
- 云南網(wǎng)站建設(shè)哪家強
- Web開發(fā)框架
- 云南網(wǎng)站建設(shè)列表網(wǎng)
- 生成海報
- 昆明網(wǎng)站建設(shè)公司