# qq空间爬虫 **Repository Path**: alanbrooke/qq_space_crawler ## Basic Information - **Project Name**: qq空间爬虫 - **Description**: 使用python+mysql+wordcloud做的一个简单分析。把学习的作业(中国大学:玩转数据课程中最后一个项目,自定义主题项目)拿出来单独一个项目。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 6 - **Forks**: 1 - **Created**: 2018-11-25 - **Last Updated**: 2024-04-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # qq空间爬虫 #### 项目介绍 使用python+mysql+wordcloud做的一个简单分析 #### 实现步骤 1. 使用webdriver登陆自己的qq空间并获取cookies:很重要,cookie里面的参数在后面获取信息的时候(请求)起到重要作用 2. 获取g_tk值。参考:https://blog.csdn.net/Vision_Tung/article/details/78888695 3. 获取qzondetoken值。返回界面中有相应js脚本:window.g_qzonetoken = (function(){ try{return "*********";} catch(e) {var xhr = new XMLHttpRequest();xhr.withCredentials = true;xhr.open('post', '//h5.qzone.qq.com/log/post/error/qzonetoken', true);xhr.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded');xhr.send(e);}})(); 4. 获取到所有qq好友。有一个特定的请求地址【必需参数:g_tk、qzondetoken】 5. 根据好友qq进行爬取【必需参数:g_tk、qzondetoken、pos】 6. 数据进本地mysql数据库 7. 所有数据爬取完成之后,进行数据库读取并执行执行 “词云” 绘制 8. 程序结束