如何使用爬虫抓取微信微信官方账号的内容?

过程很复杂,步骤如下:

1.写一个按键向导脚本,自动点击手机上的公共文章列表页面,即“查看历史新闻”;

2.利用fiddler代理劫持手机的访问,将URL转发到用php编写的本地网页;

3.将接收到的URL备份到php网页上的数据库中;

4.使用python从数据库中检索URL,然后正常抓取。

如果你只是想抓取一篇文章的内容,似乎没有访问频率限制,但如果你想抓取阅读数和点赞数,超过一定频率后,返回就会变成null。我设置的时间间隔是10秒,可以正常抓取。这样的频率,一个小时只能抓取360篇文章,没有实际意义。

微信微信官方账号数据存储

1.对于您未能在本服务中删除或存储相关数据,腾讯概不负责。

2.腾讯有权根据实际情况决定本服务中单个用户数据的最大存储期限,并在服务器上分配数据的最大存储空间。您可以根据自己的需要备份该服务中的相关数据。

3.如果您停止使用本服务或本服务被终止或取消,腾讯可以从服务器上永久删除您的数据。在服务停止、终止或取消后,腾讯没有义务向您返还任何数据。