说说爬虫20200508-09

还算挺成功的

20200508

在网上随便瞎翻,发现一个八爪鱼采集空间说说的教程,然后下载用了一下发现都是爬虫的原理,但是是可视化的,不需要了解爬虫内部的操作,然后就拿来试。

成功爬取1500多条空间说说信息。

Mood Crawler 1

但是这版除了没法看时间以外,一些长文还没法爬全。

20200509

所以第二版来了。

经过不断的尝试和几次改进,有了如下成品

这版用了自动识别和把每一个说说都点击查看全文的方法,把说说的许多信息都爬下来了。但是评论还没有想好要怎么爬,也许到时候可以用python爬,毕竟这个软件也不是特别好用。

还不错呢

  • Copyrights © 2020-2023 STDquantum