Skip to content

longhongjun/Zhihu_Diedai

Repository files navigation

知乎爬虫

软件语言:C++

使用迭代方法对知乎用户进行遍历,获取其关注、赞同、提问、回答总数。

在第八版中,每6600个链接请求中只会有447个错误,基本能保持100kb/s的下载速度,有线校园网下可以达到300kb/s

在第一次读取的1377条记录中只有13个人无法正确解析其信息,原因是因为并发连接数过多(以刘新征为起点http://www.zhihu.com/people/liuxinzheng)

基本框架已搭建完成,并已获取到了知乎在11月3日的全部断点数据。项目已暂停(#其实真相是数据量太大再爬一次的话这个月流量不够用了我会乱说嘛#)

Having Fun~

About

使用迭代方法对知乎用户进行遍历

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published