833个赞lxghost公众号不会告诉你,因为你笨
这篇文章和外面那些妖艳爬虫教程不一样,完全没有任何技术含量,只要你会上网,就能看懂本文(看不懂说明你笨...)如果你想爬知乎数据,已经有人写好了框架.比如@路人甲的zzy0531/Passer-zhihu....
文章57个评论
15个赞傅红雪高圆圆研究委员会政治局常委
难道不是搜索引擎吗...
问答5个回答
0个赞细雨傍晚让我再睡会儿
扯一堆理论也许不符合你的特定网站,题主给个网址,才好针对性测试和回答.
问答4个回答
3个赞Jianfeihit互联网手艺人
说说我的经验.我所说明的爬虫工作仅仅是发现url,以及下载url,并保存到服务器上.不包括解析工作(看到有个爬虫还负责解析的工作).在这个工作中,什么会是瓶颈呢?A、加载url(从url库中加载待爬取的url).B、保存page到服务器目录下面.C、防止反爬取.其中前两个是...
105个赞Python爱好者 (公众号:Python爱好者社区)人生苦短,我用Python!
对于很多对于不懂编程语言的GGMM来说,爬虫技术高深莫测.但是对于IT工程师来说,爬虫技术可以说信手拈来.虽然熟知爬虫技术,你是否知道它竟然可以做这么多这么牛逼哄哄的事情!1.利用爬虫技术...
文章15个评论
1个赞yugi li别思考了,你使这里弥漫着一股愚蠢的气息
上面的回答也是没什么营养啊.首先你要了解html的语法基础,然后其实主要是通过解析html来获取所需数据.对于http请求我比较推荐使用HttpClient,主要是简单,网上的介绍也比较多,就不赘述了.对于拿到的数据进行解析,这里通常会用到正则表达式,网上相关的内容也是...
问答8个回答
315个赞刘志军公众号:Python之禅
学任何一门技术,都应该带着目标去学习,目标就像一座灯塔,指引你前进,很多人学着学着就学放弃了,很大部分原因是没有明确目标,所以,在你准备学爬虫前,先问问自己为什么要学习爬虫.有些人...
文章17个评论
122个赞Larry有情怀→渴望做出一款颠覆性App的代码工作者
作者:小甲原文链接:因为爬虫,我的老板进监狱了2017.06.01号《中华人民共和国网络安全法》开始实施,这个安全法在爬虫的这一块宝地上掀一阵大风波,到处都在转这篇试图解读该规定的文章:「 ....
文章32个评论
59个赞崔斯特Python / 数据采集 / 皇马
更优阅读体验爬虫三步走(一)获取源码举个例子,爬一爬知乎日报的相关数据 知乎日报 - 每天 3 次,每次 7 分钟1、获取源码import requests url = 'http://daily.zhihu.com/' res = requests....
文章27个评论
9个赞知乎用户
最简单的方法,不登陆不让用,你只要登陆,管你什么IP,我都能追踪你.批量注册账号?我和手机卡绑定行不行代收验证码的猫池?对不起,语音验证码如果还有能力弄到一堆账号的,也就是真牛逼了,这种人要防吗?分分钟可以合作走起.
49k人关注|5229个问题
2894人关注|1090个问题
3899人关注|899个问题
6049人关注|205个问题
Correct me if I were wrong
游手好闲 东游西逛
谁的父亲死了,请你告诉我如何悲伤.
· 灵魂有位错 · 思想易漂移 ·
搜索帮助 官方微博 © 2019 SOGOU.COM 免责声明 隐私政策