职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
熟悉Flask、Django等主流web开发框架
熟练掌握mysql数据库,熟练运用es数据库
能够应用进程,协程技术加快采集速度,能够使用爬虫框架更好
爬虫基础能力扎实,熟练掌握requests 使用,能够处理常见的反爬措施,简单的js加密,验证码处理
使用代理ip,修改UA头,分析请求参数,模拟请求,各种容错机制
能够熟练使用xpath,正则提取html中数据,
熟练使用Selenium技术采集数据 (用于难度较大网站,并且数据总量不多的网站进行模拟翻页采集)
熟练掌握mysql数据库,熟练运用es数据库
能够应用进程,协程技术加快采集速度,能够使用爬虫框架更好
爬虫基础能力扎实,熟练掌握requests 使用,能够处理常见的反爬措施,简单的js加密,验证码处理
使用代理ip,修改UA头,分析请求参数,模拟请求,各种容错机制
能够熟练使用xpath,正则提取html中数据,
熟练使用Selenium技术采集数据 (用于难度较大网站,并且数据总量不多的网站进行模拟翻页采集)
工作地点
地址:北京海淀区金地华著中知大厦1
![](http://img.jrzp.com/jrzpfile/cityrcw/SearchJob/images/jg.png)
![](https://img.jrzp.com/images_server/comm/nan.png)
职位发布者
HR
知了育才(北京)科技有限公司
![](http://img.jrzp.com/jrzpfile/cityrcw/images/sfrz_yrz.png)
-
行业未知
-
公司规模未知
-
公司性质未知
-
北京朝阳青年路7号院达美中心