电话:18529292929
关闭
00525-高级爬虫工程师 5000-3 收藏 申请职位
您当前的位置: 首页 > 职位列表 > 职位详情

00525-高级爬虫工程师

5000-3
江苏-淮安 | 不限经验 | 本科学历
91
2019-03-21 更新 被浏览:
分享
微信扫一扫:分享
↑微信扫上方二维码↑
便可将本文分享至朋友圈
联系方式
经理
地址:景平大街与通济路交汇丰树空港新城物流园
职位描述
招聘人数:1-3人 到岗时间:不限 年龄要求:不限 性别要求:不限 婚况要求:不限 岗位职责:
1、负责设计、开发、维护分布式的网络爬虫,包括调度、抓取、维护、验证等爬虫工作
2、负责定向数据的采集与爬取、解析处理、入库及备份等数据日常工作;
3、负责抽取算法和数据库建模的调研和设计,保证抽取、去重、分类、解析、增量融合入库等流程之后的数据结果;

岗位要求:
1、3年以上Linux环境Java/Python/golang开发经验,至少2年以上爬虫系统开发经验;
2、使用技术框架包括但不限于:Nutch,WebCollector,Scrapy,Selenium,webmagic
3、熟练使用正则表达式、xpath解析数据、搜索策略、算法、数据聚类、重组技术,熟悉反爬虫;
4、对反爬机制有研究,有过海量代理IP池建设,复杂验证码识别,破解复杂图片验证码/账号限制经验者优先
5、熟悉抓包工具(Wireshark,Fillder等),熟悉网络通信编程,网页抓取原理及技术,熟悉HTTP传输协议,能模拟各类操作爬虫;熟悉爬虫实现原理机制;对分布式和多线程技术有一定了解;
6、熟练掌握分布式爬虫,日采集量千万级别以上,并充分了解抓取策略(1、深度优先遍历策略 2、宽度优先遍历策略 3、反向链接数策略等);
7、有较强的学习能力,对技术有钻研精神,热衷于新技术的学习和实践;
8、具有良好的团队协作精神,思维清晰敏捷,逻辑分析能力强。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
会员等级
  • 计算机/互联网/电子商务
  • 200-500人
云集是一家由社交驱动的精品会员电商,为会员提供美妆个护、手机数码、 母婴玩具、水果生鲜等全品类精选商品。在云集,一站购齐80%的日常家 用,件件都是批发价。分享商品给好友,还能赚取一份收入。
经过三年多的发展,云集已经和达能、欧莱雅、强生、伊利、高露洁、飞 亚达等多家国内外一线品牌以及大希地、德尔玛等优质新锐品牌签订战略 合作,拥有超过4500万普通用户和700万付费会员,单日销售额最高超过 8.7亿元。
2017年云集通过4000多款精选商品,完成同比增速超400%的业绩。2018 年4月23日,云集宣布完成1.2亿美元B轮融资,成为行业独角兽企业

竞争力分析
综合竞争力评估
问公司
对职位有疑问?快来问问吧
手机扫一扫
随时随地找工作
职位收藏成功
您可以在职位收藏夹中查看
您正在申请 00525-高级爬虫工程师 职位,请选择您要投递的简历
申请成功
恭喜您职位申请成功,请耐心等待企业回复
您可能感兴趣的职位:
投递者简历要求(* 你的简历需必填红色项目才能领取红包)
工作经历
不限
教育经历
不限
项目经历
不限
技能证书
不限
赏金投递
完善简历
关注微信公众号
申请结果早知道
联系时请说明是在招聘之家上看到的
申请职位需要先创建一份简历哦,如果已有简历,可直接登录登录
基本信息
*姓        名:
* 出生年月:
*最高学历:
*工作经验:
*手机号码:
账号设置
*登录密码:
*手机验证
为了提高求职成功率,请完善以下信息!
最近一份工作
*公司名称:
*担任职位:
*在职时间:
-
*工作内容:
毕业院校
*学校名称:
*在校时间:
-
*毕业学历:
所学专业:
客服服务热线
18529292929
工作日 9:00-18:00
微信公众号
手机浏览

Copyright © 2005-2022 招聘之家 zhaopin.org.cn 版权所有 鲁ICP备13022699号

地址:北京海淀区西三环北路89号中国外文大厦B座7层 EMAIL:175427527@qq.com

用微信扫一扫