职位描述
职位描述:
1、负责分布式采集系统开发
2、参与分布式采集系统设计,需求分析、业务逻辑流程设计、文档编写等
3、设计爬虫策略和防屏蔽规则,提升网页的抓取效率和质量
4、负责内部系统设计、开发、代码重构等
5、有兴趣者可向python 数据挖掘方向发展
职位要求:
1、本科以上学历:计算机、信息技术等,2年以上python 爬虫开发经验
2、逻辑思维清晰,能够独立承受工作压力
3、熟练运用Python常用模块,熟悉多线程、多进程和web通信模块
4、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS等网页信息抽取技术;
5、熟悉大规模系统的负载均衡、缓存、网络存储、网络安全、数据库高可用设计及性能评估机制;
6、有参与过数据挖掘、机器学习项目优先
7、有相关电商、零售行业项目经验者优先
企业介绍
杭州数云信息技术有限公司是一家基于大数据挖掘的精准营销软件及服务公司,公司成立于2011年4月。由一群来自美国硅谷、IBM、凯捷、华为、TW等知名公司的人才创立并运营,借助独特的数据分析模型和经营理念,已在细分领域独占鳌头。2017年完成C轮融资,借助阿里的平台和数据银行,我们将展翅飞翔。
公司现有逾400人,分布在杭州、上海、北京、广州、西安、厦门等各大主要城市,平均年龄27岁,我们诚邀有抱负、勇于拼搏的年轻人,共同开创事业,实现自己的人生自由!
您关心的公司信息:
1、 专业、完善的职业成长体系,轻松自主的职业发展通道;
2、 六险一金,入职即缴,家人再不用担心你的保障了;
3、 核心城市核心区,北上广深杭,工作带你游;
4、 法定假日带薪享受;新人带薪年假10天起;
5、 宽敞明亮的健身房,为您提供各式健身器材,还有每年定期体检,为您的健康加分;
6、 冰箱、微波炉、折扣零食,让不想吃外卖便当的您想吃啥吃啥;
7、 妹纸多多,社团拓展、生日会、团队聚餐,工作high不停。
要的就是你!还在等什么……