职位描述
职责描述:
1、设计工商和金融类的主流网站反扒解决方案
2、负责分布式爬虫系统的核心技术研究、架构设计和落地指导
3、负责爬虫算法的策略优化,提升网页抓取的效率和动态增量更新
任职要求:
1、计算机相关专业,三年以上网页,APP和微博类爬取等相关工作经验优先
2、熟悉反爬机制,有能力解决图片验证码、IP访问限制和增量更新问题。
3、负责指导爬虫工程师进行技术验证,核心技术问题的攻关,解决爬取过程中的难题
4、熟悉MongoDB、Mysql、Oracle等数据库操作,具有数据库应用软件的开发经验
5、熟悉JAVA,Python等语言,掌握爬虫框架(如Scrapy,WebMagic)的设计和优化
6、熟悉网络编程和多线程机制,具有http网络编程项目经验
7、逻辑思维严谨,具有良好的沟通能力和团队协作精神
企业介绍
北京知因智慧数据科技有限公司,是一家致力于行业大数据和知识图谱的金融科技企业。即利用机器学习和知识图谱技术,结合金融行业咨询经验,为金融企业的风险管理、精准营销、客户价值、供应链金融等领域提供全新的数据服务和产品运营。
知因智慧,是IBM和中国科学院大数据团队的跨界融合,创始人是中国最早一批从事金融大数据挖掘,利用知识图谱分析企业风险的专家团队。此外,知因智慧的团队来自咨询公司金融领域专家,长期服务于银监会、央行、工商银行、建设银行、中国银行、国家开发银行、交通银行、中信银行等各大金融机构,具有丰富大数据分析背景和金融行业的服务经验,将在中国提供具有高水准的数据服务。
早在2006年,知因智慧的创始团队即在中国银监会利用中国最大的十九家银行的跨行客户信贷数据,分析集团客户、信贷客户的企业关系图谱,并研发了中国第一个该领域的模型——OSCAR客户风险预警模型,成功应用于我国监管机构,并推广至众多大型国有银行、股份制银行、城市商业银行,取得了巨大经济效益。