职位描述
年底会搬至望京,请关注!!职位描述1、设计和开发分布式网络爬虫系统,进行多平台信息的抓取工作2、PC网站和APP数据爬虫架构设计、反爬虫策略研究3、负责对新产品或新技术进行技术研究,包含不限于AI采集框架、自动化采集等职位要求1、计算机相关专业本科及以上学历,3年以上相关工作经验2、熟悉爬虫原理,熟悉常见的反爬虫技术、逆向技术3、精通Python具有扎实的计算机基础和编程能力,熟悉常见的算法与数据结构,具有优秀的逻辑思维能力4、精通逆向,脱壳、反编译、抓包、拦截、破解等5、有爬虫agent、browser-use、RPA+OCR、分布式爬虫架构、反反爬虫、实时爬虫等项目经验者优先6、采集范围短视频站点采集为主加分项:有过爬虫agent、browser-use、RPA+OCR,能使用LangChain开发框架,熟悉提示词、意图识别、思维链、思维树的应用。
企业介绍
新奥集团起步于1989年,以“创建现代能源体系、提高人民生活品质,成为受人尊敬的创新型智慧企业”为使命愿景,形成了贯通下游分销、中游贸易储运、上游生产的清洁能源产业链和涵盖健康、文化、旅游、置业的生命健康产品链。面向数字时代,新奥积极推动数字化转型,着力打造泛能网、来康网两大平台,构建清洁能源生态圈、生命健康生态圈。目前,新奥集团服务范围覆盖中国27个省(市、自治区)的200多个城市,业务拓展至东南亚、南亚和非洲等地,雇员超过4.5万人,旗下有新奥能源、新奥股份、新智认知、西藏旅游4家上市公司,2019年经营收入达1645亿元人民币。