职位描述
职责描述:1. 基于Hadoop与Spark,进行海量数据模型设计、数据ETL开发;2. 负责基于开源框架的大数据的数据开发,包括数据提取、分析与结果整理;3. 负责分布式数据平台框架下的数据架构设计与开发,以及数据产品开发;4. 参与公安大数数据模型体系构建及算法模型的设计和开发;5. 开发大数据自动化运维、监控、故障处理工具,监控所有基础设施组件、应用程序,提供紧急应急措施。任职要求:1. 计算机、数学、统计或相关专业本科及以上学历,三年以上软件开发工作经验,数据挖掘和BI分析领域优先;2. 至少熟悉一种关系型数据库如Oracle、mysql等,熟练掌握Hive/SQL,熟悉Spark/Map-Reduce/MPI分布式计算框架,进行海量数据模型设计、数据ETL开发;熟悉实时数据处理者优先;3. 熟练使用Java,熟悉常用的java类库以及框架;4. 熟练使用Python/Shell/Perl/R语言等其中一种语言优先;5. 熟悉回归分析模型、关联规则挖掘、分类和聚类算法、协同过滤算法等数据统计模型和挖掘算法,了解完整的数据挖掘过程方法论,并有独立完整的建模实践经验,优先;6.有轨迹分析算法、推荐算法相关的实际项目经验,优先考虑;7. 具有良好的沟通、团队协作、解决问题和创新的能力;8.有CCA开发员认证者优先。
企业介绍
本公司专业从事大数据、人工智能技术、云计算、区块链技术的咨询服务与技术支持。企业实力:华为大数据企业培训合作伙伴Cloudera认证培训伙伴清数大数据联盟会员单位湖南大数据人工智能联盟会员单位公司服务的企业客户遍布各个行业,核心客户包括:中国移动、中国电信、上海联通、南方航空、东方航空、花旗银行、上海银行、浙江烟草、安徽电力、江西税务、四维图新等。本公司同时也是高校大数据人工智能解决方案龙头企业,高校合作涉及领域包括高校专业共建、课题研究、实验室搭建、师资培训与教学配套等业务。