职位描述
1. 负责AI模型的训练数据采集、处理、清洗、标注及存储流程设计与开发;2. 搭建和维护大数据处理平台(如Hadoop、Spark、F****等),支持AI项目的数据需求;3. 优化大规模数据的清洗、抽取、转换(ETL)及特征工程流程;4. 与AI算法工程师紧密协作,提供稳定高效的训练数据支持及推理数据通路;5. 设计并开发数据质量监控、数据版本管理、数据安全策略;6. 参与AI产品的全流程数据支撑,包括模型部署、在线服务的数据接入与追踪分析。岗位要求:1. 计算机相关专业本科及以上学历,3年以上大数据开发和挖掘相关工作经验;2. 熟练掌握至少一种编程语言(Python、Java、Scala等);3. 熟悉大数据生态(如Hadoop、Hive、Spark、F****、Kafka);4. 有数据仓库建设、数据建模或数据流开发经验;5. 熟悉分布式系统架构、数据湖、实时数据处理与存储优化;6. 熟悉AI模型所需的数据结构、特征工程流程及有AI平台、机器学习平台(如Kubeflow、MLflow、Airflow等)的优先考虑;
企业介绍
广州三晶电气股份有限公司(简称三晶)是一家为用户提供智慧储能、智慧发电和工业自动化产品及整体解决方案的中国高新技术企业,主要产品有光伏逆变器、储能逆变器及系统、电机驱动与控制产品等。 三晶成立于2005年,总部位于广州,在广州、深圳、无锡、长沙设4大研发中心,江西设2大生产基地,比利时、意大利、西班牙等海外地区成立子公司;拥有多栋现代化办公楼、厂房(面积合计约18万平方米),具备年产23.8万台逆变器、6万台储能电池、24万台变频器的能力。三晶现有员工近1332人,其中专业研发人员324人,占比24.3%,掌握能源转换、能源存储、能源管理和能源消费四大能源链领域20项核心技术,取得300余项IP知识产权,是行业内掌握多项核心技术的企业之一。 近年来,三晶深耕国内市场,同时加快“走出去”发展,经过10余年拓展,建立遍布全球80多个国家及地区的销售网络,取得300多项国内外认证证书及奖项,产品及品牌深受客户信赖,畅销海内外市场。2022年度,公司实现营收15.51亿元,复合增长率达90.77%;归母净利润28560.76万元,复合增长率达126.85%。连续多年,三晶重要经营数据快速增长,盈利能力持续稳步提升,产业规模逐步扩大。 未来,三晶将秉承“客户导向、积极创新、追求卓越、开放包容”的核心价值观,信守“构建绿色环境 共创幸福生活”的使命,继续为全球用户提供高质量、高效、快捷、低成本的产品与系统解决方案,致力于成为智慧储能全球品牌。