职位描述
职责描述:1. 主导AI业务场景下Kubernetes调度系统的战略规划与架构设计,支撑生成式AI、多模态模型训练、智能体协同等核心业务需求。 2. 构建面向AI工作负载的调度范式,解决模型开发、部署、持续迭代全生命周期的资源动态编排问题。 3. 深入理解AI业务特征,设计资源调度策略与业务指标的联动机制。 4. 构建跨集群/跨云的智能调度中台,支持混合云、边缘计算等新兴AI业务场景。 5 主导AI调度能力的产品化封装,为AI平台、AI智能体等上层业务提供标准化资源治理能力。任职要求: 1. 统招本科以上学历,人工智能、计算机及相关专业,技术基础扎实,5年以上云原生架构经验,至少2年专注AI/ML场景的基础设施建设。 2. 主导过AI业务关键路径的调度系统设计,如支持千卡规模训练任务调度、实时推理资源保障等。 3. 深入理解AI业务全流程(数据准备、训练调优、推理部署),具备将业务需求转化为基础设施设计的能力。 4. 精通Kubernetes调度领域核心方法论,对资源隔离、优先级抢占、弹性伸缩等机制有体系化认知。 5. 具备架构级抽象能力,能设计兼顾通用性与AI场景特性的调度解决方案。 优先: 1. 熟悉AI技术演进趋势(如MoE架构、Agent群体智能),能预判其对基础设施的新要求。 2. 具备技术产品化思维,能通过调度能力输出提升AI业务迭代速度与资源使用效率。
企业介绍
曙光信息产业股份有限公司(以下简称“中科曙光”)作为我国核心信息基础设施企业,为中国及全球用户提供创新、高效、可靠的IT产品、解决方案及服务。 公司于2014年在上海证券交易所上市(股票代码:603019)。经历20余年发展,中科曙光在高端计算、存储、安全、数据中心等领域拥有深厚的技术积淀和市场份额,并充分发挥高端计算优势,布局智能计算、云计算、大数据等领域的技术研发,打造计算产业生态,为科研探索创新、行业信息化建设、产业转型升级、数字经济发展提供了坚实可信的支撑。 中科曙光在全国各省、自治区和直辖市均设立了分支机构,拥有国际的3大智能制造生产基地、5大研发中心,在全国50多个城市部署了城市云计算中心。 作为以技术创新为基因的科技企业,中科曙光未来将持续专注于核心技术研发,并与用户、合作伙伴携手共建应用生态、推动产业进步,以科技创新助力“数字中国”建设,驱动经济高质量发展。