职位描述
职责描述:1.主导设计高性能、低延迟的异构编程模型(如类CUDA/OpenCL的指令集、内存模型、任务调度机制)及配套Runtime系统。优化硬件与软件协同设计,确保编程模型在GPGPU、AI加速器等异构硬件上的高效执行。2.构建核心Runtime组件(任务调度器、设备管理、内存分配、跨设备通信、异常处理等),解决多级流水线、低开销上下文切换、异构同步等系统级问题。3.开发设计Profiling工具链,定位内核执行热点,提出架构级改进方案4.与硬件团队合作定义计算单元架构,驱动ISA(指令集架构)设计;与算法团队合作优化计算库(如BLAS、FFT)的硬件加速策略。任职要求:1. 计算机科学、电子工程、数学等相关专业硕士及以上学历,8年以上系统级软件开发经验,其中至少5年专注异构计算领域。2. 精通CUDA/ROCm/OpenCL等主流异构编程模型,深入理解其Runtime实现原理(如CUDA Driver API、HIP Runtime、OpenCL任务调度)。3. 对现代GPGPU架构(如NVIDIA Ampere/AMD CDNA)有深入研究,熟悉SIMT执行模型、层级内存体系、硬件调度队列等核心机制。4. 具备构建复杂系统的能力,熟练掌握C/C++/Rust,精通Linux内核模块、DMA、PCIe通信等底层开发技术。加分项:参与过国际开源异构计算项目(如PyTorch/XLA、TVM、Vulkan计算管线)并贡献核心代码。有GPGPU/FPGA/ASIC等芯片厂商底层工具链开发经验,熟悉指令集模拟器(ISS)或性能建模工具。发表过体系结构顶会(ISCA、MICRO、HPCA)论文或持有相关专利。
企业介绍
曙光信息产业股份有限公司(以下简称“中科曙光”)作为我国核心信息基础设施企业,为中国及全球用户提供创新、高效、可靠的IT产品、解决方案及服务。 公司于2014年在上海证券交易所上市(股票代码:603019)。经历20余年发展,中科曙光在高端计算、存储、安全、数据中心等领域拥有深厚的技术积淀和市场份额,并充分发挥高端计算优势,布局智能计算、云计算、大数据等领域的技术研发,打造计算产业生态,为科研探索创新、行业信息化建设、产业转型升级、数字经济发展提供了坚实可信的支撑。 中科曙光在全国各省、自治区和直辖市均设立了分支机构,拥有国际的3大智能制造生产基地、5大研发中心,在全国50多个城市部署了城市云计算中心。 作为以技术创新为基因的科技企业,中科曙光未来将持续专注于核心技术研发,并与用户、合作伙伴携手共建应用生态、推动产业进步,以科技创新助力“数字中国”建设,驱动经济高质量发展。