职位描述
职位描述:1、 设计和实现分布式机器学习模型训练的基础设施,包括数据的分布式处理和计算、分布式训练框架的搭建和优化。2、 设计并实现AI Infra的计算、存储、网络架构及AI应用的通信、I/O效率优化方案,并系统化落地。3、熟悉至少一种模型分布式运行框架,包括各种分布式并行算法及容错处理机制。4、熟悉一种集合通信库,包括主流的集合通信算法的实现(如NCCL)。5、熟悉GPU上算子编程与优化(如CUDA,Cutlass, Cute, Triton, Flash Attention等)者优先考虑。6、研究和应用GPU加速技术,优化AI计算平台的性能,并开发相应的工具库。7、负责AI计算平台的架构和优化,保证扩展性、稳定性。职位要求:1、本科及以上学历,计算机相关专业,AI相关5年以上开发经验;2、扎实的分布式开发经验,熟悉分布式计算和存储相关概念和技术;3、了解AI计算平台的架构和实现原理,有相关项目经验者优先;4、精通至少一个深度学习训练框架的底层架构和机制,精通pytorch框架最佳;5、熟练掌握相关AI网络技术和容器技术。
企业介绍
酷哇科技,专注于城市复杂场景下自动驾驶技术的研发和智能网联城市服务的应用。 酷哇拥有整车装备制造、软件算法研发和智能网联服务三重优势,是国内L4级自动驾驶商用车领域头部企业。酷哇和奇瑞、北汽、陕汽、中联等主机厂达成战略合作,聚焦市政环卫、城配物流和城市出行三大领域,布局L4级自动驾驶产品和服务,已成功实现规模化商业落地。酷哇坚持装备制造和城市服务双融合的发展模式,截止到2022年中,公司营业收入复合增长率均保持在300%以上,基于L4自动驾驶城市营运服务订单总额已达十亿级别。酷哇作为国内首批自动驾驶城市服务运营商,已经在全国10余个重要的地级市开展常态化自动驾驶营运服务,目前L4级别自动驾驶车队规模近千台,为自动驾驶技术的研发提供了可靠性数据积累。 酷哇在上海(徐汇、嘉定)、芜湖、长沙、西安均设有研发中心,拥有多个规模化的超算中心,研发团队近500人。同时,酷哇在芜湖、扬州、金华等地设有装备制造基地,为酷哇城服业务提供自动驾驶装备产能支撑。酷哇致力于将自动驾驶及新能源技术赋能城市生活,在助力”双碳“目标达成、推动行业降本增效、提升社会效益方面积极履行社会责任,构建更高效、更舒适、更美好的城市生活,让更多市民体验到自动驾驶驾驶产品,享受技术变革对安全、环境和生活带来的持续改善。