职位描述
岗位职责:1、负责开发和优化大模型的AI推理效率,通过算子切片、内存优化、GPU并行计算特性、分布式集群推理等高性能优化技术打造高性能大模型AI推理引擎;2、负责将多模态大模型在Nvidia平台/国产GPU平台优化与部署,支撑公司AI方向核心业务的发展;3、设计并实现包括算子融合、模型量化、模型压缩、蒸馏等在内的推理引擎优化技术;4、负责大规模深度学习推理框架的研发与优化;5、参与针对大模型的训练与推理加速、模型服务化、GPU资源调度等功能的研发;6、协同上下游团队,分析并解决模型中遇到的大模型训练、推理的精度和性能问题,提出性能优化策略达成性能目标。任职资格:1、计算机相关专业本科以上学历,5年以上Linux C++开发经验,熟悉C++/Python编程,具备扎实的算法和数据结构功底2、了解CPU/GPU架构与工作原理,熟悉LLM算法算子计算原理,熟悉CUDA编程并有相关开发经验;3、了解AI加速技术,包括但不限于TensorRT/TVM等,熟悉模型压缩、模型量化等技术;4、具有推理加速相关,精度、速度,调优分析工具链的开发经验;5.、熟悉GPT/transformer结构的深度优化方法和深度学习量化优化实现;6、良好的团队沟通能力、技术攻关能力,责任心强,具备一定抗压能力。
企业介绍
暗物智能科技(以下简称“暗物智能”)创办于2017年,公司汇聚国内外人工智能专家与多元化人才管理团队,致力于打造新一代强认知人工智能技术平台,服务国家战略,提升人类福祉。依托于颠覆性的"小数据、大任务"创新研究范式,公司以强认知人工智能核心技术为主攻方向,致力于构筑以场景认知理解、多模态人机交互、认知智能决策等为核心技术优势的强认知人工智能技术平台,深度赋能智慧城市、智慧商业、素质教育等国计民生领域。公司自成立以来屡获殊荣,先后斩获德勤中国明日之星、广州“未来独角兽”创新企业、国家高新技术企业、中国产学研合作创新示范企业等行业殊荣。暗物智能作为强认知人工智能科技的重要实践载体,坚持原创科技与市场需求双轮驱动,未来将持续依托与各省市政府、专业学术机构、知名科研院所、产业龙头企业等机构的合作势能,构建融通学、研、产、用的新型创新链,深度赋能产业转型升级与智能社会治理。