工作地点:东城区 | |
招聘人数:1 人 | |
工作地点:东城区 | |
招聘人数:1 人 | |
岗位职责:1、负责芯片异构计算大模型相关算子、框架的开发与优化;2、负责分析定位系统性能瓶颈,针对特定AI芯片做高性能计算加速和优化;3、针对特定GPU架构,开展调优工作,确保产品在性能和功耗上的优势;4、负责优化大模型推理效率和性能提升;岗位要求:1、硕士以上学历,计算机、自动化、通信等相关专业;2、熟悉系统性能调优的方法,熟练掌握CUDA语言,具备GPU算子开发能力;3、熟悉GPU、NPU等算子底层细节、具备大模型算子优化经验(矩阵计算库、Attention算子、访存瓶颈算子、融合算子)等;4、有常用大模型推理框架的设计与实现经验,例如:vllm、SGLang、TensorRT-llm等;
学历要求:硕士 | 工作经验:无经验 |
年龄要求:不限 | 性别要求:不限 |
语言要求:普通话 |
公司性质:其它 | 公司规模:500-999人 |
所属行业:人工智能/大模型 |
中国电信人工智能研究院(TeleAI)由人工智能科学家、中国电信集团CTO及首席科学家李学龙教授牵头组建,面向国家战略需求和人工智能发展趋势,结合中国电信在算力、数据、应用场景及5G/6G通信等多方面的优势,围绕大模型、具身智能、AIGC、AI平台设施等方向开展基础研究、技术攻关和应用落地。