职位描述
岗位职责:1. 负责大模型流程加速工具的研发,包括但不限于大模型压缩、自动混合精度推理、异步并行推理等功能模块;2. 负责大模型的训练、调优和部署,确保模型性能保持较佳状态;3. 深入研究和探索大模型的新技术和新方法,提高模型的效果和效率;4. 协助团队其他成员理解和应用大模型技术,提供技术支持和培训;5. 持续关注和研究大模型领域的最新技术和进展,推动团队的技术创新。6. 深入理解大模型推理的原理和算法,持续优化工具的性能和效率;7. 配合团队成员进行工具的测试、部署和集成;8. 编写相关技术文档,提供技术支持和培训。任职要求:1. 硕士及以上学历,计算机科学、人工智能或相关领域专业;2. 三年以上大模型训练工作经验 或 三年以上大模型流程加速工具开发经验;3. 熟练掌握至少一种编程语言(如Python、C++等),具备良好的代码风格和编程习惯;4. 对大模型推理技术有深入了解,具备相关算法和数据结构的知识;5. 对大模型训练的原理、算法和技巧有深入了解,具备相关知识和实践经验;6. 具备良好的团队协作和沟通能力,能够与不同背景的团队成员有效协作;7. 对新技术充满热情,具备快速学习能力和创新思维。
企业介绍
思腾合力(天津)科技有限公司定位于视觉计算推动者,专注于人工智能领域,提供深度学习、GPU高性能计算、虚拟化、分布式存储、集群管理等产品和整体解决方案,助力和推动各企事业单位不断发展需求。思腾合力(天津)科技有限公司现成立于天津经济技术开发区逸仙园科技园,前身为成立于2009年的北京思腾合力科技有限公司,公司自成立之时就致力于发展高性能计算方向,从简单的CPU计算开始到现在的单机多GPU运算,再到高浮点运算能力的GPU集群方案,经历了硬件变更和应用技术的更新迭代,公司逐步壮大了销售板块和经营的业务模块,同时在GPU人工智能与高性能计算领域积累多年的技术经验,更是在2017年营业额突破亿元大关,合作客户包括清华大学,北京大学,北京理工大学,中科院计算所,中科院自动化所,中科院力学所,中科院遥感所,中科院信息工程所,以及国内知名人工智能公司等各企事业单位思腾合力目前分为思腾合力(天津)科技有限公司(以下简称为:天津公司)和北京思腾合力科技有限公司(北京公司),天津公司作为制造和生产基地,负责公司产品在产,质检,物流等功能,北京公司以销售和售后为主公司主营深思系列“DeepThink”系列GPU服务器,型号包括有 IW4200-2G/4G/8G/10G等多种型号产品,单台机器可支持2-10颗GPU运算卡,充分满足不同客户对算力的需求。人工智能领域的不断发展也要求公司技术层面的不断提升,思腾合力在提高产品品质同时也配合客户需求对所经营深思系列GPU Server产品预装CUDA、CUDNN及caffe、Tensorflow等主流深度学习框架,同时能够提供GPU调优,集群搭建等整体解决方案