职位描述
主要职责1.【模型战略规划】: 负责垂直大模型整体技术方向与发展战略制定,依据行业趋势与公司业务需求,规划模型的长期发展路线,确保模型保持竞争力并贴合业务实际。2.【技术体系搭建】:全面负责搭建涵盖数据处理、模型训练、部署及优化的完整技术体系3.【模型研发推进】:带领团队开展模型研发工作,监督从数据准备、模型训练到评估优化的全流程。4.【模型部署与维护】与工程团队紧密合作,负责将训练好的垂直大模型部署到生产环境中,确保模型能够稳定、高效地运行。5.【前沿技术探索】关注模型压缩、安全隐私保护等新技术,优化模型性能,降低成本,增强模型安全性与隐私保护能力,提升公司在国际供应链大模型领域的技术竞争力。任职要求:1. 计算机科学、数学、统计学等相关专业,硕士及以上学历。2. 具有5年以上深度学习、机器学习相关技术研发经验,其中3 年以上大模型项目开发经验,有成功的大模型落地案例。3. 精通 Python、TensorFlow 或 PyTorch 等主流深度学习框架,熟悉常用的机器学习算法,如线性回归、决策树、神经网络等,能够熟练运用其进行模型开发与优化。4. 深入理解 Transformer 架构及其变体,掌握模型训练过程中的超参数调整、分布式训练等技术,具备解决复杂模型训练问题的能力。5. 熟练掌握模型微调、后训练等相关技术,在实际项目中成功应用并取得显著成果。6. 了解模型部署相关技术,如容器化技术(Docker、Kubernetes)、云计算平台(AWS、Azure、阿里云等),能够将模型高效部署到生产环境中,并进行性能监控与优化
企业介绍
1、团队:核心成员组成阿里,华为,百度
2、产品:舆情监测方向
3、上海总部,武汉研发中心,北京分公司下半年
4、上海办公地点:上海市静安区彭江路大宁易园