职位描述
1 工作内容:1 NLP生成模型和对话模型的前沿技术研究追踪与探索; 2 对GRPO有实际经验及技术积累;3 基于场景的算法研发,包括不限于对模型及组建的最优组合调试等;4、创造性的提出领先的算法,包括但不限于预训练、表示学习等应用到核心业务中。任职要求1普适:计算机相关专业硕士及以上学历;多年深度学习如 TensorFlow/pytorch,Transformer 等;有 spark/hadoop 等大数据分析处理经验优先;能够从复杂的业务场景中进行问题抽象、算法选型、算法优化以及不断提升效果,深入实践DS等最新工程技术,熟练借助AI编程工具全栈开发,有极强的好奇心与自我驱动力。2 要求:1 有大模型预训练特征工程及在多个领域有深入的使用多智能体打通落地的经验。2. 具有优秀的编程基础及动手能力.熟练使用AI编程工具,良好的工作习惯,丰富的业务落地实战经验,优秀的快速学习能力;3. 发表ML/NLP等顶会/期刊论文.取得权威竞赛Top名次.ACM编程国际竞赛Top成绩者优先;4. 对国际国内大模型技术方向及实战应用充满激情,具有通过技术解决业务问题.创造产品价值的强烈愿景。对主流大模型如/等的原理和差异有深入的理解; 5. 有多机多卡方案或者蒸馏小模型小算力搭配经验,有百亿/千亿NLP大模型训练和GPU卡调优经验优先。
企业介绍
我们是一家致力于提供行业领先的自然语言理解技术服务的科 技公司,依托于独有的HowNet知识库和文本解析技术,我们可以 为行业提供具有语言学特色的词法分析、句法分析、语义理解和其 他文本解析等自然语言理解技术服务,为客户解决自然语言理解难 题,助力客户构建智能交互机器人、内容与信息抽取、用户画像、 舆情分析与监控、大规模自然语言文本自动化处理等方面的应用。