职位描述
岗位职责:1、负责类GPT通用大模型Post-training,包括但不限于强化学习,奖励模型,数据合成,模型评测等工作相关方向的前沿探索和应用创新2、负责类o1复杂推理大模型Post-training相关工作,包括但不限于数据合成(MCTS等),强化学习,推理策略,模型评测工作相关方向的前沿探索和应用创新3、负责研究成果总结与输出,包括发表高水平国际期刊/会议论文、撰写专著、申请国家发明专利/软件著作权、参加国内外重要科技竞赛、组织国内外学术活动等; 岗位要求:1、本科及以上学历,计算机科学与技术、人工智能、计算机、机器学习、大数据、数学等相关专业。博士学历优先,有国际高水平院校教职/博后/留学经历者优先,有国际知名产业机构工作经历者优先; 2、在人工智能领域国际期刊/会议上以第1作者发表过论文≥2篇,在国内外重要科技竞赛中以第1作者取得前3名成绩者优先;有大模型领域知名博客,论文或开源项目者优先3、熟悉Pytorch, Transformers, Megatron-LM等主流深度学习或大模型训练框架至少1种,有良好的大模型、生成式人工智能、机器学习等专业领域的学科知识基础; 4、具备良好的主观能动性,能主动思考、主动作为、主动反馈,有科研项目过程(申报/节点/结题/报奖)材料经验者优先,有科研项目/产品转化经验和带团队经验者优先。
企业介绍
中国电信人工智能研究院(TeleAI)由人工智能科学家、中国电信集团CTO及首席科学家李学龙教授牵头组建,面向国家战略需求和人工智能发展趋势,结合中国电信在算力、数据、应用场景及5G/6G通信等多方面的优势,围绕大模型、具身智能、AIGC、AI平台设施等方向开展基础研究、技术攻关和应用落地。