职位描述
岗位工作地点在新疆伊宁!local优先!注:公司不是外包,请勿反复询问。 薪资面议职位要求1. 硬性条件- 专科及以上学历。- 2-5年数据标注、数据处理或软件开发经验,熟悉大型数据标注流程者优先。- 熟练使用至少一种标注工具(Label Studio、Prodigy、CVAT等)或参与过标注工具开发。2.技术能力- 能够编写简单脚本优化标注流程(如数据清洗、格式转换)。- 了解机器学习基础概念(如监督学习、数据偏差处理),熟悉CV常见任务标注规则。- 有SQL或数据库管理经验者加分。3. 软性素质- 高度责任心,对数据质量敏感,具备较强的逻辑分析和问题解决能力。- 良好的沟通能力,能协调多方团队推动项目落地。4. 加分项- 有大模型(如GPT、LLaMA、文心一言)标注经验。- 熟悉数据安全与隐私保护规范(如GDPR)。岗位职责1. 数据标注与质量管理:负责大模型训练所需的多模态数据(文本、图像、语音等)标注工作,制定标注规则与标准。对标注结果进行质量审核与校验,确保数据符合模型训练要求;针对标注问题提出优化方案,迭代标注流程和工具。2. 标注工具开发与优化:参与内部标注工具的开发与功能改进,提升标注效率(如自动化预标注、多人协同标注等)。·与算法团队协作,设计针对特定任务(如CV目标检测)的标注板。3. 跨团队协作:对接算法工程师,理解模型需求并反馈标注数据问题。协助产品经理梳理标注需求,输出标注规范文档和技术方案。4. 领域知识沉淀:针对垂直领域建立专业术语库和标注知识库,统一标注标准。
企业介绍
未来清研是清华大学未来媒体研究院推广成果转化的科技公司。未来媒体研究院聚焦立体视频技术、人工智能算法、服务机器人技术等技术研究、产业应用与人才培养。欢迎查阅深圳市未来清研智能科技有限公司官网Tsingtec