职位描述
岗位职责纯视觉算法研发:1、负责机器人的纯视觉算法(例如基于Multi-Camera BEV)开发与优化,涵盖目标检测、目标跟踪、图像分割、3D视觉、多模态融合、碰撞检测等任务,增强机器人在复杂环境中的视觉感知能力。2、研究并探索前沿的计算机视觉技术和大模型技术,将其应用于机器人视觉系统,如利用大模型预训练能力提升视觉任务性能和泛化能力。3、基于纯视觉模型架构(例如BEV former),进行视觉模型的训练和调优,包括选择预训练模型、设计训练策略和优化算法,以达到所需性能和效率。4、设计高效的视觉算法框架,确保算法在机器人硬件平台上的实时性和稳定性,满足不同应用场景下的视觉需求。数据基准构建:1、面向仿真或者真实场景收集、整理纯视觉数据,构建高质量训练数据集,为纯视觉算法模型训练和优化提供支持。2、分析数据集分布和特性,提高数据质量和多样性,提升模型鲁棒性。产品集成和协作:3、将开发的视觉算法与系统集成,确保与其他模块(如运动控制、导航、交互等)无缝协作。4、设计和实施全面的测试方案,对视觉算法在不同场景下的准确性、实时性、鲁棒性等性能进行评估和验证,并根据结果优化和改进。5、为产品开发和生产提供技术支持,解决视觉算法相关问题和挑战,确保产品顺利交付和稳定运行。6、与硬件工程师、软件工程师、产品经理等团队成员密切合作,共同推进产品的研发和优化,提升产品性能和用户体验。岗位要求1、教育背景:计算机科学、电子信息工程、自动化、人工智能等相关专业,硕士及以上学位。2、专业技能: 熟练掌握计算机视觉基本理论和算法,如目标检测、目标跟踪、图像分割、3D视觉等,能独立设计和实现相关视觉算法。 熟悉深度学习框架,如TensorFlow、PyTorch等,具备丰富的深度学习模型开发和训练经验,对大模型技术有深入理解和实践经验。 熟练掌握C++/Python等编程语言,具备良好的编程能力和代码规范,能高效实现和优化视觉算法。 熟悉机器人硬件平台和传感器,如摄像头、激光雷达、RGBD相机等,能够进行视觉算法的硬件适配和优化。
企业介绍
跨维(深圳)智能数字科技有限公司成立于 2021 年 6 月,是一家以 Sim2Real 为核心,研发高通用性具身智能技术的国家高新技术企业。公司凭借在 3D 生成式 AI、多模态大模型及三维成像方面的长期技术积累,打造了软硬一体的产品矩阵,包含 DexVerse™ 具身智能引擎、基于 3D VLA (3D Vision Language ****) 大模型的成像感知套件等产品,是具身智能核心技术规模化商业落地的先驱者,目前已在30+行业批量商业落地。 目前公司已获得来自松禾资本、真格基金、联创资本、联想创投等投资。 公司现有约百人团队,公司研发人员占比 70% 以上,核心算法团队由三维人工智能领域权威专家领衔,核心成员具有新加坡国立大学、清华大学、南洋理工大学、西安交通大学、华南理工大学等国内外顶尖高校人工智能博士/硕士背景;硬件及产品化团队来自飞利浦、ASML、腾讯、霍尼韦尔等知名科技企业,具有丰富的智能制造产品开发与落地经验,技术实力雄厚。创新 3D AffordanceNet 三维功能可供性分析方法及大规模基准数据集;多次获国际相关大赛 / 排行榜冠军,技术颠覆性创新。