好猎头网-中高级人才猎头网站!服务热线:400-1801-668 好猎头   |   登录 注册
首页 > 人才求职

大模型应用工程师

刷新时间:1分钟前

深圳市迈特芯科技有限公司

20-45万

深圳市 | 硕士 | 无经验

基本信息
工作地点:深圳市
招聘人数:1 人
职位描述

岗位职责1.算法研发与优化:负责公司产品中大模型应用的研发和优化工作,精通deepseek、Qwen等前沿大模型,熟悉计算机视觉(CV)、自然语言处理(NLP)和机器学习(ML)算法。参与大模型的量化压缩、端侧部署工作,开发和集成大模型量化部署工具链。负责垂直领域的大模型 RAG+微调工作。2.端到端部署流水线搭建:搭建端到端部署流水线,集成模型压缩、编译优化、服务编排等流程,支持一键式部署。3.分布式推理架构设计:设计并实现大模型分布式推理架构,支持 GPU 并行的高效协同。4.高并发优化与资源管理:优化模型服务的并发处理能力,实现万级 QPS 的高吞吐场景。开发自适应负载均衡系统,根据实时流量动态分配计算资源,避免服务雪崩。开发自动扩缩容策略,基于流量预测和实时监控快速响应峰值压力。5.前沿技术研究与应用:研究稀疏化推理、MoE 模型部署、异构计算加速(GPU+NPU)等方向,推动技术边界。任职要求1.计算机/电子工程/数学相关专业硕士及以上学历。2.至少 3 年相关工作经验,具有丰富的算法研发经验。3.精通 C++ 和 Python 开发,熟悉机器学习、深度学习算法。4.熟悉 PyTorch 等深度学习框架,有实际项目经验。5.掌握分布式系统设计,具备大规模集群的大模型部署及微调经验。6.深入理解网络协议栈优化(如 gRPC/HTTP2/QUIC)、连接池管理、长尾延迟治理。7.具有强烈的责任心和自我驱动力,能够快速学习和适应新技术,良好的团队合作精神和沟通能力,能够独立承担并推动项目进展。加分项1.有在知名科技公司或研究机构的工作经验。2.发表过相关领域的学术论文或拥有专利。

岗位要求:
学历要求:硕士 工作经验:无经验
年龄要求:不限 性别要求:不限
语言要求:普通话
企业信息
公司性质:其它 公司规模:20-99人
所属行业:人工智能/大模型
企业介绍

一、公司概述:深圳市迈特芯科技有限公司成立于2023年底,由南方科技大学余浩教授领衔的深圳市孔雀团队孵化,专注于具身智能芯片研发与端侧大模型部署。公司以“低功耗、高能效”为核心竞争力,致力于为AI手机、穿戴设备、机器人及智能硬件提供国际领先的算力解决方案,推动人工智能在端侧场景的规模化落地。二、核心技术:LPU芯片架构:采用22-40nm制程与3D-DRAM混合键合技术,实现5W超低功耗下>200tps的推理性能,带宽利用率达80%,兼容DeepSeek、GLM、Llama等主流大模型。端侧优化技术:融合立方脉动架构、张量压缩算法、感算一体设计,显著提升端侧设备的实时决策与多模态数据处理能力。三、产品矩阵:7B MetaChip:旗舰级端侧推理芯片(算力4.92 TOPS,性能>200Token/s),应用于手机、平板、PC等核心终端。1B MetaChip:高集成泛端侧芯片(功耗<200RMB),适配AI耳机、桌面机器人等轻量化场景。14B MetaChip:高性能SoC芯片,专为具身智能机器人、无人机设计,支持10B+大模型实时部署。四、市场与客户千亿级赛道:覆盖端侧大模型芯片1000亿存量市场及具身智能硬件100亿增量市场,技术对标英伟达、高通。头部合作:与华为、荣耀、大疆、优必选等企业深度合作,产品应用于:AGI-PC/手机:为华为预研项目提供端侧大模型算力支持,人力降本效率提升>20倍。具身智能硬件:赋能大疆无人机视觉决策、优必选人形机器人多模态交互,实现本地化低延迟推理。五、核心团队创始人余浩教授:国家万人计划科技创新领军人才、IEEE国际宣讲人,20年+芯片设计经验,主导多项国家级科研项目。顶尖团队:成员来自华为、ARM、英伟达等头部企业,涵盖芯片架构、AI算法、硬件量产全链路专家,累计发表顶会论文100+篇,获吴文俊人工智能奖等权威荣誉。产学研协同:依托南方科技大学实验室资源,与ARM中国、中兴共建联合实验室,加速技术商业化落地。六、愿景与使命迈特芯以“让智能触手可及”为使命,通过革新端侧算力技术,推动AGI普惠化发展,成为全球具身智能芯片领域的标杆企业。