职位描述
岗位职责:1. 企业级RAG架构设计与落地:基于LangChain/LlamaIndex等框架,搭建统一的RAG技术底座,支持多租户、多知识库隔离与权限管控;负责向量数据库(Milvus/Qdrant/Pinecone)选型、索引优化与召回策略调优。2. 垂直场景知识库构建:针对不同业务场景(如产品售后、销售话术、设备维修、内部制度等),设计文档解析、切片策略与元数据标注规范,将非结构化文本(PDF/Word/工单记录)转化为高质量语义向量。3. 开源LLM微调与部署:基于Qwen、Llama、ChatGLM等开源模型进行领域微调(LoRA/QLoRA),提升模型在特定业务语境下的回答准确率与合规性;熟悉vLLM/TGI等高性能推理框架。4. 智能体与多轮对话设计:开发具备上下文理解、追问澄清能力的对话状态管理模块;设计ReAct/Self-Ask等Agent范式,支持知识检索、外部API调用(如工单查询)的自主编排。5. 系统集成与交付:将问答能力封装为API/SDK,集成至企业微信、钉钉、自研App等多终端入口,实现业务人员“随问随答”。任职要求:1. 计算机相关专业本科及以上学历,3年以上NLP或大模型应用开发经验。2. 熟悉RAG技术栈,有向量数据库与倒排索引混合检索、重排序(Rerank)、HyDE等优化手段的实际项目经验。3. 扎实的Python编程能力,熟悉PyTorch与Transformers库,有开源LLM微调与部署经验者优先。4. 熟悉Docker/K8s,有将AI服务容器化部署至云原生环境的能力。5. 良好的产品思维,能将模糊业务需求转化为清晰的RAG技术方案。
企业介绍
云从科技孵化自中科院重庆研究院,公司受托参与了人工智能国标、行标制定,并同时承担国家发改委人工智能基础平台、应用平台,工信部芯片平台等国家重大项目建设任务的人工智能科技企业。 同时,云从科技吸引并拥有全球的优秀人才,核心技术先后10次斩获国际智能感知领域桂冠及158次行业POC冠军、胜率达到78.4%; 运用先进的三级研发架构,云从科技取得3项重大技术突破——国内“3D结构光人脸识别技术”,打破技术垄断;商用跨镜追踪(ReID)技术,纪录保持至今;人体3D重建技术加快算法速度20倍,并将准确率大幅提升30%。 云从科技业务涵盖金融、安防、民航、零售等领域,通过行业领先的人工智能、认知计算与大数据技术形成的整合解决方案,已服务400家银行8.8万网点、31个省级行政区公安、60余家机场,实现银行日均比对2.16亿次、公安战果超3万起、机场日均服务旅客200万人次。