职位描述
岗位要求: 1、熟悉主流大模型生态,包括闭源模型(GPT-4o、文心一言、通义千问)和开源模型(Llama 3、Qwen、Mistral)的调用方式与特性差异;2、具备模型选型与适配能力,能根据业务成本、性能要求选择合适的模型,并完成 API 对接、参数调优(temperature、top_p 等),提示词工程、模型微调; 3、了解轻量化模型部署,如基于 llama.cpp、vLLM 进行开源模型本地部署与量化(4-bit/8-bit),满足低资源环境下的应用需求; 4、精通LangChain/LangGraph 核心组件使用,包括 Document Loaders(文档加载)、Text Splitters(文本分割)、Vector Stores(向量存储,如 Chroma、FAISS)、Retrievers(检索器)、Chains(链)、Agents(智能体); 5、能基于LangChain 搭建检索增强生成(RAG)系统,实现 “知识库加载→文本向量化→检索→生成” 全流程闭环; 6、具备LangChain 应用优化能力,如优化检索策略(混合检索、重排序)、解决上下文窗口限制、提升生成结果的准确性与相关性;岗位职责: 1、负责企业级大模型应用的设计与开发,基于提示词工程优化模型输出效果,提升业务场景下的智能交互体验; 2、基于LangChain框架搭建RAG系统、智能体(Agent)等应用,完成文档检索、多模态交互、流程自动化等功能; 3、完成开源/闭源大模型的选型、对接、调优与部署,解决模型调用中的性能、成本、稳定性问题; 4、沉淀提示词模板、LangChain组件封装、模型调优的标准化方案,形成技术文档与最佳实践; 5、与业务侧协作,理解需求并转化为技术方案,推动大模型应用在实际业务中落地; 6、AI自动化新方向的探索和推进,给自动化测试赋能。