职位描述
岗位职责:
1. 负责大规模语言模型(LLM)及相关多模态模型的训练、微调、优化与部署,推动其在实际业务场景中的落地应用;
2. 基于行业需求(如医疗、政务、教育等),设计并实现Prompt工程、RAG(检索增强生成)、Agent任务编排等大模型应用架构;
3. 开展模型压缩、推理加速、分布式训练优化等关键技术研究,提升模型性能与服务效率;
4. 结合向量数据库(如Milvus)与语义检索技术,构建高效的知识检索与语义匹配系统;
5. 使用FastAPI、Flask等框架开发高性能RESTful API接口,支撑模型服务化输出与前后端联调;
6. 参与智能体(Agent)系统开发,包括Function Calling、MCP等技术架构,支持复杂任务的自主规划与工具调用;
7. 跟踪大模型领域前沿技术,持续进行技术创新和方案迭代;
8. 协同数据、产品与工程团队,完成从算法研发到系统集成的全流程闭环开发;
9. 输出高质量的技术文档、设计方案及专利成果,支持项目交付与知识沉淀;
10. 完成领导交办的其他工作。
任职资格:
1. 3年及以上经验,计算机、人工智能或相关专业硕士及以上学历,具备扎实的深度学习与自然语言处理理论基础;
2. 熟练掌握Python及主流深度学习框架(如PyTorch),具备大模型训练与调优实战经验;
3. 熟悉Transformer架构及主流大模型(如Qwen、DeepSeek、GPT等)的原理与使用方式;
4. 具备良好的工程能力,熟悉Dify、vLLM、LangChain等工具;
5. 熟悉向量数据库(如Milvus、FAISS)的使用与集成,有文本向量化、语义检索、人脸/图文跨模态匹配等项目经验者优先;
6. 熟悉NLP核心任务(如文本生成、意图识别、信息抽取、对话系统)的建模方法;
7. 熟练掌握FastAPI、Flask等Web服务框架,能够独立完成模型API封装与服务部署;
8. 具备智能体(Agent)开发经验,理解Function Calling机制,有MCP架构实践或自研Agent系统经验者优先;
9. 具备较强的问题分析与逻辑思维能力,能够独立完成算法设计与验证;
10. 具有良好的沟通能力和团队协作精神,能适应快速迭代的技术环境;
11. 发表过相关顶会论文者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕