岗位职责:
1、负责主流大语言模型(如GPT、Qwen、DeepSeek等)的应用开发与工程化落地,结合业务需求设计高效解决方案。
2、开发基于大模型的创新应用场景,包括但不限于智能对话系统、内容生成、知识问答、数据分析等。
3、优化模型推理性能,解决实际场景中的延迟、成本、精度问题,提升用户体验。
4、探索大模型与其他技术(如知识图谱、多模态、Agent系统)的融合应用。
5、跟踪前沿技术动态,推动团队技术迭代与工具链升级。
任职要求:
1、35岁以下,本科及以上学历,机器学习、人工智能、计算机科学等相关专业,需具备3年以上大模型应用研发经验。
2、熟悉主流大模型架构(Transformer等),掌握PyTorch、TensorFlow等深度学习框架,具备丰富的模型微调(如LoRA、RLHF、P-Tuning等)经验,能独立完成模型调优与效果验证。
3、熟悉LangChain、LlamaIndex等大模型应用开发框架,具备RAG(检索增强生成)全流程落地经验(如向量数据库选型、检索策略优化、上下文融合)、Prompt工程(提示词设计、优化、模板化)、智能体工作流(Workflow)编排(如任务拆解、条件分支设计)、多智能体编排(如角色分工、信息交互逻辑)以及工具调用管理(如API集成、工具优先级调度)等实战经验,深度掌握相关核心技术。
4、熟练使用Python,具备扎实的工程能力(分布式训练、模型压缩、服务部署等)。
5、对各类模型能够熟练适配华为昇腾系列芯片等其他国产GPU/NPU服务器。
6、加分项:有多模态(图像)模型开发经验、有高并发服务开发经验。
能力素质要求:
1、具备高度的保密安全意识;
2、具有较强的分析研究能力;
3、具备良好的语言表达能力;
4、具备良好的团队合作能力;
5、具备良好的逻辑思维和分析解决问题能力;
6、具有良好的应急处理和解决复杂项目问题的能力。