职位描述
工作职责
1、负责大语言模型(LLM)及相关AI技术的应用开发与优化,包括但不限于模型微调、推理加速、Prompt工程、Agent开发等方向;
2、负责大模型与业务场景的深度结合,设计并实现行业解决方案(如智能对话、知识问答、内容生成等);
3、构建大模型应用开发工具链,优化模型训练/部署效率,解决分布式计算、显存优化等工程问题;
4、跟踪LLM领域前沿技术(如MoE、RAG、长上下文处理等),推动技术方案持续迭代;
5、与产品、业务团队紧密协作,完成需求分析、系统设计到落地交付的全流程开发。
任职资格
1、计算机、数学等相关专业,本科及以上学历,3年以上相关工作经验,至少1年技术团队管理经验;
2、深入理解Transformer架构,具有大模型(GPT、LLaMA等)微调、部署实战经验,有大型研发项目经验优先,具备从0~1的产品项目案例;
3、熟悉LangChain、LlamaIndex等开发框架,掌握向量数据库、知识图谱等技术加分;
4、具备云原生开发经验,熟悉Docker/K8s,了解主流云平台;
5、扎实的工程能力,熟练使用Python,熟悉PyTorch/TensorFlow框架;
6、对AI技术有强烈热情,具备优秀的问题拆解能力和技术创新意识。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕