1.5-3万·14薪
南昌浦发银行办公大厦8楼
1、模型微调与优化:参与大模型在协同办公及建筑行业场景下的应用,包括但不限于:基于公有云大模型做局部私有资料的对接微调,基于私有大模型做垂直领域的数据抓取、自动标注、微调训练;
2、应用落地:负责大模型的模型适配与应用落地,包括但不限于LLM、Langchain、Agent、Eval等技术;
3、性能评估监测与部署:定期监控模型性能,进行在特定应用场景下的各类模型能力的评估,确保模型达到业务要求,能够进行模型的容器化部署。
任职要求:
1、参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等;
2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;
4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;
5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;
7、熟悉Docker、Kubernetes等容器化技术。
8、扎实的数学功底,熟悉概率统计、线性代数、优化方法等领域的相关知识 。
9、有成功优化模型训练算法、提升模型性能的项目经验,能够独立承担算法设计和开发任务,能独当一面。
10、对深度学习领域的技术创新有敏锐的洞察力,乐于学习并积极探索新技术 。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕