1.8-3万·14薪
中国人寿
1、具备扎实的编程技能,并且对解决复杂问题充满热情。专注于大规模语言模型(LLM)或其他大模型(如多模态模型)的训练、优化与应用开发。该职位将负责构建、训练、调优和部署先进的大模型,以推动单位在相关领域的技术创新和业务落地。
2、主要职责:
(1)大模型训练与调优:设计、实施并优化大模型的训练流程,包括数据准备、模型架构选择、超参数调整、分布式训练策略制定与执行。
(2)模型开发与实现:参与或主导大模型(如Transformer架构模型)的研发、复现、改进和适配工作。
(3)性能优化:解决大模型训练中的性能瓶颈(计算、通信、内存),进行显存优化、计算效率提升和通信优化。
(4)技术栈应用:熟练运用主流的大模型训练框架和工具(如PyTorch, TensorFlow, DeepSpeed, Megatron-LM, FSDP, Hugging Face Transformers等)。
(5)数据处理:设计和管理用于大模型训练的海量、高质量数据集,包括数据清洗、预处理、增强和安全管理。
(6)模型部署与应用探索:探索训练后模型的部署方案(如推理优化)及其在具体业务场景(如智能问答、内容生成、代码辅助、知识管理、AIGC等)中的应用潜力。
(7)技术跟踪与分享**:跟踪大模型领域的前沿技术动态,并在团队内进行技术分享。
3、要求:计算机科学或相关领域的本科及以上学历。
精通Python编程语言,具有3年以上实际项目开发经验。
熟悉常用的Python包和框架,如Pandas, NumPy, Flask/Django等。
具备良好的SQL知识,能够编写复杂的查询语句。
理解数据结构、算法知识及面向对象设计原则。
熟悉Linux环境,熟悉lnux常见命令。有使用版本控制工具(如Git)的经验。优秀的沟通能力和团队协作精神。
4、加分项:
(1)在自然语言处理(NLP)、语音识别处理方面有项目经验。
(2)参与过大模型(如Transformer架构)的开发或应用。
(3)对开源社区有所贡献,拥有个人GitHub项目者优先考虑。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕