职位详情
AI模型训练工程师
1.6-3万
湖南凌翔磁浮科技有限责任公司
长沙
不限
硕士
06-19
工作地址

湖南凌翔磁浮科技有限责任公司

职位描述
岗位职责:
1、模型架构设计与搭建,针对大规模语言模型(LLM)项目,依据业务需求和技术发展趋势,主导设计高效且创新的模型架构。结合 Transformer 等基础架构,通过对网络层数、神经元数量、连接方式等关键要素的精心规划,搭建初始模型框架,确保模型具备强大的表征学习能力,从架构层面为模型性能奠定基础;
2、预训练与微调,负责组织和执行大规模语言模型的预训练任务,运用海量文本数据,在大规模分布式计算集群上开展训练工作。精细调整训练超参数,如学习率、批量大小等,优化训练流程,提升预训练效果。针对特定业务场景,开展模型微调工作,通过标注数据和领域知识,使模型能够精准适配实际应用需求,有效提升模型在特定任务上的性能表现;
3、聚焦于模型性能优化的核心工作,深入研究参数调优策略,运用智能优化算法对模型参数进行迭代优化,以提高模型的准确率和泛化能力。同时,开展损失函数设计工作,结合模型任务特点和数据特性,构建更具针对性的损失函数,引导模型学习更有效的特征表示。积极探索注意力机制的改进方法,通过优化注意力计算方式和权重分配策略,提升模型对长序列文本的处理能力,降低计算复杂度;
4、深入探索模型压缩、量化、蒸馏等前沿技术,致力于提升模型的推理效率及部署能力。通过模型压缩技术减少模型参数量,在不显著损失性能的前提下,降低模型存储需求和计算成本。运用量化技术将模型参数从高精度数据类型转换为低精度,加速推理过程。开展模型蒸馏工作,将复杂大模型的知识迁移至轻量级小模型,实现模型在资源受限环境下的高效部署,如移动端、边缘设备等;
5、密切关注大规模语言模型领域的前沿研究动态和技术发展趋势,积极探索新的模型架构、训练算法和优化技术在项目中的应用可能性。与跨部门团队紧密协作,包括数据科学家、算法工程师、软件工程师等,共同推动模型从研发到上线的全生命周期管理,为业务发展提供强大的技术支持。
任职要求:
1、硕士及以上学历,在计算机科学、人工智能、数学等相关领域接受过系统深入的教育,具备扎实的理论基础,能够深入理解和研究复杂的大模型技术;
2、计算机科学、人工智能、数学、统计学等相关专业背景,拥有深厚的专业知识储备,涵盖算法设计、数据处理、数学建模等方面,为开展大模型研发工作提供有力支撑;
3、精通深度学习基本理论,对神经网络架构、优化算法、损失函数等有深入理解,能够将理论知识灵活应用于大规模语言模型的研发实践中;
4、熟练掌握 Python 编程语言,具备良好的编程习惯和代码调试能力。精通至少一种主流深度学习框架,如 TensorFlow 或 PyTorch,能够熟练运用框架实现模型架构设计、训练、优化及部署等全流程操作;
5、深入理解大规模语言模型的架构设计、预训练、微调等核心技术,熟悉参数调优、损失函数设计、注意力机制等关键环节的优化方法。掌握模型压缩、量化、蒸馏等技术,能够有效提升模型的推理效率和部署能力;
6、具备强大的数据处理能力,熟练掌握数据预处理、数据标注、数据增强等技术,能够处理大规模、高维度的文本数据,为模型训练提供高质量的数据支持。
拥有深厚的数学功底,精通线性代数、概率论、数理统计等数学知识,能够运用数学方法解决模型训练和优化过程中的复杂问题,如模型性能分析、参数估计等;
7、具有丰富的大规模语言模型研发项目经验,至少主导或参与过一个完整的大规模语言模型项目,在模型架构设计、预训练、微调、性能优化等方面取得过显著成果。有成功应用模型压缩、量化、蒸馏等技术提升模型推理效率和部署能力的实践经验,能够将模型有效应用于实际业务场景,为企业创造价值。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请