职位详情
大模型算法工程师
1.5-2.5万
深圳市永达电子信息股份有限公司
深圳
3-5年
本科
01-28
工作地址

深圳湾科技生态园-10B号楼19楼

职位描述
工作职责
1. 大模型算法研发:负责大模型(NLP/多模态)预训练、持续预训练及微调策略设计与实现,优化模型在特定任务场景下的精度、效率与泛化能力。
2. 对齐与效果优化:基于RLHF(基于人类反馈的强化学习)、SFT(监督微调)等技术,提升模型输出的安全性、准确性与实用性,解决幻觉、偏见等核心问题。
3. 模型压缩与推理优化:研究量化、剪枝、蒸馏等模型压缩技术,优化推理速度与显存占用,满足线上产品低延迟、高并发的部署需求。
4. 技术攻坚与创新:跟踪国内外大模型领域前沿算法与研究成果,结合业务场景开展技术创新,解决实际研发中的复杂技术难题。
5. 跨团队协作:与工程、产品、测试团队紧密配合,将算法方案落地为可复用的技术模块或产品功能,提供技术支持与方案迭代。
6. 技术沉淀:撰写技术文档、专利,沉淀算法研发经验与最佳实践,推动团队技术能力提升。

任职要求
(一)基本要求
1. 本科及以上学历,计算机、人工智能、数学、统计学等相关专业,3年及以上大模型/深度学习算法研发经验(高级岗位5年及以上)。
2. 具备扎实的计算机基础知识,包括数据结构、算法、操作系统、分布式系统等。
3. 具备良好的编程能力,精通Python,熟练使用PyTorch/TensorFlow等深度学习框架。
4. 熟悉Transformer架构及变体,深入理解大模型预训练、微调的核心原理与技术细节。

(二)核心技能
1. 有完整的大模型研发经验,参与过预训练、RLHF、模型压缩等至少一个核心模块的落地,有开源大模型二次开发经验者优先。
2. 熟悉NLP/多模态任务(如文本生成、语义理解、图像生成等),了解行业主流大模型(GPT、LLaMA、通义千问等)的特性与应用场景。
3. 掌握分布式训练技术,有GPU集群(NVIDIA A100/H100)部署与优化经验,能高效解决训练过程中的资源调度、容错等问题。
4. 具备较强的问题分析与攻坚能力,能独立应对算法研发中的复杂场景,有技术创新意识与落地能力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请