职位描述
职位名称:大模型研发工程师
学历要求:本科及以上
工作地点:南京市秦淮区紫云智慧广场1号楼
职位概述
我们正在寻找一位对大规模语言模型(LLM)充满热情、具备扎实理论基础与丰富实战经验的研发工程师。如果你痴迷于探索大模型的前沿技术,擅长用代码将创新想法落地,并渴望在挑战中不断突破,欢迎加入我们,共同构建下一代智能系统!
核心职责
参与大模型的研发、优化与迭代,涵盖模型架构设计、训练调优、推理加速等关键环节。
负责大模型相关代码的开发与维护,确保代码的高质量、可扩展性和可复用性。
深入探索大模型原理,结合实际业务需求,提出技术改进方案并推动落地。
参与或主导大模型的评测体系构建,包括评估指标设计、性能分析及效果优化。
与算法、工程、产品团队紧密协作,推动技术成果在业务场景中的应用。
任职要求
硬性条件:本科及以上学历,计算机、人工智能、数学等相关专业。
具备丰富的 vibecoding 经验(注:请候选人准备展示相关项目或代码案例)。
熟练掌握 Python,具备扎实的编程能力和良好的代码规范。
深入理解大模型基本原理(如 Transformer、预训练/微调、注意力机制等)。
熟悉至少一种主流深度学习框架(如 PyTorch、TensorFlow)。
优先考虑:
有大模型训练、微调或分布式训练实战经验者优先。
熟悉大模型评测方法、基准数据集或优化技术(如 RLHF、量化、模型压缩等)。
在顶级会议(NeurIPS、ACL、ICLR 等)发表过相关论文,或参与过开源大模型项目者优先。
具备良好的逻辑思维、沟通能力和团队协作精神。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕