职位描述
岗位职责:
1. 大模型研发与架构设计
- 负责大规模预训练语言模型(如Transformer、BERT、GPT系列等)的架构设计、算法优化与实现。
- 探索大模型在垂直领域(如NLP、CV、多模态等)的应用场景与技术突破。
2. 模型训练与优化
- 主导大模型的分布式训练、参数调优、性能加速及资源效率提升。
- 解决训练过程中的数据并行、模型并行、显存优化等技术难题。
3. 模型部署与工程化
- 负责大模型的轻量化、推理加速及生产环境部署(如ONNX、TensorRT、模型蒸馏等)。
- 开发高可用、低延迟的模型服务化框架(如TensorFlow Serving、TorchServe、FastAPI等)。
4. 算法研究与创新
- 跟踪学术界与工业界前沿技术(如MoE、RLHF、长上下文处理等),推动技术落地。
- 针对业务需求设计实验方案,验证模型效果并持续迭代。
5. 跨团队协作
- 与数据团队合作构建高质量训练数据集,与工程团队协作优化系统架构。
任职要求:
硬性要求:
1. 教育背景
- 计算机科学、人工智能、数学等相关专业硕士及以上学历。
2. 技术能力
- 熟练掌握Python,精通PyTorch/TensorFlow等深度学习框架。
- 熟悉分布式训练框架(如DeepSpeed、Megatron-LM、Horovod等)。
- 熟悉CUDA编程、GPU并行计算及模型性能调优经验。
- 熟悉大模型部署技术(模型压缩、量化、服务化等)。
3. 项目经验
- 3年以上机器学习/深度学习研发经验,至少完整参与过一个大模型(10B+参数)的研发或调优项目。
- 有LLM/CV大模型训练、微调(如LoRA、P-Tuning)或领域适配经验者优先。
加分项:
- 在ACL、NeurIPS、ICML等顶会发表过相关论文。
- 熟悉LangChain、LlamaIndex等大模型应用开发框架。
- 有开源项目贡献或自研框架经验。
- 具备云计算平台(AWS/Azure/阿里云)大模型训练部署经验。
软性要求:
- 极强的逻辑思维能力与技术创新意识。
- 优秀的问题拆解能力,能独立攻克技术难题。
- 良好的团队协作与沟通能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕