职位描述
1. 负责大语言模型及多模态大模型的预训练开发和调优工作;
2. 负责基于大模型的机器人控制算法设计、训练、数据集处理、及真机部署测试;
3. 负责大模型训练效率提升,如:模型并行、flash attention、LoRA;
4. 负责跟进领域最新进展,预研和评估大模型在机器人领域的应用, 如RT系列等。
任职要求:
1、硕士及以上学历,985/211院校毕业优先。计算机相关专业,熟悉深度学习、计算机视觉、自然语言处理等领域的专业知识,具有3年以上工作经验;
2、熟悉Transformer、BERT、GPT系列、T5、PaLM等模型,对大模型的数据处理及训练技术有深入理解;
3、熟悉Pytorch/Tensorflow深度学习框架,至少掌握Python或C++其中一种编程语言;
4、熟悉常见的强化学习算法原理(如DQN、DDPG、A3C、PPO等),有相关训练和开发经验者优先;
5、具有TensorRT、ONNX推理优化和部署经验者优先;
6、曾在AI、CV、NLP顶级会议(如:AAAI、CVPR、ACL等)发表论文者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕