岗位职责:
1.负责大模型(视觉或语言)的预训练开发和调优工作;
2.负责大模型在具体业务场景的适配和应用,如fine-tuning、prompt设计等;
3.负责大模型的推理优化和应用部署,如压缩量化、推理加速等;
4.负责跟进领域最新进展,预研和评估大模型在机器人领域的应用,如Gato、RT-1、PaLM-E。
任职要求:
1.计算机相关专业,熟悉深度学习、计算机视觉、自然语言处理等领域的专业知识,具有1年以上工作经验,硕士及以上学历;
2.熟悉Transformer、BERT、GPT系列、T5、PaLM等模型,对大模型的数据处理及训练技术有深入理解;
3.熟悉Pytorch/Tensorflow深度学习框架,至少掌握Python或C++其中一种编程语言;
4.熟悉常见的强化学习算法原理(如DQN、DDPG、A3C、PPO等),有相关训练和开发经验者优先;
5. 具有TensorRT、ONNX推理优化和部署经验者优先;
6.曾在AI、CV、NLP顶级会议(如:AAAI、CVPR、ACL等)发表论文者优先。