岗位职责:
1.负责行业大模型、多模态大语言模型的技术研发工作,聚焦行业模型的增量训练、精调、强化学习、多模态特征的对齐等技术研究;
2.负责大模型应用成果转化,与业务专家合作,了解业务产品需求并转化为大模型应用方案,主导相关应用的开发实施,负责大模型业务场景应用落地端到端工作等。
任职要求:
1.硕士及以上学历,2年以上算法研发经验,有相关模型的研究开发经验者优先。
2.熟练掌握至少一种编程语言,如 Python、C++ 等,熟悉深度学习框架,如 TensorFlow、PyTorch 等;深入理解机器学习、深度学习的基本概念和算法,掌握自然语言处理或计算机视觉的相关技术和方法,如词向量、语法分析、图像识别、视频分析等;了解大模型的架构和原理,如 Transformer、BERT、GPT 等。