岗位职责:
1、 参数数学模型数据清洗方面的工作,包括收集、整理与清洗等内容,优化数据质量
2、 参数数学模型数据合成方面的工作,包括预训练数据、后训练数据等内容
3、 参与数学模型预训练验证相关工作,对数据配比、数据调度等方向进行优化
4、 参与数学模型后训练对齐相关工作,包括指令微调、强化学习方面的内容
任职要求:
1、熟悉大模型、深度学习、机器学习等相关领域的基本概念和技术。
2、具备较强的编程能力,熟悉Python,对TensorFlow、PyTorch等主流深度学习框架有一定的使用经验。
3、掌握业界领先大模型的基本原理和训练以及微调方法,如LLaMA、Qwen、deepseek等模型的训练过程及LoRA微调等。
4、对大模型的数据合成、数据处理、数据质量评估等方面具有相应的研究经验。