职位描述
岗位职责:
1、参与语料清洗、去重、聚类、质量筛选、合成等相关工作,为大模型提供高质量训练语料;
2、参与数据处理系统的开发,支持大模型训练语料持续迭代;
3、协助算法团队,开发实现相关软件需求。
任职要求:
1、本科学历及以上;
2、熟练掌握Python编程语言,熟悉常见的文本数据和图像数据处理方法,能够实现数据清洗、处理算法和流程;
3、熟练掌握Linux使用,熟悉多线程编程;
4、有以下经验者优先:
1)文本数据清洗和处理相关经验;
2)图像数据处理经验;
3)大模型相关经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕