职位描述
岗位内容:
1.负责数据仓库平台、Hadoop大数据平台、数据中台、智能应用、监管报送系统的需求分析、设计开发、测试、投产等工作,保证项目质量;
2.负责跟踪MPP、Hadoop、数据中台、智能应用研发领域的技术研究,以及平台框架核心代码的开发与测试工作;
3.负责解决在数据仓库平台、Hadoop大数据平台集群运营和数据应用支持中的技术难题;
4.清洗和标注垂直领域数据(如行业文档、对话记录)、构建高质量训练数据集(SFT、RLHF 阶段)、设计数据管道(Data Pipeline),支持模型持续迭代。
任职要求:
1.本科及以上学历,计算机及相关专业;
2.具备三年以上数据领域相关工作经验;
3.熟练掌握SQL、Perl、Shell、Python、Java、Scala等开发语言;
4.掌握ETL 工具;熟悉数据标注平台(Label Studio/Doccano)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕