外包岗位,学信网可查本科学历及以上学历,入职会背调
工作时间:9:30-18:30,双休,入职缴纳五险一金
职位描述
1、构建并维护结构化/非结构化数据库;
2、执行数据清洗、特征提取及质量控制;
3、整理化合物、生物活性、ADMET等多源数据;
4、与AI算法组合作交付高质量数据与代码版本管理维护;
5、制定数据标准及安全规范。
职位要求
1、计算机、信息科学或生物信息学相关专业本科及以上学历;
2、熟练掌握Python SQL Pandas, 熟悉MapReduce 或 Spark 程序 熟练进行常见的大数据任务开发
3、五年以上大数据开发经验 能够独立完成中小型大数据项目的开发 包括数据处理流程设计 代码实现和测试, 熟悉数据预处理流程,为AI算法team交付高质量的数据以及进行代码维护
4、掌握常见的数据处理工具(如 Kafka) 能够进行数据的导入和导出
5、有科研数据标注经验者优先,了解化学/药物相关数据库(ChEMBL、PubChem等)者优先;
6、具有与ai算法项目合作进行相关数据pipeline开发管理交付经验优先
7、逻辑思维清晰,较强学习能力,具备团队协作精神。