职位详情
数据运营
8000-16000元
合肥市人力资源服务有限公司
合肥
3-5年
本科
01-17
工作地址

世纪阳光大厦

职位描述
岗位职责:
1.数据集全生命周期管理:统筹图像、文本、语音等多模态数据的样本集规划、采集、标注与质检,搭建从原始数据到评测数据的端到端闭环流程;负责数据集版本管理,同时开展千万级等大规模样本数据集的从 0 到 1 建设与长期运营维护。
2.数据质量与合规管控:制定并优化数据质量指标体系,通过自动化质检脚本、交叉验证等方式把控数据质量;熟悉 GDPR 及《个人信息保护法》等法规,落实数据脱敏、差分隐私等手段,确保数据隐私合规,规避版权与隐私风险。
3.流程优化与工具应用:优化数据标注流程和质量控制体系,熟练运用 LabelStudio、CVAT 等标注平台;开发 Python 脚本等自动化工具,加速数据预处理,提升数据处理效率;建设数据可视化平台,对样本分布、标注质量等进行多维度监控预警。
4.跨部门协作与需求对接:和算法工程师协作,依据模型需求优化数据集结构,调整样本权重分配等;对接业务、产品等部门,明确数据需求,根据业务反馈迭代数据集,支撑算法迭代与业务上线需求。
5.文档与风险把控:撰写数据集元数据、使用说明等文档,做好数据溯源;监控数据漂移问题,及时提出迭代方案,同时排查数据合规风险并预警,保障数据稳
定供应。

任职要求:
1.本科及以上学历,35周岁以下,计算机科学、数据科学、统计学、电子信息等相关专业;
2.熟练使用 Python(搭配 Pandas、NumPy 等库)及 SQL,可完成数据清洗、筛选等处理工作;熟悉数据版本管理方案。
3.了解机器学习数据流程,掌握特征工程、数据集划分及准确率等评估指标;熟悉自动化质检相关方法,如 IoU、一致性检验等。
4.能熟练操作常见数据标注与管理工具。
5.具备较强的数据敏感性、逻辑分析能力,能快速定位并解决数据异常问题;同时有良好的沟通协调能力,可对接内外部资源推进工作。
6.NLP、CV 等特定领域数据处理经验;掌握联邦学习、可信执行环境等合规技术;具备大数据主流框架及组件相关知识储备者优先。
【此岗位为外包岗位,一经录用,与合肥市人力资源服务有限公司签订劳动合同】

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请