职位描述
岗位职责:
1. 平台架构设计与落地
- 主导数据标注平台架构设计,协同算法与IT团队,规划大模型数据规模、类型及结构,确保技术方案与业务需求精准匹配;
- 构建高扩展性数据湖平台(Hudi/Iceberg/Hive),支撑海量非结构化数据存储、预处理(去重/脱敏/相似度计算)及安全迭代。
2. 智能化工具研发
- 开发语音/文本多模态标注工具,优化标注效率与用户体验;
- 探索机器学习辅助标注技术,推动自动化流程落地,提升数据质量与处理速度。
3. 性能优化与技术升级
- 持续监控平台性能,优化数据库查询与存储结构,解决高并发场景下的技术瓶颈;
- 跟踪大数据与AI技术前沿,引入Spark/Flink/Ray等框架提升平台计算效率。
4. 跨团队协作与创新
- 与算法团队深度协作,将研发需求转化为高效平台功能,提升整体生产力;
- 推动数据处理技术的智能化升级,为大模型训练提供底层技术支持。
岗位要求:
1. 硬性条件
- 硕士及以上学历,计算机/人工智能相关专业优先;
- 5年以上全栈开发经验,3年团队管理经验,年龄≤45岁。
2. 技术能力
- 精通Python/Java,熟悉TensorFlow/PyTorch等框架,具备文本/图像数据处理实战经验;
- 深度掌握数据湖技术(Hudi/Iceberg)及大数据计算框架(Spark/Flink/Hadoop);
- 熟悉数据清洗、特征工程、数据增强等技术,能解决复杂数据问题。
3. 项目经验
- 主导过大模型数据平台或离在线场景数据湖建设,有海量图片/视频数据处理经验者优先;
- 具备开源框架开发或数据标注工具研发经验者加分。
4. 核心素质
- 抗压能力强,擅长拆解复杂问题并制定创新解决方案;
- 优秀的团队协作能力,能高效协调资源推动项目落地。
薪资待遇:年薪60-80万(含基础薪资+绩效奖金+项目分红+技术成果奖励);六险一金、年度体检、带薪年假、节日礼金、技术大会参会机会;提供顶级硬件设备及云计算资源支持。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕