岗位职责:
一、职位使命:
构建面向下一代空间智能的Analysis Ready数据服务体系,打造支撑千亿级时空数据实时分析的云原生治理平台,推动地理信息数据与AI模型的深度协同进化。
二、核心职责:
1. 空间数据治理体系构建
主导PB级多源异构地理时空数据(卫星遥感/GIS/物联网传感等)的标准化治理,建立涵盖数据质量、元数据管理、版本控制的完整数据资产目录
设计面向机器学习的数据预处理流水线,实现空间数据的自动化特征工程与AI-ready格式转换
2. 云原生架构设计
设计支持全球尺度时空数据服务的Serverless架构,实现千万级并发查询的毫秒级响应
开发基于空间索引的分布式存储优化方案,融合Geohash/CQL等空间查询语言优化技术
构建弹性可扩展的数据处理管道,集成Spark/Flink等计算框架实现近实时数据更新
3. AI融合创新
设计面向大模型训练的空间数据服务接口,开发支持动态采样的智能数据供给系统
构建空间数据与AI模型的协同迭代机制,实现数据质量反馈驱动的自动化标注系统
研发时空数据特征分析引擎,支持AutoML框架的自动化特征选择
4. 技术生态建设
主导开源地理计算引擎(如GeoSpark/PDAL)的深度定制与性能优化
构建支持多云架构的地理数据服务中间件,实现跨云平台的数据服务无缝迁移
设计空间数据安全治理方案,开发基于区块链的数据溯源追踪系统
三、任职要求:
1.技术硬实力
• 5年以上时空大数据领域经验,主导过国家级地理信息平台架构设计
• 精通GeoSaaS架构模式,具备AWS S3+Lambda+EMR或同类云架构实战经验
• 深度掌握PostGIS/GeoPandas等空间数据处理技术,熟悉OGC标准规范体系
• 熟练运用Dask/Ray等分布式计算框架处理TB级空间数据
• 具备空间数据库优化经验(MongoDB/RedisGeo/ClickHouse等)
• 熟悉AI数据准备全流程,掌握TFRecord/Parquet等高效数据存储格式
2.优先条件
• 具有数字孪生城市/环境监测/智慧交通等场景的AI数据服务经验
• 熟悉空间大模型训练数据准备规范(如SAM地理适配版本)
• 有GeoServer/Mapnik等开源GIS服务器深度开发经验
• 主导过空间数据治理国际标准(ISO/TC211)落地实施
• 掌握Cesium/Mapbox等三维地理可视化技术栈
3.能力维度
• 能准确识别AI模型训练中的数据瓶颈并提供治理方案
• 具备复杂空间数据问题的抽象建模能力
• 优秀的跨领域协同能力(GIS专家+数据工程师+算法科学家)
• 对空间数据价值挖掘有深刻商业洞察"
专业及研究方向:
计算机科学、软件工程、地理信息系统等相关专业硕士及以上学历