职位详情
大数据挖掘工程师
1.8-3.5万
中环汽研(北京)低碳科技有限公司
北京
3-5年
硕士
10-21
工作地址

中环汽研(北京)低碳科技有限公司

职位描述
岗位职责:
作为大数据挖掘算法工程师,你将利用机器学习、深度学习、统计建模、运筹优化等技术,从海量(PB级)汽车行业数据中挖掘价值、构建预测模型、优化决策。你负责处理复杂数据、设计高效算法,解决用户画像、车辆标签、时空预测、推荐排序、因果分析等业务问题,并推动模型在生产环境的应用落地。你需要具备强大的数据处理能力和扎实的算法功底。
主要职责
一、数据挖掘与特征工程:
1.深入分析汽车行业多源异构数据(用户行为、车辆状态、时空轨迹、诊断数据等),进行数据探索、清洗、转换和特征提取。
2.构建高价值特征,支撑上层算法模型。
二、算法模型研发与应用:
1.应用机器学习(XGBoost, LightGBM, Scikit-learn)、深度学习(PyTorch/TF用于非大模型场景)、强化学习、运筹优化、因果推断等技术,研发和优化算法模型,解决:
用户画像与车辆标签: 精准分类、打标、画像构建。
智能推荐与匹配: 提升信息、服务、资源的匹配效率和精准度。
时空数据分析与预测: 车辆轨迹预测、交通流预测、需求预测、驻留点分析等。
车辆诊断与健康管理: 基于数据的故障预测、性能评估。
驾驶行为分析: 安全评分、驾驶风格识别等。
因果推断: 分析策略、活动等的真实效果。
三、大数据处理与模型实现:
1.利用Hive, Spark, Flink, Scala/Python等大数据技术处理和建模PB级数据。
2.在分布式环境下高效实现、训练和评估算法模型。
3.熟悉数仓概念,能有效利用Hive、Doris等数仓进行高效数据查询和模型部署。
四、模型部署与效果迭代:
1.与工程团队合作,将算法模型部署到生产环境。
2.设计监控指标,跟踪模型线上表现,进行AB测试,持续迭代优化模型效果。
五、数据洞察与业务支持:
1.分析模型结果,提炼数据洞察,为业务决策提供数据支持和算法解决方案。
2.与业务、产品团队紧密沟通,理解需求,将业务问题转化为可解的算法问题。
教育背景:
1. 计算机科学、统计学、应用数学、数据科学、运筹学等相关专业硕士及以上学历。
任职要求:
行业经验:
3年以上数据挖掘、机器学习算法研发经验,有处理海量数据(TB/PB级)的实际项目经验。
有汽车行业数据分析或算法应用经验者优先,熟悉车联网数据、用户行为数据、时空数据者尤佳。
有完整的算法项目经验(问题定义、数据准备、特征工程、模型选择调优、评估、部署、监控迭代)。
有用户画像、推荐系统、时空预测、运筹优化、因果推断等任一或多个领域的实战经验。
岗位经验:
任职要求:
技术能力:
精通Python和/或Scala。
扎实的机器学习/数据挖掘理论基础和实践经验,精通常用算法(集成学习、深度学习基础、时序模型、聚类、关联规则等)及模型评估方法。
熟练掌握Spark等进行大数据处理和分布式模型训练。
熟练使用Hive进行数据查询和处理。
熟悉Flink或Kafka在实时数据处理/特征工程中的应用者优先。
具备优秀的特征工程能力和数据敏感性。
了解运筹优化(OR)、因果推断(Causal Inference)方法者优先。
熟悉Doris、ClickHouse等MPP数据库或OLAP引擎者优先。
了解常用深度学习框架(PyTorch/TensorFlow)在非大模型场景(如图像分类、时序预测)的应用。
团队合作: 优秀的沟通能力,能将复杂的技术问题清晰传达给非技术人员;良好的跨团队协作能力。
其他要求: 良好的英语技术文献阅读能力;强烈的解决问题能力和结果导向。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请