职位详情
大模型数据工程师
1-1.9万
河北数微信息技术有限公司
秦皇岛
3-5年
本科
06-19
工作地址

开发区数谷大厦

职位描述
岗位职责:
1、设计和开发大规模预训练数据处理链路,为基座模型预训练提供稳定、可靠的高质量数据处理能力,包括数据寻源、数据抓取/采集、数据解析(OCR、图片、网页)等工作内容;
2、设计和开发服务大模型预训练的数据平台,管理数据的元信息、血缘、存储治理等数据全生命周期要素;提供预训练数据的可视化、可观测能力;探索数据实验、数据发版的工程上限;
3、针对LLM、VLM等模型构建数据合成方案和框架,支持数据Scale等工作;
4、根据大模型训练数据特点,抽象并开发高效、可靠的数据加工框架,提升所有大模型算法工程师处理数据的工程效率;
任职要求:
1、本科及以上学历,计算机相关专业优先;
2、三年以上本岗位工作经验;
3、熟悉 Python 编程语言,熟悉计算机图形学,熟悉;
4、良好的沟通协调能力和团队合作精神;
5、较强的主动性、责任心与执行能力,能独立承担任务和有系统进度把控能力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

为您推荐更多相似职位
立即申请