职位详情
技术研究(大模型) (MJ011659)
3-4万
上海正泰电器国际贸易有限公司
上海
5-10年
硕士
07-10
工作地址

上海正泰智电港A3

职位描述

岗位职责


1. ​多模态大模型在工业场景的应用与落地:​​

- 聚焦电力行业文档理解(如设备手册、运维报告、标准规范)、工程图纸识别(如电气原理图、接线图、光伏电站布局图)、工业视觉质检(如光伏组件缺陷检测、电气设备外观检测)​​ 等核心场景;

- 负责或参与多模态场景交流与挖掘、方案调研与设计、可行性分析与验证、技术选型与架构设计;

- 负责或参与多模态场景落地开发,能够结合业务和模型特点进行数据准备、多模态模型结构优化和模型参数调优等工作;

- 主导或参与多模态大模型(图像+文本,可能涉及视频、时序数据等)的训练、微调(包括预训练、SFT、PEFT、RLHF等)、效果评测与持续优化迭代;

- 探索并实践大模型推理加速技术,确保模型在工业现场或边缘设备的实际可用性;

- 推动技术方案在实际业务场景(如光伏工厂、电站运维中心、研发部门)的落地部署和应用验证。

2. ​模型开发与工具链建设:​​

- 参与构建支持多模态大模型应用落地的数据生产、模型训练、评测体系、推理服务等环节的代码库和工具链;

- 结合实际业务需求,开发和维护高效、可靠的AI工程化工具和平台组件;

- 编写高质量的、可维护的代码,并遵循良好的软件工程实践。

3. ​技术前瞻与创新:​​

- 紧密跟进国内外多模态大语言模型、生成式AI(AIGC)领域的前沿研究动态和技术趋势;

- 探索新型多模态模型架构、训练方法(特别是针对工业数据特点)以及创新应用形态;

- 评估新技术在电力、新能源等业务场景的应用潜力和落地路径。


任职要求

1. ​5年以上人工智能领域相关工作经验,具有扎实的NLP、CV或多模态方向的技术背景;​

2. ​深入理解主流大模型(LLM/VLM)的技术原理,包括但不限于Transformer架构、注意力机制、预训练目标、微调策略(SFT, PEFT, RLHF)等;​

3. 具有实际的大模型训练或微调项目经验,熟悉大规模分布式训练框架(如 ​Megatron-LM, DeepSpeed)的使用和优化;​

4. 优秀的工程实践能力​:精通 ​PyTorch​ 或 TensorFlow 等深度学习框架,具备扎实的编程功底(Python为主),良好的编码习惯和调试能力;

5. 熟悉多模态学习基础​:了解图像、文本、视频等不同模态数据的表示、对齐与融合技术;

6. 对生成式AI(AIGC)和多模态大模型领域有浓厚兴趣和热情,对技术前沿有敏锐的洞察力,熟悉相关进展(如GPT系列、LLaVA、Gemini等多模态模型);

7.优秀的英文文献阅读能力,能够快速吸收和理解国际前沿研究成果。


本招聘信息相关内容最终以双方所签署的劳动合同约定内容为准~

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请