2-4万
上海正泰智电港A3
岗位职责
1. 多模态大模型在工业场景的应用与落地:
- 聚焦电力行业文档理解(如设备手册、运维报告、标准规范)、工程图纸识别(如电气原理图、接线图、光伏电站布局图)、工业视觉质检(如光伏组件缺陷检测、电气设备外观检测) 等核心场景;
- 负责或参与多模态场景交流与挖掘、方案调研与设计、可行性分析与验证、技术选型与架构设计;
- 负责或参与多模态场景落地开发,能够结合业务和模型特点进行数据准备、多模态模型结构优化和模型参数调优等工作;
- 主导或参与多模态大模型(图像+文本,可能涉及视频、时序数据等)的训练、微调(包括预训练、SFT、PEFT、RLHF等)、效果评测与持续优化迭代;
- 探索并实践大模型推理加速技术,确保模型在工业现场或边缘设备的实际可用性;
- 推动技术方案在实际业务场景(如光伏工厂、电站运维中心、研发部门)的落地部署和应用验证。
2. 模型开发与工具链建设:
- 参与构建支持多模态大模型应用落地的数据生产、模型训练、评测体系、推理服务等环节的代码库和工具链;
- 结合实际业务需求,开发和维护高效、可靠的AI工程化工具和平台组件;
- 编写高质量的、可维护的代码,并遵循良好的软件工程实践。
3. 技术前瞻与创新:
- 紧密跟进国内外多模态大语言模型、生成式AI(AIGC)领域的前沿研究动态和技术趋势;
- 探索新型多模态模型架构、训练方法(特别是针对工业数据特点)以及创新应用形态;
- 评估新技术在电力、新能源等业务场景的应用潜力和落地路径。
任职要求
1. 5年以上人工智能领域相关工作经验,具有扎实的NLP、CV或多模态方向的技术背景;
2. 深入理解主流大模型(LLM/VLM)的技术原理,包括但不限于Transformer架构、注意力机制、预训练目标、微调策略(SFT, PEFT, RLHF)等;
3. 具有实际的大模型训练或微调项目经验,熟悉大规模分布式训练框架(如 Megatron-LM, DeepSpeed)的使用和优化;
4. 优秀的工程实践能力:精通 PyTorch 或 TensorFlow 等深度学习框架,具备扎实的编程功底(Python为主),良好的编码习惯和调试能力;
5. 熟悉多模态学习基础:了解图像、文本、视频等不同模态数据的表示、对齐与融合技术;
6. 对生成式AI(AIGC)和多模态大模型领域有浓厚兴趣和热情,对技术前沿有敏锐的洞察力,熟悉相关进展(如GPT系列、LLaVA、Gemini等多模态模型);
7.优秀的英文文献阅读能力,能够快速吸收和理解国际前沿研究成果。
本招聘信息相关内容最终以双方所签署的劳动合同约定内容为准~
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕