职位描述
【岗位职责】
1. 负责“新能源智慧场站”大模型/小模型的国产化全流程:选型→微调→蒸馏→部署→推理加速;
2. 基于昇腾910B+MindSpore/CANN,完成10亿参数大模型(DeepSeek/QwQ)的分布式训练与2*310I DUO推理卡部署,推理延迟优化;
3. 建设微调流水线:数据标注→继续预训练→LoRA/QLoRA微调→RLHF,支持日更知识库、在线增量学习;
4. 开发小模型(DNN)在昇腾/鲲鹏上的迁移与量化;
5. 与业务团队共建行业知识图谱(电力设备、缺陷诊断、运维规程),构建RAG+Text2SQL问答系统;
6. 编写项目各类技术文档。
【任职要求】
1. 计算机/人工智能相关专业毕业,具备模型训练与落地经验;
2. 熟悉Transformer/MoE结构,有大模型预训练/微调/RLHF完整项目经历;
3. 熟练使用Python+PyTorch/MindSpore训练;
4. 熟悉昇腾NPU架构,能阅读ATC日志、定位算子兼容性问题;
5. 掌握常见模型量化与推理加速,有国产芯片适配经验优先;
6. 接受短期现场调试,具备良好的沟通能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕