「广州黄埔区工具链开发岗——广东电力人工智能试验研究院有限公司（南网正编）招聘」

职位详情

工具链开发岗——广东电力人工智能试验研究院有限公司（南网正编）

2-4万

智联猎头

广州

3-5年

本科

09-26

工作地址

云升科学园

职位描述

岗位职责：

1.负责公司级人工智能工具链的整体架构规划、建设与持续治理，覆盖大模型微调/蒸馏、仿真环境、强化学习训练、自动化检验检测等核心子系统，打造端到端、高效、可复现的研发基础设施。主导大模型微调与蒸馏平台的设计开发，支持LoRA/QLoRA、Adapter、P-Tuning、MoE稀疏微调、知识蒸馏、量化感知训练等最新技术，实现千亿级参数模型在小时级内完成低成本微调与压缩。
2.构建多模态仿真与强化学习环境：对接IsaacSim、Gazebo、AirSim、CARLA、MuJoCo、Unity3D等引擎，统一场景管理、奖励设计、并行采样与回放系统，支撑机器人、电力系统仿真等业务的RL快速迭代。
3.设计并落地自动化检验检测流水线：集成模型对抗测试、鲁棒性评估、公平性检测、性能基准回归、安全扫描（PromptInjection、数据投毒）等工具。
4.打通工具链与MLOps、CI/CD、数据管线、模型仓库的接口，制定统一SDK、CLI、REST/gRPCAPI。
5.完成公司交办的其他工作任务。

任职要求：

1.工作经验：具有3年以上AI工具链或分布式训练系统核心开发经验优先，主导过至少1套覆盖大模型微调/蒸馏、仿真或强化学习平台的端到端落地优先。
2.能力要求：
（1）熟悉Python/C++，深入掌握PyTorch、JAX、DeepSpeed、Megatron-LM、Colossal-AI、vLLM、LoRA/QLoRA、知识蒸馏（MiniLLM、GKD）等源码及调优技巧，能在千卡规模集群上实现90%+线性加速比的微调与蒸馏；
（2）熟悉分布式仿真与RL框架：熟悉RayRLlib、Stable-Baselines3、PettingZoo、IsaacGym、AirSim、CARLA、MuJoCo的二次开发；熟悉并行环境采样、异步rollout、RewardModel训练、RLHF全流程；
（3）熟悉自动化测试与质量门禁体系：熟悉pytest、GreatExpectations、MLflow、Weights&Biases、EvidentlyAI、HolisticBias等工具，能编写鲁棒性、对抗性、公平性、性能回归、安全扫描自动化脚本。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕