职位详情
工具链开发岗——广东电力人工智能试验研究院有限公司(南网正编)
2-4万
智联猎头
广州
3-5年
本科
09-26
工作地址

云升科学园

职位描述
岗位职责:
1.负责公司级人工智能工具链的整体架构规划、建设与持续治理,覆盖大模型微调/蒸馏、仿真环境、强化学习训练、自动化检验检测等核心子系统,打造端到端、高效、可复现的研发基础设施。主导大模型微调与蒸馏平台的设计开发,支持LoRA/QLoRA、Adapter、P-Tuning、MoE稀疏微调、知识蒸馏、量化感知训练等最新技术,实现千亿级参数模型在小时级内完成低成本微调与压缩。
2.构建多模态仿真与强化学习环境:对接IsaacSim、Gazebo、AirSim、CARLA、MuJoCo、Unity3D等引擎,统一场景管理、奖励设计、并行采样与回放系统,支撑机器人、电力系统仿真等业务的RL快速迭代。
3.设计并落地自动化检验检测流水线:集成模型对抗测试、鲁棒性评估、公平性检测、性能基准回归、安全扫描(PromptInjection、数据投毒)等工具。
4.打通工具链与MLOps、CI/CD、数据管线、模型仓库的接口,制定统一SDK、CLI、REST/gRPCAPI。
5.完成公司交办的其他工作任务。
任职要求:
1.工作经验:具有3年以上AI工具链或分布式训练系统核心开发经验优先,主导过至少1套覆盖大模型微调/蒸馏、仿真或强化学习平台的端到端落地优先。
2.能力要求:
(1)熟悉Python/C++,深入掌握PyTorch、JAX、DeepSpeed、Megatron-LM、Colossal-AI、vLLM、LoRA/QLoRA、知识蒸馏(MiniLLM、GKD)等源码及调优技巧,能在千卡规模集群上实现90%+线性加速比的微调与蒸馏;
(2)熟悉分布式仿真与RL框架:熟悉RayRLlib、Stable-Baselines3、PettingZoo、IsaacGym、AirSim、CARLA、MuJoCo的二次开发;熟悉并行环境采样、异步rollout、RewardModel训练、RLHF全流程;
(3)熟悉自动化测试与质量门禁体系:熟悉pytest、GreatExpectations、MLflow、Weights&Biases、EvidentlyAI、HolisticBias等工具,能编写鲁棒性、对抗性、公平性、性能回归、安全扫描自动化脚本。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请