【岗位职责】
1、负责工业场景下的强化学习算法设计、实现与优化,推动算法在实际业务场景中落地;
2、针对纺织行业工艺流程(如布料传输、裁剪、缝纫等)构建高效的强化学习任务建模与训练框架;
3、实现并优化SAC、PPO等主流强化学习算法,并根据业务需求进行定制化改进;
4、与产品、机械、电控、工艺等团队紧密合作,理解工艺需求并转化为可执行的算法模型;
5、跟踪强化学习和智能决策领域的前沿技术,推动技术在公司业务中的创新应用。
【岗位要求】
1、强化学习理论扎实,熟悉价值函数、策略梯度、模型预测等核心方法;
2、熟练掌握PPO、SAC、TD3、DDPG等先进强化学习算法,能根据实际需求进行算法选择与优化;
3、至少有一个强化学习项目在工业实际场景中的落地经验,如自动调参系统等;
4、编程基础扎实,熟练掌握Python,熟悉TensorFlow或PyTorch框架,具备良好的代码规范和工程化能力;
5、具备快速学习与业务抽象能力,能在短时间内理解纺织制造相关的工艺流程与控制逻辑;
6、具备良好的团队协作能力、沟通能力和工程意识