职位详情
强化学习算法工程师
2-4万
北京清创智科科技有限公司
北京
3-5年
硕士
03-24
工作地址

清华同方科技大厦A座(南门)

职位描述
【岗位职责】:
1、负责强化学习算法的研究、开发和应用,解决实际问题并提升业务效果;
2、设计和实现强化学习模型,包括但不限于价值迭代、策略梯度、模型预测控制等算法;
3、对现有强化学习算法进行优化和改进,提高算法的稳定性和收敛速度;
4、与数据工程师和产品团队合作,将强化学习算法集成到产品和服务中;
5、跟踪强化学习领域的最新研究进展,不断探索和创新,推动公司技术发展;
6、参与撰写技术文档,为团队提供算法知识和技能培训;
7、参与项目的需求分析、方案设计和技术评审。

【任职要求】:
1、计算机科学、人工智能、数学或相关专业硕士及以上学历,有3年以上强化学习算法开发经验;
2、熟悉强化学习的基本理论和算法,如Q-Learning、SARSA、Deep Q-Network (DQN)、Policy Gradient等;
3、具备扎实的数学基础,包括概率论、统计学、线性代数等;
4、熟练掌握至少一种编程语言,如Python,并熟悉TensorFlow、PyTorch等深度学习框架;
5、具备良好的科研能力,有在相关领域发表过论文者优先;
6、具备良好的逻辑思维能力和问题解决能力,能够独立分析和解决复杂问题;
7、有实际应用强化学习算法解决复杂问题的经验,如游戏、机器人控制、自动驾驶等;
8、具备良好的团队合作精神和沟通能力,能够与不同部门有效协作;
9、对技术创新有热情,愿意不断学习新知识,适应快速变化的技术环境。

【公司亮点】:
国企背书、发展稳定、五险一金、月度补贴、企业年金、法定假期、项目奖金、年终奖金

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请