职位详情
强化学习算法工程师
1.5-2.3万
北京华戍防务技术有限公司
长沙
3-5年
本科
01-15
工作地址

湘域智慧-南栋1005号

职位描述
岗位职责描述:
1、负责基于 Python 的人工智能算法与模型开发,重点涉及强化学习算法的实现、调试和优化,确保算法满足业务场景的性能要求。
2、参与强化学习系统架构设计与搭建,制定技术方案和开发规范,指导团队成员进行模块开发,保证系统的整体质量。
3、承担规则智能体的设计与开发工作,根据业务规则和逻辑,构建高效、准确的规则智能体,实现智能决策功能。
4、探索大模型在强化学习领域的应用,将大模型与强化学习技术相结合,提升系统的智能化水平和处理复杂问题的能力。
5、利用仿真平台进行智能体的训练、测试和验证,搭建仿真环境,设计测试用例,评估智能体的性能,不断迭代优化模型。
6、撰写相关的技术文档,包括算法设计文档、开发手册、测试报告等,确保技术成果的可追溯性和可复用性。
任职要求:
1、精通 Python 编程语言,熟练运用 常用数据处理及深度学习框架,具备良好的代码规范和开发习惯
2、深入理解强化学习核心算法(如 PPO、A2C 等),熟悉强化学习的理论基础与数学原理,能够独立设计、实现和优化强化学习模型。
3、具备强化学习系统架构设计经验,能够根据业务需求规划系统整体架构,掌握规则智能体的设计与开发方法,能够将业务规则转化为可执行的智能体逻辑
相关工作经验:
1、能够快速理解业务需求,并将其转化为具体的人工智能技术方案,制定合理的开发计划和时间节点。
2、具备较强的问题解决能力,在模型训练、系统开发过程中能够及时发现并解决出现的技术难题,确保项目顺利推进。
3、拥有良好的团队协作精神,能与产品、测试等相关部门紧密配合,共同完成项目目标。
4、保持对人工智能领域新技术、新算法的敏感度和学习热情。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请