职位详情
AI算法工程师(大模型代理方向)(J10614)
2-3万
南威软件股份有限公司
北京
3-5年
本科
07-21
工作地址

汉威国际广场4区3号楼

职位描述
岗位职责:
1、主导研发基于计算机视觉和多模态大模型的UI理解技术。让Agent能够实时“看懂”屏幕上的内容,精准识别并定位窗口、按钮、输入框、图片等各类UI元素,并理解其功能与上下文关系。
2、构建一个通用的、跨平台的设备控制层,将底层的鼠标、键盘、手机触摸等操作封装为大模型可调用的原子能力,解决在不同分辨率、操作系统和应用界面下的操作泛化性难题。
3、设计和研发专为GUI交互设计的长程规划与决策能力,研发自我纠错与反思机制,当操作失误或遇到非预期界面时,能够自主分析原因并尝试新的解决方案。
4、完成上级安排的相关工作。
任职要求:
1、计算机相关专业本科及以上学历,3年以上大模型相关技术研发经验。
2、深入理解并熟悉主流Agent框架思想(如ReAct、CoT、ToT等)。
3、对大模型的Function Calling/Tool-Using机制有深刻见解和实践。
4、熟悉各类GUI自动化框架,如Browser-use、Playwright、Selenium、Appium、PyAutoGUI等,并理解其底层原理。
5、精通在UI场景下的OCR、目标检测、图像分割等技术,有微调多模态大模型进行UI理解的经验者优先。
6、了解操作系统底层机制(Windows API、Android Accessibility Service等),熟悉如何通过系统级接口获取UI信息和模拟用户输入。
7、熟悉大模型原理,具备SFT、RL等模型训练方面的实战经验,有GUI自动化相关的强化学习经验者优化。
8、对新技术有强烈的热爱、好奇心和钻研精神,具备卓越的团队协作、沟通和问题解决能力,自驱、富有责任心和主人翁精神,极致追求算法创新和产品效果。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请