8000-15000元·13薪
周口路97号20号楼中恒信
岗位职责:
1. 大模型平台建设
不局限于模型设计、prompt优化、预训练、模型加速、数据集能力建设等多个方面,负责大模型(如DeepSeek、GPT等)的选型、部署、精调及优化,确保模型在业务场景中的高效应用。
2. 文档智能处理
具备 OCR 相关开发经验,使用OCR等技术处理复杂文档,实现关键信息提取及分析,
优化模型训练流程,提升模型在业务场景下的准确率,支持多模态数据(文本、表格、图像)处理。
3. 设计并实现领域的大语言模型(如 Qwen、Deepseek等)
重点解决数据理解、合规性分析、风险分析等核心问题。
4. 应用搭建与开发
开发基于AI的智能Agent,支持自动化任务处理、数据分析等场景。
构建知识库,整合法规政策、审计案例、内控文档等非结构化数据,集成大模型进行检索及分析。
5. 系统集成
结合公司现有数据资源,构建数据驱动的AI应用,提升数据价值。
设计数据清洗与标注流程,确保训练数据符合相关要求,敏感信息脱敏处理。
设计并实现数据预处理、特征工程、模型训练与评估的全流程。
6. AI技术研究与创新
跟踪AI领域的前沿技术,探索大模型、Agent等技术创新应用。参与公司AI技术路线规划,推动技术成果的落地与推广。
7. 团队协作与知识分享
与其他成员紧密合作,推动AI技术在业务中的应用。组织技术培训与分享,提升团队整体的AI技术能力。
任职要求:
(1) 计算机、自动化、数学等相关专业,硕士或以上学历。
(2) 至少2年以上在AI领域的工作经验,特别是大语言模型的开发和优化经验。
(3) 精通多模态预训练模型技术,精通分布式训练技术,具备多模态预训练大模型经验。
(4) 熟悉主流 OCR 框架与工具,能设计OCR 与业务流程及大模型的融合方案。
(5) 熟悉Transformer框架以及常用的开源大模型如GPT、Qwen、Lamma等。
(6) 熟悉数据增强与清洗策略,有大规模多模态数据(图文对、视频-文本、语言指令)处理及训练经验者优先。
(7) 掌握java及python开发语言。
(8) 对自然语言处理和机器学习领域的前沿技术有深入的了解和研究。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕