职位描述
大模型开发工程师
岗位职责:
1、负责搭建公司私有化大模型,结合公司业务需求与技术架构,完成框架的选型、设计、搭建及优化工作;
2、基于私有化大模型进行模型微调、轻量化部署与功能开发。包括但不限于收集、整理、清洗行业专属数据,运用深度学习技术与合适的训练算法,对模型进行有针对性的训练,使其精准适配行业特性与业务场景;
3、参与 AI 模块的需求分析与方案设计,输出技术文档、部署手册与测试用例,确保方案符合软件开发的流程规范与合规要求;
4、于训练好的行业模型,与业务团队紧密协作,进行各种业务应用场景开发;
5、跟踪模型在实际业务中的运行效果,通过用户反馈与业务数据迭代优化模型参数、prompt 策略,解决应用场景中的各类问题。
任职要求:
1、计算机科学、人工智能或相关领域本科以上学历,具有3年以上AI研发经验;
2、具备扎实的数据结构和算法基础,精通机器学习、深度学习的理论基础和算法;
3、熟练掌握 PyTorch/TensorFlow 等深度学习框架,具备大模型微调(LoRA/QLoRA)、预训练数据处理、推理部署等全流程开发经验;
4、熟悉开源大模型生态(如 Qwen、Llama、ChatGLM),了解 MoE 架构、模型量化(AWQ/GPTQ)、推理加速(vLLM/SGLang)等核心技术;
5、熟悉 RAG 检索增强生成技术,能够构建行业专属知识库并实现与大模型的联动;
6、熟练掌握数据处理与分析技术,精通 Python 语言及其数据处理库(如 Pandas、Numpy 等),能够高效完成行业数据的清洗、预处理、特征工程等任务,确保数据质量满足模型训练要求;
7、有 OCR + 大模型实现文档结构化、报告合规校验等相关项目经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕