职位描述:
我们正在寻找一位技术扎实且富有创新精神的大模型AI应用与部署工程师,加入我们的团队,专注于将先进的大模型(如GPT、BERT等)应用到实际业务场景中。你将负责大模型的部署、优化、集成以及后续的监控与维护,确保AI解决方案能够高效、稳定地支持业务需求。
主要职责:
1. 模型部署与优化:负责将预训练的大模型(如QWEN、DEEPSEEK等)部署到生产环境,优化模型推理性能,降低延迟和资源消耗。
2. 模型集成:将大模型与现有业务系统(如Web应用、移动端、数据库等)无缝集成,确保AI功能能够顺利落地。
3. 性能调优:通过模型压缩、量化、蒸馏等技术优化模型性能,提升推理效率,降低成本。
4. API开发与维护:设计和开发面向业务团队的API接口,确保模型能力能够被灵活调用。
5. 模型监控与维护:监控模型在生产环境中的表现,及时发现并解决性能下降或异常问题,确保系统的稳定性和可靠性。
6. 技术文档编写:撰写清晰的技术文档,包括模型部署流程、API使用指能优化方案等。
7. 跨团队协作:与产品经理、开发团队、运维团队紧密合作,确保AI解决方案能够满足业务需求并顺利交付。
技术要求:
1. 教育背景:计算机科学、软件工程、人工智能或相关领域的本科及以上学历。2. 编程技能:熟练掌握Python,熟悉至少一种后端开发语言(如Java、Go、Node.js等)。
3. 模型部署经验:熟悉大模型(如QWEN、DEEPSEEK等)的部署工具(如TensorFlowServing、TorchServe、FastAPI等),具备模型推理优化的经验。
4. API开发:有丰富的API设计与开发经验,熟悉RESTfulAPI或GraphQL。
5. 云计算与容器化:熟悉主流云计算平台(如AWS、GCP、Azure等),具备Docker、Kubernetes等容器化技术的使用经验。
6. 数据处理:熟悉数据处理工具(如Pandas、NumPy等),具备数据清洗、预处理和特征工程的经验。
7. 问题解决能力:具备较强的分析和解决问题的能力,能够独立应对复杂的技术挑战。
8. 团队合作:良好的沟通能力和团队合作精神,能够在跨职能团队中有效协作。
加分项:
1. 有实际的大模型(如QWEN、DEEPSEEK等)应用经验,特别是在业务场景中的落地经验。
2. 熟悉Prompt Engineering(提示工程)和Fine-tuning(微调)技术。
3. 有高性能计算(HPC)或GPU集群的使用经验。
4. 熟悉CI/CD工具(如Jenkins、GitLab CI等),具备自动化部署的经验。