职位详情
大模型应用开发工程师
1.5-1.7万·14薪
上海新炬网络信息技术股份有限公司
广州
1-3年
本科
05-14
工作地址

银汇大厦21楼

职位描述
岗位职责:
1. 基于公司业务需求,设计并开发基于大模型(如LLM、多模态模型等)的应用解决方案,包括API集成、后端服务等开发。
2.优化模型推理性能(如量化、剪枝、分布式部署),提升响应速度与资源利用率,降低推理成本。
3.参与模型微调(Fine-tuning)或提示工程(Prompt Engineering),结合业务场景定制化模型能力(如知识问答、文本生成、图像分析等)。
4.开发自动化工具或脚本,提升模型训练、测试、部署的效率。
5.负责大模型在生产环境的部署、监控与运维(如Kubernetes集群管理、容器化部署),确保高可用性和低延迟。
6.设计并实施容灾方案、负载均衡策略及弹性扩缩容机制,应对高并发场景。
7.监控模型服务性能指标(如QPS、延迟、错误率),快速定位并解决线上问题(如OOM、性能瓶颈)。
8. 建立日志与指标分析体系,推动运维自动化(如告警系统、自动化扩缩容脚本)。
岗位要求:
1. 本科及以上学历,计算机、软件工程、人工智能等相关专业。
2.2年以上大模型相关应用开发或运维经验,熟悉至少一种主流大模型(如QWen、GLM、LLaMA等)的应用开发流程。
3. 具备大规模分布式系统开发经验者优先(如云原生、微服务架构)。
4.熟练掌握Python/Java/Go等语言,熟悉深度学习框架(PyTorch/TensorFlow),有vllm、ModelScope魔搭平台的二开开发经验优先。
5.熟悉Kubernetes、Docker等容器化技术,具备Linux系统运维经验。
6.了解模型量化、蒸馏、加速技术,有模型部署与性能调优经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请