「深圳南山区大模型应用算法工程师招聘」_2026年深圳市中誉艾科科技有限公司招聘-智联招聘

职位详情

大模型应用算法工程师

1.2-1.8万

深圳市中誉艾科科技有限公司

深圳

1-3年

本科

12-28

工作地址

曙光大厦12楼12号

职位描述

前沿模型选型与微调
针对业务场景评估LLaMA/Qwen等开源或商用大模型的优缺点，完成全参、LoRA、QLoRA、RLHF、DPO 等微调，使模型在垂直领域达到上线精度
。
数据工程与知识库构建
负责海量文本/多模态数据的采集、清洗、去重、配比、指令构造、质量评估，并建立可更新版本的知识库或向量索引，为 RAG、Agent 提供检索底座
。
模型压缩与推理加速
应用量化、剪枝、蒸馏、Flash-Attention、vLLM、TensorRT-LLM、Triton 等方案，在 GPU/昇腾/NPU 上实现 2-10× 推理加速与显存压缩，满足线上低延迟、高并发要求
。
应用框架与智能体开发
基于 LangChain、LlamaIndex、Dify、Coze、AutoGPT 等搭建 Agent，完成多轮对话、工具调用 (Tool Calling)、任务规划、意图路由、工作流编排，实现复杂业务自动化
。
高性能服务化与部署
使用 Python/FastAPI/Tornado 开发异步推理服务，封装 REST/gRPC 接口；用 Docker+K8s+Helm 做容器化编排，实现灰度发布、弹性伸缩、负载均衡与可观测性
。
存储与检索系统
设计 PostgreSQL、Redis、Milvus/Elasticsearch 等混合存储方案，支持结构化元数据、缓存、向量检索与关键词检索，提高多路召回效率
。
性能监控与持续优化
构建线上指标体系（QPS、Latency、TTFT、TP99、吞吐、GPU 利用率），定位瓶颈并迭代优化；通过 A/B 实验验证业务效果（准确率、转化率、用户满意度）
。
技术跟踪与内部赋能
持续阅读顶会论文（NeurIPS、ICML、ACL、EMNLP）、跟踪开源社区动态，定期输出技术报告与最佳实践，推动团队技术升级与知识共享