「北京昌平区资深后端研发工程师（AI方向）招聘」_2026年长安通信科技有限责任公司招聘-智联招聘

职位详情

资深后端研发工程师（AI方向）

1.6-3万

长安通信科技有限责任公司

北京

3-5年

本科

01-12

工作地址

TBD云集中心16号楼长安通信科技有限责任公司

职位描述

工作职责:
1.AI模型工程化落地:主导AI模型的全链路工程化，负责模型微调训练（LoRA/QLoRA）、模型评测体系构建、模型压缩量化、模型格式转换，建立模型质量门禁与自动化评测流程。
2.模型服务化与推理优化:负责模型服务化引擎开发，基于Triton/KubeFlow实现模型0代码部署、弹性伸缩、蓝绿发布；优化推理性能，实现GPU共享/vGPU调度，保障P99延迟<100ms。
3.智能应用与算法开发:开发知识库构建、特征工程、相似度检索等算法模块；实现LLM应用（智能问答/NL2SQL/Agent编排），开发向量检索（Faiss/Milvus）与RAG系统，支持智能体协作。
4.云原生与后端能力:负责AI服务的容器化改造与K8s部署，实现GPU资源池管理与弹性伸缩；开发模型管理API、推理服务、权限控制等后端模块，构建安全可靠的AI系统底座。
5.数据服务集成:实现AI服务与数据平台的集成，开发数据预处理、特征提取、结果回写等连接器；支持Batch/Real-time双模式推理，保障数据管道高可用。
6.技术标准化与赋能:沉淀AI工程化技术规范，封装通用模型模板、推理镜像与SDK；开展技术分享与Code Review，培养初级AI工程师，提升团队算法工程能力。
任职要求
1.专业能力深度:3年以上AI工程化经验，具备从0到1构建模型服务平台的成功案例，有大语言模型应用或向量检索实战经验。
2.技术栈精通:精通PyTorch/TensorFlow框架，熟悉模型微调、量化、蒸馏；掌握Triton/KubeFlow模型部署，了解TensorRT/ONNX优化；熟悉LLM应用开发（LangChain/LlamaIndex）
3.后端与云原生能力:精通Python/Go/C++至少一种，有高并发API设计经验；熟悉Kubernetes GPU调度，掌握容器化与弹性伸缩最佳实践。
4.优先条件:有信创项目国产化适配经验；在内容安全/智能运维等场景有深度实践；有开源项目贡献或技术社区影响力。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕