职位详情
资深后端研发工程师(AI方向)
1.6-3万
长安通信科技有限责任公司
北京
3-5年
本科
01-12
工作地址

TBD云集中心16号楼长安通信科技有限责任公司

职位描述
工作职责:
1.AI模型工程化落地:主导AI模型的全链路工程化,负责模型微调训练(LoRA/QLoRA)、模型评测体系构建、模型压缩量化、模型格式转换,建立模型质量门禁与自动化评测流程。
2.模型服务化与推理优化:负责模型服务化引擎开发,基于Triton/KubeFlow实现模型0代码部署、弹性伸缩、蓝绿发布;优化推理性能,实现GPU共享/vGPU调度,保障P99延迟<100ms。
3.智能应用与算法开发:开发知识库构建、特征工程、相似度检索等算法模块;实现LLM应用(智能问答/NL2SQL/Agent编排),开发向量检索(Faiss/Milvus)与RAG系统,支持智能体协作。
4.云原生与后端能力:负责AI服务的容器化改造与K8s部署,实现GPU资源池管理与弹性伸缩;开发模型管理API、推理服务、权限控制等后端模块,构建安全可靠的AI系统底座。
5.数据服务集成:实现AI服务与数据平台的集成,开发数据预处理、特征提取、结果回写等连接器;支持Batch/Real-time双模式推理,保障数据管道高可用。
6.技术标准化与赋能:沉淀AI工程化技术规范,封装通用模型模板、推理镜像与SDK;开展技术分享与Code Review,培养初级AI工程师,提升团队算法工程能力。
任职要求
1.专业能力深度:3年以上AI工程化经验,具备从0到1构建模型服务平台的成功案例,有大语言模型应用或向量检索实战经验。
2.技术栈精通:精通PyTorch/TensorFlow框架,熟悉模型微调、量化、蒸馏;掌握Triton/KubeFlow模型部署,了解TensorRT/ONNX优化;熟悉LLM应用开发(LangChain/LlamaIndex)
3.后端与云原生能力:精通Python/Go/C++至少一种,有高并发API设计经验;熟悉Kubernetes GPU调度,掌握容器化与弹性伸缩最佳实践。
4.优先条件:有信创项目国产化适配经验;在内容安全/智能运维等场景有深度实践;有开源项目贡献或技术社区影响力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请