职位描述
岗位职责:
1.主导物流领域大模型(如LLaMA、Qwen等)的架构设计,包括模型选型、微调策略(如LoRA)、分布式训练及推理优化,提升系统效率与成本效益
2.结合供应链管理、智能仓储、运输调度等业务场景,设计大模型落地方案(如智能路径规划、风险预警、自动化客服),推动技术与业务深度融合
3.构建支持高并发、低延迟的大模型推理框架,集成向量数据库、知识图谱等技术,优化RAG(检索增强生成)在物流知识库中的应用
4.针对国产芯片(如昇腾、寒武纪)优化模型部署,通过量化压缩、算子定制等技术提升硬件利用率,降低算力成本
5.开发文本、图像、时序数据(如物流轨迹)的多模态对齐与融合架构,支持复杂场景分析(如货损识别、库存预测)
6.设计基于Autogen、Crew等框架的智能体系统,实现自动化任务执行(如订单处理异常自主决策)
7.建立模型评估体系(准确率、延迟、资源消耗),持续优化架构瓶颈,保障生产环境稳定性
8.跟踪Speculative Decoding、MoE稀疏化等前沿技术,探索在物流场景的创新应用
9.协同产品、数据团队制定技术规范,推动大模型能力模块化输出至各业务线
10.培养AI工程师,提升团队在架构设计、模型优化领域的综合能力
任职要求:
1.计算机/人工智能相关专业硕士及以上学历
2.5年以上AI架构经验,至少主导过2个完整的大模型项目(从设计到落地),有物流、供应链场景经验者优先
3.精通Transformer/BERT/GPT等架构原理,掌握PyTorch、DeepSpeed等框架,熟悉大模型训练/微调全流程
4.熟练使用vLLM、TensorRT-LLM等推理框架,优化KV-Cache、动态批处理等关键技术;掌握Docker/Kubernetes容器化部署及API开发(Flask/FastAPI)
5.具备国产芯片(华为昇腾等)适配经验,熟悉CUDA/OpenCL内核编程及TVM编译器优化
6.深入理解多模态表征对齐、RAG高级应用(如LLama Index)、智能体框架开发
7.精通模型量化、分布式并行(TP/PP)、推理加速技术(如Speculative Decoding)
8.熟悉物流业务流程(如仓储管理、运输调度),能将AI技术与行业痛点结合
9.极强的跨团队沟通能力、技术规划及落地推动力,能主导复杂技术决策
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕