职位详情
AI应用架构师(大模型方向)
2-4万
南京市水利规划设计院股份有限公司
南京
3-5年
本科
12-06
工作地址

南京市水利规划设计院股份有限公司

职位描述

岗位职责:

1、大模型应用架构设计:主导大模型(如LLaMA、GPT、BERT等)在业务场景中的端到端架构设计,包括模型选型、部署方案、性能优化与成本控制;设计支持高并发、低延迟的AI服务架构,集成向量数据库、缓存机制及分布式推理能力。

2、大模型高效微调与适配:熟练使用 LoRA(Low-Rank Adaptation) 及其他参数高效微调技术(如Adapter、Prompt Tuning),在有限资源下完成领域适配与任务定制;根据业务需求(如文本生成、分类、问答、代码生成等),设计并实施微调策略,平衡效果与计算开销;探索多模态大模型(文本+图像/音频)的微调与融合应用。

3、工程化与落地:将微调后的模型集成至生产环境,构建自动化训练、评估与部署流水线(CI/CD);编写技术文档,推动团队知识共享与最佳实践。

4、技术前瞻与创新:跟踪大模型前沿技术(如MoE、Agent框架、RAG等),评估其在业务中的可行性;探索开源生态(Hugging Face, vLLM,DeepSpeed等)与云平台(阿里云百炼/火山)的大模型服务能力。


能力要求:

1、3年以上开发经验,熟悉Python、C++等编程语言,熟悉Linux系统常规操作,具备算法理论基础;

2、精通Python,熟悉PyTorch/TensorFlow框架及大模型训练库(如Transformers、PEFT);

3、掌握大模型推理加速技术(量化、蒸馏、KV Cache优化等);

4、熟悉云服务的AI/ML产品;

5、3年以上AI系统架构设计经验,有生产级大模型应用落地案例。


优先条件:

1、有开源社区贡献(如Hugging Face模型库)或顶会论文发表。

2、熟悉强化学习(RLHF)、模型安全对齐(Safety Alignment)技术。

3、具备高性能计算(GPU集群调度、RDMA网络)或低成本推理优化经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请