职位描述
岗位职责
1:负责大模型(如LLaMA、Qwen、DeepSeek等)在私有化环境(本地服务器/混合云/专有云)中的部署、性能优化及稳定性保障;
2:设计与开发基于大模型的垂直领域解决方案,重点突破 RAG 与 Agent 技术的工程化落地;
3:进行大模型的蒸馏、量化、微调等优化工作,确保模型在保证性能的同时具备计算资源效率;
4:研究大模型部署前沿技术(如MoE架构优化、国产化芯片适配),推动技术方案持续升级。
任职要求
1:计算机科学、人工智能、数学等相关专业本科及以上学历,3年以上AI工程化经验;
2:熟练掌握 Python,熟悉C++/Go/Java 中的至少一种,具备扎实的算法与数据结构基础;
3:精通PyTorch、TensorFlow等框架,熟悉 HuggingFace Transformers生态及大模型技术原理;
4:熟悉 Dify、LangChain、GraphRAG等AI开发框架;
5:了解模型压缩技术(量化、剪枝)及硬件加速方案(GPU/TPU/NPU异构计算);
6:强烈的技术热情,能独立解决复杂系统问题,具备跨团队协作能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕