职位描述
岗位职责:
-
大模型应用开发(Agent、RAG、知识库增强、ChatFlow、WorkFlow、MCP开发等)
-
针对业务场景(如NLP、搜索推荐、对话系统、AIGC等)设计大模型应用方案,提升模型效果与性能。
-
探索大模型的高效训练与推理技术,包括分布式训练、模型压缩、量化部署、低资源适配等方向。
-
跟进学术界与工业界前沿技术,结合业务需求进行创新性研究,推动技术突破与专利/论文产出。
-
与产品、数据、工程团队协作,推动大模型技术在业务场景中的规模化落地。
技术能力要求:
必备技能:
-
扎实的机器学习和深度学习基础,熟悉主流大模型架构(如Transformer、BERT、GPT、LLaMA、DeepSeek、Diffusion等)。
-
精通PyTorch/TensorFlow等框架,具备大模型训练调优经验(数据清洗、Prompt工程、LoRA/QLoRA等微调技术)。
-
具备优秀编码能力,熟练掌握Python/C++,熟悉Linux开发环境及高性能计算优化。
-
对NLP、CV或多模态领域(如CLIP、Stable Diffusion)有深入理解。
-
掌握向量数据库
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕