职位描述
岗位职责:
1、基于LLM(如GPT、GLM、LLaMA等)开发企业级应用,包括但不限于对话系统、知识库问答、内容生成、智能决策等场景。
2、设计并实现大模型的微调(Fine-tuning)、提示工程(Prompt Engineering)、RAG(检索增强生成)等技术方案。
3、解决大模型部署中的性能瓶颈,优化推理速度、内存占用及成本(如模型量化、蒸馏、动态批处理等)。
4、探索多模态大模型(文本、图像、语音)的应用集成与性能调优。
5、搭建高可用的大模型服务框架,实现模型API化、自动化监控及迭代更新。
6、跟踪大模型领域前沿技术(如Agent、MoE、长上下文优化),探索业务场景中的创新应用。
任职要求:
1、熟练掌握PyTorch/TensorFlow等框架,深入理解Transformer、Attention机制及大模型架构。
2、熟悉LangChain、LlamaIndex、vLLM等大模型工具链,有Hugging Face生态实战经验。
3、具备分布式训练(DDP/DeepSpeed)或推理加速(TensorRT-LLM、Triton)经验者优先。
4、编程能力扎实,熟练使用Python,熟悉Linux开发环境及Docker/K8s部署。
5、熟悉大模型训练全流程(数据清洗、SFT、RLHF),具备千亿参数级模型经验。
6、有AI Agent、多模态生成(如Stable Diffusion、Sora)项目经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕