2-3万
国家电网国网物资有限公司
#### **岗位职责**
1. **大模型应用开发**:
- 基于主流大模型(如GPT-4、LLAMA、文心一言等)开发垂直领域应用,包括对话系统、内容生成、知识问答等场景。
- 实现大模型的本地化部署、微调(Fine-tuning)与提示工程(Prompt Engineering),提升模型在特定任务中的性能。
2. **模型优化与集成**:
- 优化大模型推理效率(如模型压缩、量化、低代码推理框架部署),降低计算资源成本。
- 将大模型能力与传统算法(如规则引擎、检索增强生成RAG)结合,构建混合智能系统。
3. **数据处理与评估**:
- 构建高质量领域数据集,设计数据清洗、标注与增强方案。
- 制定模型评估指标(如准确性、流畅性、安全性),分析模型输出并迭代优化。
4. **工程化落地**:
- 设计大模型服务API接口,支持高并发、低延迟的在线推理需求。
- 与前后端团队协作,推动大模型能力在业务场景中的集成与落地。
#### **任职要求**
- **学历与经验**:
- 硕士及以上学历,计算机科学、人工智能、自然语言处理(NLP)等相关专业,3年以上AI模型开发经验。
- 有至少1个大模型相关项目(如LLM微调、Agent开发、多模态生成)的完整落地经验。
- **技术能力**:
- 熟练掌握PyTorch/TensorFlow等深度学习框架,熟悉Hugging Face Transformers、LangChain等工具链。
- 熟悉大模型关键技术:注意力机制、位置编码、模型并行训练、LoRA/QLoRA等高效微调方法。
- 具备工程化能力:熟悉Docker/Kubernetes部署、CUDA性能优化、分布式训练框架(如DeepSpeed)。
- 熟悉Python编程,了解C++/Rust等高性能语言加分。
- **其他要求**:
- 对AI伦理、模型安全(如内容过滤、偏见消除)有实践经验。
- 优秀的逻辑思维与问题拆解能力,能快速复现论文并解决技术难点。
- 良好的英文文献阅读能力和技术文档撰写能力。
#### **加分项**
- 在顶级会议(NeurIPS/ACL/ICML等)发表过NLP/LLM相关论文;
- 熟悉多模态大模型(如GPT-4V、Stable Diffusion)或具身智能(Embodied AI);
- 有开源项目贡献(如参与LLAMA、Alpaca等社区项目);
- 熟悉大模型联邦学习或私有化部署方案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕