岗位职责:
1. 大模型研发与优化
- 负责大规模预训练模型(LLM)的设计、开发、训练及调优,包括架构创新、参数效率提升等
- 开发Prompt优化工具提升业务人员模型交互效率
- 针对环保行业垂直场景(如如环卫车和环卫工人调度系统、设备诊断知识库等)进行模型微调与领域适配
- 探索模型蒸馏、量化、稀疏化等技术,降低计算与存储成本
2. 数据处理与工程化
- 构建高质量多模态训练数据集,设计数据清洗、增强及标注策略
- 开发高效数据预处理流水线,解决大数据存储、分布式加载等工程问题
- 构建模型微调Pipeline,对接环卫作业数据、物联网(物联网)、内部管理系统等数据流
- 跟踪LLM领域最新进展(如MoE、长上下文处理、多模态对齐),推动技术迭代
3. 模型部署与性能优化
- 实现大模型的高效推理部署,优化GPU/TPU资源利用率
- 研究模型服务化方案(如API服务、边缘端部署),解决延迟、吞吐量等性能瓶颈
4.跨团队协作
- 与产品、业务团队深度合作,将技术能力转化为实际应用场景
- 撰写技术文档、专利及论文,推动团队技术影响力
任职要求:
1.计算机科学、软件工程、数学、统计学或相关领域本科及以上学历
2.3年以上深度学习研发经验,3年以上大模型(10B+参数)实战经验
算法基础:
- 精通PyTorch/TensorFlow框架,熟悉Megatron-LM、DeepSpeed等分布式训练工具
- 深入理解Transformer、注意力机制、RLHF等核心技术,具备模型源码级调优能力
- 理解RAG技术链实现逻辑,有LoRA、P-Tuning等高效微调技术经验
工程能力:
- 熟练使用PyTorch+DeepSpeed分布式训练框架
- 有Huggingface/OpenXLab生态项目落地经验
- 熟悉Docker+K8s部署方案
- 熟练使用CUDA、TensorRT等加速库,具备高性能计算优化经验
加分项:
具备城市服务和离散制造业相关经验优先;
具备环保物联网数据、环卫作业数据对接经验优先;
参与过环保科研项目课题研究者优先;
3.工作积极主动,耐心仔细,沟通协调能力好,责任心强,逻辑思维强,能承受工作压力,具有良好的团队合作精神,能吸收新技术和实践的能力。