【工作描述】
1.结合业务场景和大模型的能力,设计和实现高效的基于大模型的解决方案。
2.负责基于开源类LLM、多模态等模型进行微调、优化、评估、量化、部署等,确保模型性能达到最优。
3.负责模型的部署和监控,确保模型在生产环境中的稳定性和性能。
4跟踪和了解最新的LLM、多模态技术和趋势,并将其应用到实际项目中。
5.编写技术文档,为团队成员提供模型开发和部署的指导。
6.为应用开发和业务人员提供相关培训和应用指导。
【岗位要求】
1.本科及以上学历,计算机、数学或统计学相关专业;
2.5年以上互联网开发经验,至少2年在大模型开发、部署和调优方面的工作经验。
3.具备良好的编程能力,熟练使用Python语言,熟悉NLP生态。
4.熟悉常用文本分析和处理工具,熟练掌握TensorFlow/PyTorch等任一主流机器学习框架
5.熟悉主流的预训练模型,从事过(文本分类/实体识别/语义匹配/关系抽取等)其中任一方向的算法模型开发任务并有实际业务落地经验
6.具备出色的分析问题和解决问题的能力。
7.良好的团队合作精神和沟通能力。