职位描述
职位描述:
1. 掌握python编码语言,熟练使用Pytorch、Tensorflow、Paddle等至少一种深度学习框架。
2. 掌握NLP基础理论和算法,有NLP相关行业经验,熟练掌握Transformer系列模型架构和原理。
3. 掌握自然语言处理任务,如问答系统,检索系统,推荐系统,知识图谱,事理图谱、序列标注,摘要生成及抽取等。
4. 掌握NLP主流预训练语言大模型(GPT/LLaMA/GLM/Bloom/Qwen/BERT)。
5. 掌握大模型相关技术,对RAG、Agent、LangChain等主流大模型应用框架,有一定的认识和理解并且有探索经验。
6. 掌握垂直行业领域大模型PT、Continue PT、SFT、RLHF的训练数据构建、数据配比、训练和指标评测。
7.掌握Linux常用命令
任职要求:
1. 参与公司决策大模型产品持续优化设计和落地,决策大模型训练数据构建、数据配比、模型训练和指标评测等相关工作。
2. 参与公司多智能体编排框架、模型智能体库和大模型平台等相关产品的研发,追踪并实现前沿思想。
3. 负责研究和洞察大模型测试体系和数据构建方法,评估大模型在理解、推理、agent、rag等全方面的能力。
4. 负责LLM模型推理引擎的整体设计和开发,优化引擎,算法和模型架构,提高计算性能。
5. 负责设计与开发LLM模型和应用的端到端部署系统,提升模型与应用的交付效率。
6. 负责研究、创新、开发和优化先进的算法和模型,提升模型准确度和性能,实践改进方案,并推动团队技术进步。
7. 负责跟进大模型领域最新进展,了解行业前沿动态,不断迭代大模型相关算法模块,实现产品愿景及目标。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕