职位描述
工作职责:
1.负责大模型的前沿探索,推动大模型效果达到行业先进水平;
2.与业务团队紧密合作,深入理解业务需求和痛点,提出创新的AI解决方案,跟进大模型在各大业务领域的试点和落地;
3.带领团队攻关解决轨道交通智能运维大语言模型落地过程中的关键技术点;
4.跟踪最新的AI技术动态和趋势,不断突破技术、业务目标。
任职要求:
1.具备AI研发经验,特别是NLP领域的技术有较为深入的研究,对算法的基础原理有深入的理解。并具备百亿级以上大模型预训练、微调经验优先;
2.具有利用大模型和基础插件综合技术方案,解决领域的严谨的逻辑推理,信息精准获取等问题经验者优先
3.精通transformer和各类生成式模型网络结构和原理,有技术攻关和创新经验者优先
4.本科及以上学历,计算机科学、数学、统计学、金融等相关专业,发表过大模型相关研究顶会论文优先;
5.深入理解主流大模型如GPT3/GPT4/WebGPT/PaLM/LLama/DeepSeek等的原理和差异;
6.熟练掌握主流深度学习框架,如TensorFlow/PyTorch等;
7.熟练掌握大模型相关技术,如LangChain/Vector Store/Plugin/Megatron-LM/Deepspeed等。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕