职位描述
岗位职责
1.参与行业垂直大模型的研发、优化与部署,包括数据清理、训练方案设计、模型评估等。
2. 结合业务场景需求,探索大模型在NLP等领域的实际应用(如对话系统、内容生成、知识推理等)。
3. 协助团队完成数据处理、实验设计、效果评估及技术文档撰写。
4. 跟进AI领域前沿技术,参与技术方案调研与原型开发。
职位要求
学历专业:计算机科学、人工智能、数学等相关专业本科及以上在校生。
技术能力:
1.熟练掌握Python编程,熟悉PyTorch/TensorFlow等深度学习框架。
2.了解大模型基本原理(如Transformer、BERT、GPT系列等),有相关项目或论文经验优先。
3.扎实的数学与算法基础,熟悉机器学习/深度学习常见模型及优化方法。
加分项:
1.有大模型预训练、微调、部署经验,或参与过相关竞赛/开源项目。
2.熟悉分布式训练、模型压缩、Prompt Engineering等技术。
3.具备较强的英文论文阅读能力或算法复现能力。
其他:对AI技术有热情,具备快速学习能力,责任心强,能适应团队协作。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕