岗位职责:
负责技术研究应用:跟踪 AI 前沿技术,评估应用潜力并制定策略;结合业务需求,将 AI 技术用于产品或服务开发优化;负责 AI 模型设计、开发、训练及性能优化。
负责项目管理实施:主导 AI 项目规划与执行,制定计划并确保按时按质完成;协调内部资源,解决技术问题;与外部合作,引入先进技术资源。
负责业务协作支持:与业务部门合作,提供 AI 解决方案;为业务人员提供技术培训与支持;参与产品需求分析和评审,提优化建议。
负责技术文档管理:编写技术文档,做好知识记录传承;建立维护技术知识库,促进技术交流学习;参与内部技术培训分享。
岗位要求:
1.计算机、AI相关专业背景,5年+AI相关工作经验;
2.深入理解机器学习和深度学习的基本原理和算法,熟练掌握至少一种深度学习框架(如 TensorFlow、PyTorch),具备丰富的神经网络模型开发和训练经验。深入了解预训练语言模型(如 BERT、GPT 系列、T5 等)的原理和应用,能够进行模型微调。
3.精通大语言模型的架构(如 Transformer)和训练方法,熟悉大规模训练的优化策略,包括分布式训练、混合精度训练等;了解模型压缩和加速技术。
4.熟练掌握 Python 编程语言,具备良好的代码编写习惯和代码调试能力;熟悉常用的 Python 库和工具,如 NumPy、pandas、scikit-learn 等。
5.了解分布式计算框架(如 Apache Spark、Dask),熟悉 GPU 集群的使用和管理,能够利用 GPU 进行模型训练和推理加速。
6.有大语言模型相关项目经验者优先,如参与过大规模语言模型的训练、优化或应用开发项目;具备实际业务场景中自然语言处理项目的成功经验。
7.具备快速学习新知识和技术的能力,能够跟踪和理解大语言模型领域的最新研究成果,并将其应用到实际工作中;具有创新思维,能够提出新的技术方案和解决问题的思路。
8.具备良好的团队合作精神,能够与不同背景的团队成员有效沟通和协作;能够清晰地表达自己的想法和观点,撰写技术文档和报告。