1、负责多模态大模型方向相关问题研究,跟进前沿技术动态;
2、负责多模态大模型的模型选型、模型部署、及测评工作;
3、负责大模型应用场景开发,效果调优,将模型算法落地到客户的业务场景中;
4、与其他角色和团队合作,共同完成相关项目需求。
任职资格:
1、计算机科学、软件工程、人工智能、数据科学、数学等相关专业,硕士及以上学历,具备扎实的数学和计算机科学基础。
2、熟练掌握 Python 编程语言,具备扎实的编程基础和良好的代码编写习惯,能够运用 Python 实现各类数据处理、算法开发等任务。
3、对 AI 大模型(如 GPT、DeepSeek 等)有一定的了解和研究,熟悉其基本原理和架构特点,了解大模型的训练流程和优化方法,如对大模型的预训练、微调等过程有清晰的认识,有参与过 AI 大模型相关项目或实践经历者优先。
4、对大模型技术栈有一定了解,有使用开源大模型(如 LLaMA、Qwen 等)进行项目实践或学习的经验,了解模型的基本原理、架构和应用场景。熟悉主流智能体开发框架(如 LangChain、Dify、Coze 等),有相关项目经验者优先。
5、对 AI 大模型领域的前沿技术和新知识有浓厚的学习兴趣和快速的学习能力,能够自主学习和研究新的技术方法,并将其应用到实际工作中。
6、具有良好的团队协作精神和沟通能力,具备良好的文档编写能力,能够撰写技术文档和项目报告,为团队的技术积累和知识共享提供支持。