职位描述
岗位职责:
1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法;
2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、辅助决策等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平;
4、负责大模型应用的构建过程,从需求分析、模型设计到开发实现与优化,确保应用的高效性与准确性;
5、与跨部门团队紧密合作,包括工程师、产品经理等,共同推动项目的顺利进行,对大模型应用的效果进行持续调优,通过数据分析与算法改进,提升模型的性能和用户体验。
岗位要求:
1、硕士及以上学历,计算机科学、人工智能等相关专业,具有3年以上大模型相关工作经验;
2、熟练掌握至少一种主流的深度学习框架,如TensorFlow、PyTorch等;
3、熟悉大模型相关技术,对大模型核心技术有深入的理解,包括但不限于模型架构、训练算法、优化策略等,有大模型SFT、RLHF等实操经验者优先;
4、熟悉大模型主流应用场景,如RAG、Graph-based RAG、Agent等,有实际落地经验者优先;
5、熟悉大模型应用开发框架,包括但不限于Langchain、LlamaIndex等,有实际应用开发和项目落地经验者优先;
6、具备优秀的编程能力,熟练使用Python、C++等编程语言,扎实的机器学习基础,具备创新研究能力和优秀的编程能力,能快速验证和实现新想法,熟悉大模型数据、策略、算法优化者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕