1.参与海量数据分析与统计,能够深入分析现有模型不足,持续优化算法。
2.对技术有热情,能够及时跟进数据挖掘,机器学习相关技术的最前沿技术发展,并合理的运用到实际产品。
3.负责公司的数据挖掘、算法设计和研发工作,通过数据分析、机器学习和数据挖掘算法发现业务问题和机会点。
4.研究和开发基于大型语言模型(LLM)、检索增强生成(RAG)和生成式人工智能(AIGC)的高级应用
5.优化大模型在不同业务场景下的微调和应用,确保模型的准确性和效率。
6.构建和维护知识库,结合RAG技术,提升问答系统、智能助手等的性能。
7.探索并实现大模型在多模态、多场景下的应用,推动通用人工智能(AGI)的发展。
8.与咨询团队合作,理解并满足定制化需求,提供端到端的大模型解决方案
1、本科及以上学历,计算机科学、数学、统计学、人工智能等相关专业优先考虑。
2、熟悉大模型训练流程以及强化学习(RL)算法原理与应用,拥有机器学习、数据挖掘、推荐算法等相关领域的实际项目经验,能够独立承担并高效完成项目中的算法设计与实现任务。
3、精通至少一种以下编程语言:R、Python、Java、Scala,具备扎实的编程功底和良好的代码规范。同时,熟悉 Linux 开发环境,能够熟练运用 Linux 命令进行项目开发与调试。
4、熟悉 Hive、Spark 等大数据处理技术,能够运用这些技术高效处理和分析大规模数据。有机器学习和数据挖掘等系统的搭建与实施经验,能够独立完成系统的架构设计、开发与部署工作。
5、对大型语言模型、检索增强生成(RAG)和人工智能生成内容(AIGC)有深入理解,具备相关项目经验者优先。
6、熟练掌握至少一种主流深度学习框架,如 TensorFlow 或 PyTorch,能够利用框架快速搭建、训练和优化深度学习模型。具备使用框架进行模型调优、超参数调整的实际经验,能通过实验和分析不断提升模型性能,有效解决模型过拟合、欠拟合等问题。
7、拥有将人工智能模型部署到实际生产环境的经验,熟悉模型部署的常见平台和工具,如 Docker、Kubernetes 等。能够根据实际业务需求对模型进行性能优化,包括但不限于模型压缩、量化等操作,确保模型在资源受限的环境下也能高效运行,满足业务对实时性和准确性的要求。