职位描述
工作职责:
(1)根据业务场景需求,调研符合场景需求的大模型,包括大语言模型、视觉大模型等;
(2)对大模型进行性能评估与调优,确保模型在实际应用中的准确性和效率;
(3)构建高效的大规模机器学习平台,优化数据处理流程,提高模型训练和推理的速度;
(4)与产品和售前部门紧密合作,推动AI技术在公司内部的应用落地;
(5)项目文档的申报、编写和对接工作。
任职要求:
(1)计算机类、自动化、数学、物理等相关专业,本科或以上学历;
(2)深入理解深度学习原理,熟悉至少一种主流深度学习框架(如TensorFlow, PyTorch等);
(3)拥有2年以上大模型开发经验,熟悉常见的大模型架构,如BERT、GPT、Transformer等;
(4)具备优秀的编程能力,熟练掌握Python/C++/Java中的一种或多种语言;
(5)掌握包括但不限于LLM/GPT、ai Agent、RAG、图神经网络、强化学习等技术,熟悉langchain、dify、ragflow等框架,具有业务中的应用落地经验;
(6)掌握LLM模型的算法原理、Fine-tuning、Prompt Engineering、向量数据库和 LangChain 等应用范式;在LLM领域,主导过大影响力的项目或论文者优先;
(7)有一个以上人工智能产品的项目管理经验,熟悉项目文档的申报、编写和对接工作;
(8)具有良好的沟通表达能力和较强的团队协作能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕