职位描述
岗位职责:
1. 深入探索和研究多模态大模型在工业领域的应用场景,推动其落地与创新发展;
2. 参与大语言模型的指令微调与领域适配,提升业务适应性;
3. 探索和推进大语言模型在 Text2SQL、知识库问答等任务中的落地与优化;
4. 基于 C++ 等底层技术实现模型推理流程的加速部署,适配 GPU/NPU 等多种异构计算平台;
5. 持续关注前沿技术,推动关键算法的业务应用与迭代优化;
6. 负责相关算法的代码实现、集成、测试与维护;
任职要求:
1. 硕士及以上学历计算机、人工智能、电子信息、自动化等相关专业,具备扎实的数学与编程基础;
2. 熟练掌握至少一种主流深度学习框架(如 PyTorch、TensorFlow),具备良好的模型训练与调优能力;
3. 熟练掌握 Python 编程语言,能独立完成模型开发、训练、调优及性能评估流程;
4. 熟悉多模态大模型(如视觉-语言模型等)的架构与训练方法,具备将其在工业场景中落地的实践经验和能力;
5. 理解大语言模型基本原理,有实际参与 Text2SQL、知识问答系统、大模型微调等项目经验者优先;
6. 具备一定的 C++ 编程能力,了解模型推理流程,具备 CUDA 编程或异构计算平台部署经验(如 GPU/NPU)者优先;
7. 具备良好的工程实现能力,能够独立完成算法模块的设计、集成、测试与性能优化;
8. 有较强的责任心与自驱力,良好的沟通能力和团队协作意识,热衷技术,有持续学习能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕