职位详情
视觉大模型训练算法工程师(西安)
2-4万
西藏君戎航空科技有限公司
西安
3-5年
硕士
01-21
工作地址

西安国家数字出版基地A座2501

职位描述

工作需求:

1.负责大模型(如GPT系列、LLaMA系列、StableDiffusion等)的本地化训练、微调及部署,支持多硬件平台(GPU/CPU/边缘设备);

2.优化模型训练流程(数据处理、分布式训练、混合精度训练),解决训练中的性能瓶颈(如显存占用、训练速度);

3.实现模型的轻量化(量化、剪枝、蒸馏)与端侧/边缘侧部署(如通过TensorRT、ONNX Runtime、TVM优化推理效率)。

4.针对大模型的关键问题(如长文本建模、多模态对齐、推理效率)开展研究,提出改进方法并支持相关技术创新(如NeurIPS、ICML、CVPR、ACL、AAA等);

5.跟踪大模型领域前沿动态(如最新论文、技术博客开源项目),定期输出技术调研报告;

任职要求:

1.学历及工作经验:硕士及以上学历,电子信息、人工智能、计算机科学与技术等相关专业,三年以上技术开发工作经验;

2.技术积累及工程能力:熟悉Python/C++编程,熟悉PyTorch/TensorFlow深度学习框架(至少精通其中一种),熟悉模型训练全流程(数据加载→模型构建→训练→评估→部署);熟悉Hugging Face生态(Transformers库Datasets、Tokenizers),能快速复现开源大模型(如Llama-2、Mistral-7B)的基础功能;

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请