岗位职责
1、负责垂类大模型的架构设计与开发,优化模型训练效率及性能,解决高并发、分布式训练等技术挑战;
2、基于业务场景设计强化学习技术方案,推动大模型在实验室领域的实际应用落地;
3、主导模型预训练、微调及强化学习策略(如PPO、DQN等)的工程实现,提升模型在垂直场景的效果;
4、探索前沿技术(如模型压缩、多模态融合),优化资源利用率并降低推理成本;
5、与应用领域专家协作,将业务需求转化为技术方案,确保模型与应用场景深度适配。
任职要求
1、计算机科学或相关领域的本科及以上学历,三年以上工作经验。
2、熟悉主流大模型架构(如Transformer、BERT、GPT、T5等)及其变体。
3、有深度学习模型部署和优化经验,精通PyTorch、TensorFlow等深度学习框架。
4、熟悉经典视觉模型(如ResNet、YOLO、UNet、ViT等)及其应用场景,熟悉OpenCV、CUDA、TensorRT等工具。
5、具有垂直场景落地实践经验,了解大模型应用开发(如基于GPT API的场景适配
)者优先。