办公地点:熙悦汇附近
客户需求分析与模型选型
深入理解客户业务场景与技术需求,结合NLP、CV等多领域知识,为客户推荐适配的语言大模型(如GPT、LLaMA、PaLM等)或多模态模型(如CLIP、DALL·E、Flamingo等)
制定从模型选择、数据准备到训练策略的全流程技术方案
模型部署与调优
主导主流开源/商用模型的本地化部署、分布式训练及参数优化
设计模型微调方案(Fine-tuning/PEFT等),解决特定场景下的领域适配问题
训练方案设计与实施
根据客户计算资源与业务目标,制定包含硬件配置、训练框架选择(PyTorch/TF等)、监控方案的技术实施计划
设计模型评估体系,确保训练结果达到业务指标要求
技术赋能与知识沉淀
编写技术白皮书、训练指南等文档,构建可复用的行业解决方案库
跟踪Diffusion、MoE等前沿技术演进,推动创新技术落地
任职资格要求
硬性条件:
计算机/数学相关专业硕士及以上学历,3年以上AI模型实战经验
熟练掌握Transformer架构,具有BERT、GPT系列等大模型实战调优经验
熟悉多模态模型技术栈(视觉-语言对齐、跨模态表示学习等)
精通PyTorch/TensorFlow框架及DeepSpeed/HuggingFace等生态工具
具备大规模分布式训练经验(DDP/FSDP等技术)
核心能力:
能快速理解客户业务痛点并转化为技术实现路径
具备完整的模型训练全周期管理能力(从数据清洗到模型部署)
优秀的方案呈现与技术沟通能力(需提供过往技术方案案例)