职位描述
岗位职责( Respansibilities ):
1.大模型微调与优化:
。基于开源大模型(如 Uama , Qwen 等)进行微调训练( SFT ),负责模型参数的调整与训练任务的执行。。
配合算法负责人进行模型训练过程的监控( Loss 分析)与 badcase 修复。
2.数据工程与评测:
○负责训练数据全生命周期的处理( Python 为主),包括清洗、去重、格式化及针对特定任务的数据增强。
。构建和维护自动化评测集,编写评测脚本,对微调后的模型进行定量评估与对比。
3.工程化落地与维护:
维护现有的 Java 后端服务,处理日常业务需求及线上问题定位。
4.检索库维护:
。负责检索库相关数据的清洗、整理、标注及维护,确保高质量数据供给;
任职要求( Qualifications ):
1. Python 与框架能力:
○ Pythan 精通:具备优秀的 Python 编程能力,熟练使用
Pandas / NumPy 进行高效数据处理。
框架基础:熟悉 PyTorch 深度学习框架,有 HuggingFace
ransformers )库使用经验者优先。
2大模型技术能力:
。理解 Transformer 模型的基本原理( Encoder / Decoder / Attention 机制)。
。了解常见的大模型微调方法(如 SFT , RLHF , LoRA 等)及其应用场景。
3.通用工程能力:
Java 能力:具备扎实的 Java 基础,熟悉 Spring Boot 开发,能够
。
独立承担后端服务的维护与问题排查。
熟悉 Linux 开发环境,熟练使用 Git ,具备基本的 Shell 脚本编写能力。
4.综合素质:
细致耐心,能够接受初期较大数据处理与清洗的工作。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕