职位描述
岗位职责
大模型全流程开发
负责文档问答、BI生成、报告生成等场景的应用开发,集成RAG、Text2SQL等技术
优化模型微调(LoRA/SFT)与推理效率,探索deepseek、Megatron等加速框架
开发多模态大模型(如GPT-4o、qwen-VL),支持智能座舱、生产安全分析等业务场景
技术研究与工程落地
研究数据合成、模型蒸馏等技术,推动模型轻量化与行业适配
任职要求
核心能力
计算机/人工智能相关专业,本科3年或硕士2年以上经验,熟悉Python/Java及PyTorch框架
深入理解LLaMA、Gemma等开源模型架构,具备RLHF微调或分布式训练经验
优先条件
熟悉LangChain、LlamaIndex等开发框架,有危化/医疗领域落地经验者优先
发表过顶会论文(如NeurIPS/ICLR)或参与过大规模预训练项目者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕