职位描述
工作职责
-
大模型技术研究与应用:
- 负责大模型及生成式AI技术在电池研发、生产制造、能源管理等业务场景的应用开发与研究
- 针对公司具体业务需求,开展大模型的定制化训练、微调和优化工作,包括但不限于预训练、Fine-tuning、RLHF等技术方案
- 探索大模型智能体(Agent)架构设计,构建自主决策、工具调用、长上下文建模等能力,赋能企业智能化转型
-
业务场景落地:
- 与业务部门紧密协作,深入理解电池研发、生产工艺、质量控制、供应链管理等核心业务流程,设计并实施大模型解决方案,解决电池材料分析、生产参数优化、设备预测性维护、能源消耗预测等具体业务问题
- 构建行业知识库应用系统,打造企业专属的智能问答、知识检索和决策支持平台
-
技术体系建设:
- 设计并实现基于FastAPI/Tornado的高性能AI服务接口,确保服务的稳定性与可扩展性
- 负责大模型在Kubernetes环境中的部署、优化工作,熟悉Docker和Helm的使用
- 开发高质训练数据生成系统,构建自动化参数调优框架及多维度评测体系(精度/推理成本/响应速度)
- 搭建企业级AI基础设施,包括向量数据库、模型管理平台、推理服务框架等
-
创新与研发:
- 跟踪工业界和学术界在大模型领域的最新进展,持续引入创新技术
- 针对能源行业特点,研发垂直领域大模型,提升行业专用场景的应用效果
- 参与制定企业AI技术路线图,推动AI技术与业务深度融合
- 探索多模态大模型在电池检测、生产监控等场景的应用可能性
-
团队协作与知识共享:
- 与数据科学家、软件工程师、业务专家组成跨职能团队,共同推进AI项目落地
- 编写技术文档,组织内部技术分享,提升团队AI技术能力
- 参与企业AI人才培养计划,建立AI技术学习与分享机制
任职要求
-
学历背景:
- 计算机科学、人工智能、数学、电子工程或相关专业硕士及以上学历
- 3年以上AI/机器学习相关工作经验,1年以上大模型项目实战经验
-
技术能力:
- 精通Python编程,熟悉PyTorch/TensorFlow等主流深度学习框架
- 深入理解Transformer等大模型架构原理,有Qwen、DeepSeek等开源大模型调优经验
- 熟悉LangChain、AutoGPT等Agent开发框架,具备智能体构建能力
- 具备大模型工程化部署经验,了解vLLM、Ollama等推理框架
- 熟悉Docker、Kubernetes等容器化技术,有云原生AI应用开发经验
-
业务理解:
- 有制造业、能源行业或工业AI应用场景经验者优先
- 了解电池技术、材料科学或能源管理相关知识者优先
- 具备将复杂业务问题转化为AI解决方案的能力
-
软技能:
- 出色的沟通能力和团队协作精神
- 强烈的技术热情和持续学习能力
- 具备创新思维,能够提出突破性技术解决方案
- 逻辑思维严谨,善于分析和解决复杂问题
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕