职位详情
算法工程师
2.5-3.5万
北京中兵数字科技集团有限公司
北京
3-5年
本科
06-04
工作地址

北京市-海淀区-紫竹院路69号

职位描述
一、岗位职责:
负责垂直行业大模型的设计、训练、调优与部署;
研究并实现面向特定行业的预训练和微调方法,提升模型在具体场景下的性能;
构建高质量的行业数据集,完成数据清洗、标注、增强等工作;
参与模型压缩、蒸馏、量化、推理加速等优化工作;
与部门经理、业务团队协作,推动AI模型在实际业务中的落地应用;
跟踪前沿研究,持续优化模型效果,提升系统整体智能化水平。


二、任职要求:
教育背景:
计算机科学、人工智能、数学、电子工程等相关专业;
技术能力:
精通Python编程语言,熟悉TensorFlow/PyTorch等深度学习框架;
熟悉Transformer架构及各类预训练模型(如BERT、GPT、LLaMA、ChatGLM等);
有大规模语言模型训练、微调、评估经验,掌握LoRA、Adapter、Prompt Tuning等参数高效训练方法;
熟悉分布式训练技术(如DeepSpeed、Megatron-LM、Horovod等),具备多GPU/TPU集群使用经验;
具备良好的算法基础和扎实的机器学习/深度学习理论功底;
熟悉常见的模型评估指标(BLEU、ROUGE、F1、AUC等)和调优策略;
有数据处理、文本生成、对话系统、知识融合、意图理解等相关项目经验者优先。
工程能力:
熟悉Linux环境开发,了解Docker、Kubernetes等容器化部署工具;
有将模型部署上线的实际经验,熟悉ONNX、Triton、TensorRT等推理引擎者优先;
有良好的代码规范和文档习惯,具备一定的工程交付能力。
项目经验:
至少参与过2个以上完整的大模型训练或调优项目,有从0到1构建模型的经验;
有垂直行业(如金融、医疗、教育、政务等)模型定制化训练经验者优先;
软技能:
具备良好的沟通能力和团队合作精神;
对AI技术有强烈兴趣,关注行业动态,有自我驱动力;
能够独立思考并解决复杂问题,具备较强的逻辑思维能力;
英文文献阅读能力强,能快速复现最新研究成果。

三、加分项:
有NLP、CV、语音识别或跨模态研究背景者优先。
熟悉Agent、RAG、检索增强生成、多模态模型等技术;
有开源社区贡献经历(如HuggingFace、GitHub等);
熟悉AutoML、超参调优、模型监控、A/B测试等全流程;

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请