简历筛选关键词:Transformer、LoRA、RLHF、DeepSpeed、ACL/EMNLP、LLaMA、ChatGPT;
1、编程能力:精通 Python,熟悉 C++ 更佳;具备良好的代码规范与工程能力。
深度学习框架 熟练使用 PyTorch(优先)、TensorFlow,了解 Hugging Face Transformers、DeepSpeed、Megatron-LM 等训练/推理加速工具。
2、算法与模型理解:深入理解 Transformer、BERT、GPT、LLaMA 等主流大模型架构,掌握预训练、微调(SFT、LoRA、RLHF)、对齐(alignment)等技术。
3、数据处理与建模:熟悉大规模语料清洗、去噪、去重、质量评估、数据配比策略,具备构建数据闭环的能力。
4、科研能力:能阅读并复现顶会论文(如 ACL、EMNLP、NeurIPS、ICLR),具备问题建模、实验设计、结果分析能力。
5、系统与工程经验:熟悉 Linux 开发环境,了解分布式训练、GPU并行计算、模型压缩与推理优化(如 vLLM、TensorRT)