1、基于业务场景(如计算机视觉、自然语言处理、推荐系统等)设计或改进算法模型,例如:计算机视觉:目标检测(YOLO、Faster R-CNN)、图像分割(Mask R-CNN)、OCR识别;自然语言处理:文本分类、命名实体识别(NER)、机器翻译、大模型微调(LoRA、SFT);机器学习:特征工程、分类/回归模型(XGBoost、LightGBM)、强化学习策略设计。
2、参与算法选型与评估,对比不同模型的精度、效率及可解释性(如A/B测试验证算法效果);
3、主导数据采集、清洗、标注与增强(如图像裁剪、文本脱敏、数据均衡处理),确保数据质量满足模型训练需求;
4、设计高效特征提取方案,结合领域知识构建特征工程(如时间序列特征、用户行为特征);
5、基于PyTorch、TensorFlow等框架搭建训练流程,配置超参数(学习率、 batch size、迭代次数)并优化收敛效果;
6、对模型进行量化、剪枝、知识蒸馏,适配边缘设备(如手机、嵌入式设备)或低延迟场景,降低部署成本;
7、优化推理速度(如TensorRT加速、ONNX格式转换),满足生产环境的实时性要求(如毫秒级响应);
8、持续跟踪模型线上性能(如精度衰减、数据漂移),通过增量训练或算法迭代优化效果。
任职要求:
1、具备核心数学知识,例如:线性代数:矩阵运算、特征值分解、PCA降维(模型特征提取基础);概率统计:贝叶斯理论、概率分布(如高斯分布)、假设检验(A/B测试依据);最优化理论:梯度下降、随机梯度下降(SGD)、Adam等优化器原理(模型训练核心);微积分:偏导数、链式法则(反向传播算法基础);
2、具备机器学习/深度学习理论掌握经典模型原理:决策树、SVM、逻辑回归、神经网络(CNN/RNN/Transformer架构);理解模型评估指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值、ROC/AUC(模型效果量化);
3、精通Python(主流开发语言,熟练使用NumPy、Pandas、Scikit-learn); 
4、熟悉C/C++(高性能计算场景,如模型推理加速)、CUDA(GPU并行编程);
5、精通至少一种主流框架(PyTorch/TensorFlow/Keras),熟悉模型构建、训练、部署全流程;
6、自然语言处理(NLP):文本分类、命名实体识别(NER)、大模型微调(LoRA、SFT)、RAG(检索增强生成);
7、机器学习:特征工程、集成学习(XGBoost、LightGBM)、强化学习(策略梯度、Q-learning);
8、具备模型优化能力,具备3年以上算法开发优化经验。