职位详情
AI算法工程师(OCR/语音/检索方向)
1.1-2万
河南企明星电子科技有限公司
郑州
3-5年
大专
01-26
工作地址

绿地原盛国际-3A号楼

职位描述

岗位职责:

1. OCR识别:开发或优化文档、表格、手写体、场景文字等OCR模型,提升复杂场景下的识别率。

2. 语音转写:开发或优化语音识别(ASR)模型,支持多种方言、嘈杂环境下的准确转写,可能包含说话人分离、标点预测等功能。

3. 智能检索:构建多模态检索系统,结合文本、图像、语音内容,实现语义级别的智能检索(包括向量检索、关键词检索混合)。

4. 负责相关模型的训练、调优、评估及工程化部署。

5. 跟踪前沿技术,并将合适的算法应用于实际产品。

6. 适配支持国产操作系统及国产龙芯/申威CPU架构指令集环境下私有化部署。

任职要求(硬性):

1. 算法基础:扎实的机器学习/深度学习基础,熟悉CNN、RNN、Transformer等模型。

2. 专业领域经验:

o OCR:熟悉DBNet、PaddleOCR、EasyOCR等框架,有版面分析、表格还原经验。

o 语音:熟悉端到端ASR模型(如Conformer, Wav2Vec2),熟悉Kaldi、WeNet、FunASR等工具。

o 检索:精通文本/向量检索技术,熟悉Sentence-BERT、SimCSE等语义模型,有使用Faiss、Milvus等向量数据库的经验。

3. 工程能力:熟练使用Python,掌握PyTorch/TensorFlow框架,有模型部署(ONNX, TensorRT)经验。

4. 加分项:

o 有大规模数据处理和预训练经验。

o 熟悉信创环境国产服务器软硬件适配兼容经验(麒麟系统,龙芯/申威CPU)。

了解多模态模型(如CLIP, Whisper)。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请