职位描述
岗位职责:
1、设计、开发和优化OCR算法及系统研究和优化 OCR 识别算法,提高对不同场景(扫描件、手写体、复杂背景等)的识别能力。
2、进行图像预处理、特征提取和文本后处理。
3、研究和优化基于大模型(如 LLaMA、DeepSeek、ChatGLM 等)的推理、微调和部署。
4、与技术研发团队合作,集成到产品中。
5、跟踪最新的大模型技术和研究成果,持续改进系统性能
招聘要求:
技能要求:
1.编程能力:
精通Python,熟悉C++、Java等编程语言。
具备扎实的数据结构和算法基础。
2.深度学习框架:
熟悉TensorFlow、PyTorch等主流深度学习框架。
了解CNN、RNN、Transformers等模型在OCR中的应用。
3.图像处理:
精通OpenCV、PIL等图像处理库。
了解图像去噪、增强、二值化等预处理技术。
4.自然语言处理:
了解基本的自然语言处理技术,特别是文本纠错和字符识别后的处理。
5.数学与统计:
具备扎实的数学和统计学基础,能够理解和应用各种机器学习算法。
经验要求:
1.项目经验:
至少3年以上相关工作经验,有实际OCR项目开发经验。
具备图像处理、机器学习和深度学习领域的丰富经验。
有OCR模型的设计、训练、优化和部署经验,能够展示具体项目成果。
2.开源项目:
熟悉Tesseract等开源OCR项目,有二次开发和定制经验者优先。
3.研究与创新:
关注前沿技术动态,具备创新精神,能够持续改进和优化现有算法。
4.团队合作:
具有良好的沟通能力和团队合作精神,能够有效与团队成员合作。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕