职位描述
岗位职责:
1. 算法架构与模型选型:负责药物分子生成、合成路径规划及性质预测系统的整体算法架构设计。针对小分子、多肽以及复杂制剂辅料,进行前沿深度学习模型的选型与评测,确保模型在药物研发场景下的高泛化性与预测精度。
2. 核心算法开发与优化:负责开发高效的逆合成分析算法与合成路线预测模型。针对小分子和多肽,构建结构与性能的关联模型,实现对溶解度、稳定性、引湿性等理化性质以及ADMET属性的精准预测。针对辅料与制剂方向,设计预测药物-辅料配伍禁忌及处方优化的数据驱动模型。
3. 数据工程与特征构建:构建并维护药物研发相关的多模态数据库。负责化学结构(SMILES/SELFIES)、分子指纹、三维构象及制剂工艺参数的特征提取与工程化。处理异构化实验数据,解决药物化学数据中的样本稀疏、标签噪声及数据分布不均(OOD)等挑战。
4. 跨学科协作与系统集成:与计算化学、合成化学及制剂开发团队紧密配合,将算法模型集成至内部药物发现平台或 ELN/LIMS 系统中,实现计算模拟与干湿实验的闭环联动。支持高通量筛选数据的自动化分析,为实际研发决策提供量化的算法建议。
5. 模型部署与闭环优化:建立算法模型的持续监控与迭代机制,通过主动学习(Active Learning)或强化学习手段,根据实验反馈不断调优算法。解决大规模分子库检索与实时预测中的计算性能瓶颈,确保算法在生产环境中的稳定响应与高效推理。
任职要求:
1. 学历与经验:计算机科学、生物信息学、化学信息学、计算化学或相关专业硕士及以上学历。具备 3 年及以上药物研发相关算法经验,有小分子合成、多肽药物或制剂稳定性预测相关项目背景者优先。
2. 算法技术栈:精通 Python 编程,熟练掌握 PyTorch 或 TensorFlow 等主流深度学习框架。深入理解常用机器学习算法及深度学习架构。熟悉大规模语言模型(LLM)在化学序列(SMILES)处理上的应用经验。
3. 化学信息学背景:熟练使用 RDKit、OpenEye 或 Schrodinger 等化学信息学工具包。理解基本有机化学反应机理、多肽一级结构特性及常见药用辅料的理化性质。熟悉常用的公开化学数据库(如 ChEMBL, PubChem, ZINC, USP 等)。
4. 数据库与数据管理:熟悉 SQL 及 NoSQL 数据库的使用,具备处理大规模分子数据集的经验。了解高性能计算(HPC)或 GPU 并行加速原理。
5. 工程能力与素质:熟悉 Git 版本控制与 Linux 开发环境。具备优秀的逻辑思维能力和跨学科沟通能力,能够准确理解化学家与制剂工程师的业务痛点并转化为技术需求。具有持续学习前沿 AI for Science 文献的热情与能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕