职位描述
岗位概述
我们致力于通过前沿的另类数据与深度学习技术,挖掘市场中的独特阿尔法机会。现招聘对数据有极强洞察力和处理能力的研究员,你将负责构建从原始数据到稳健策略的完整流水线,重点挖掘网络舆情、文本情感等非传统数据源的价值。
核心职责(细化与深化)
另类数据源的开拓与获取
多渠道获取:系统性地识别、评估和获取多元化的另类数据源,包括但不限于财经论坛(如东方财富股吧)、新闻媒体、社交媒体文本、供应链信息、卫星图像等
。
技术实现:独立或主导设计并实施高效稳定的数据采集系统。熟练运用 Python (Requests, Scrapy, BeautifulSoup) 等工具和框架,应对反爬虫机制,确保数据的实时性、完整性与质量
。
数据处理与情感分析
数据清洗与构建:对获取的半结构化和非结构化原始数据进行深度清洗、去噪、标准化和结构化处理,构建可供研究使用的高质量数据库
。
情感量化:应用自然语言处理技术,例如使用 SnowNLP、LSTM(长短期记忆网络) 等模型或基于词典的方法,对文本数据进行情感分析,将主观文本内容转化为可量化的情感指标(如积极/消极分数、情绪强度等),为因子构建奠定基础。
因子构建、验证与策略集成
创新因子构建:基于处理后的另类数据(如舆情热度变化、情感倾向转折点等),结合机器学习(如SVM、随机森林)、深度学习或图神经网络(GNN)等方法,设计和测试创新的Alpha因子
。
系统化回测与评估:建立完善的因子评价体系,对因子进行严格的批量回测。评估指标包括但不限于IC值、IR值、换手率、衰减特性等,确保因子的有效性和稳定性
。
策略实现与优化:将有效因子整合进多因子模型或开发独立策略,并进行实盘跟踪与持续优化。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕