转录因子(TF)在基因表达调控中发挥了重要作用。鉴定转录因子的靶基因或与靶基因启动子结合的转录因子对于解析转录因子-靶基因模块的生物学功能和调控网络至关重要。
近日,作物生物信息学课题组在Plant Physiology发表了题为“RiceTFtarget: A Rice Transcription Factor-Target Prediction Server Based on Co-expression and Machine Learning”的研究论文,开发了一个水稻转录因子靶基因预测工具RiceTFtarget。
RiceTFtarget是一个基于基因共表达、模式匹配和机器学习的预测转录因子和靶基因互作关系的在线工具。RiceTFtarget 收集了149个无冗余的水稻RNA-seq数据构建了水稻转录因子-靶基因共表达模型。除此之外,通过FIMO将TF识别基序扫描水稻基因启动子序列,获得假定的转录因子结合位点(TFBS)。借助水稻转录因子ChIP-seq数据,利用提取的TFBS的46个基因组特征和随机森林机器学习算法,构建了across-TF 转录因子结合位点预测模型,可用于任意水稻转录因子靶基因的预测。
RiceTFtarget提供了一个用户友好、方便的操作界面。核心功能主要是:用户输入任意感兴趣的水稻转录因子的基因ID,查询哪些靶基因可以被该转录因子调节;或者用户输入感兴趣的基因,查询哪些转录因子可以调节该基因。查询结果包括共表达相关系数,TF结合位点信息以及结合位点的机器学习预测结果等。用户可以自由调节输入参数以获取宽松或严格的预测结果。在预测结果页面,用户可以选择基于共表达的top N 的转录因子-靶基因来构建转录因子调控网络。
RiceTFtarget是一个用于识别转录因子-靶基因互作关系的在线工具,将有助于水稻转录因子功能解析和调控网络相关研究,同时也可为建立其他作物转录因子和靶基因互作关系预测模型提供参考。
该研究由黄骥教授和人工智能学院黄君贤副教授合作完成,博士生张宝一为论文第一作者,黄骥教授和黄君贤副教授为通讯作者,张红生教授,博士生朱雪爱、陈子欣参与了该项工作。
据悉,除了RiceTFtarget (Plant Physiology, 2023) 之外,南京农业大学黄骥教授作物生物信息学课题组先后开发了多个作物生物信息学数据库或在线工具(https://cbi.njau.edu.cn),例如植物miRNA-靶基因互作数据库DPMIND (Bioinformatics, 2018),基于全降解组的植物miRNA靶基因预测工具WPMIAS (Bioinformatics, 2020),植物PhasiRNA预测工具PhasiRNAnalyzer (RNA Biology, 2021),水稻、大豆非编码RNA共表达数据库RiceNCexp (J Exp Bot, 2022) 和SoyNcRNAExp (Plant Physiology, 2022).
RiceTFtarget访问网址:https://cbi.njau.edu.cn/RiceTFtarget/
论文链接:https://doi.org/10.1093/plphys/kiad332