昆虫是一个基因多样化的群体,它们以多种方式与人类相互作用——有些帮助我们吃饭和穿衣,而另一些则可能引起疾病或威胁食物供应。重要的是我们了解昆虫基因组中每个基因的功能,特别是应用基因组编辑来帮助靶向昆虫基因并加速昆虫学研究。此外,这些信息需要是机器可读的,以便可以应用计算方法来获得对昆虫生物系统有意义的见解。

昆虫功能基因组学工作流程扩展了编辑可能性

截至2022年5月,约3000个昆虫物种的基因组已完成测序和登记。新一代长读长测序技术的应用进一步简化和加快了昆虫基因组和转录组测序的步伐。尽管测序技术取得了如此迅速的进步,但我们仍然缺乏对昆虫基因功能的全面了解,我们的大部分知识都依赖于基因组编辑出现之前的实验。序列数据的生物学解释仍然是昆虫基因组学和转录组学的瓶颈。

为了解决这一知识差距,广岛大学、东京农工大学和RIKEN综合医学中心的科学家开发了一种名为Fanflow4Insects的工作流程,利用转录序列和参考来注释昆虫基因的功能基因组和蛋白质序列数据库。该小组利用Fanflow4Insects注释了日本竹节虫和蚕的基因功能。

该工作流程的详细信息发表在《昆虫》杂志上题为“昆虫的系统功能注释工作流程”的文章中。这种功能注释工作流程扩展了基因组编辑在昆虫学中的潜在应用,可以帮助科学家更好地管理受影响生态系统中的不同昆虫物种。

“一旦目标生物体的基因组或转录组被解码,功能注释是加速目标基因选择的最重要过程之一。Fanflow4Insects工作流程获得的功能注释信息将极大地扩展利用基因组编辑进行昆虫学研究的可能性。”该研究的主要作者、广岛生命综合科学研究生院教授HidemasaBono博士说道。大学。

转录组是生物体RNA分子的总和。转录组分析是功能注释的重要第一步,这反过来又为选择基因组编辑靶标提供了线索。一些昆虫的基因组比人类基因组大,这给破译昆虫基因功能的全基因组测序方法造成了实际障碍。基于下一代RNA测序技术的转录组分析为评估昆虫大型基因组提供了一种更易于管理的替代方案。

RNA测序可以通过组装数千万个读数来识别特定组织中表达的数万个可能的基因。然后将这些基因序列组装成转录单位。

这种分析方法取决于综合数据集及其功能注释的可用性。序列数据库确实存在,但功能注释与最近昆虫基因组测序数据的爆炸式增长并不同步。

各个昆虫研究小组运行自己的管道,在逐个研究的基础上组装转录单元。这些管道是处理基因组测序数据的算法集。这些分散且孤立的功能注释管道必须集成到公共数据库中以获得有意义的见解。

Fanflow4Insects在GitHub上公开开发并可公开访问。与来自表达的功能注释一起,Fanflow4Insects的数据可应用于具有不同表型的昆虫的比较研究。

波诺和他的团队打算利用新开发的工作流程来注释昆虫中产生有用物质的基因的功能。最终,该团队希望利用计算机模拟,利用这种功能注释工作流程来设计昆虫的分子网络。