Preview

Цифровая трансформация

Расширенный поиск

Cовременные алгоритмы обработки данных транскриптомов: обзор методов и результаты апробации

Полный текст:

Аннотация

Анализ биоинформатических данных является актуальной проблемой современной вычислительной биологии и прикладной математики. С развитием биотехнологий, а также инструментальных средств получения и обработки информации о биологических объектах и системах, появились нерешенные вопросы разработки и применения новых алгоритмов и программного обеспечения. Авторы предлагают практические алгоритмы и методы обработки транскриптомных данных для эффективных результатов аннотирования, визуализации и интерпретации биоинформатических данных.

Об авторах

М. В. Спринджук
Объединенный институт проблем информатики НАН Беларуси
Беларусь

к. т. н., старший научный сотрудник лаборатории математической кибернетики

ул. Сурганова, д. 6, 220012, г. Минск



Л. В. Можаровская
Институт леса НАН Беларуси
Беларусь

научный сотрудник лаборатории геномных исследований и биоинформатики

ул. Пролетарская, д. 71, 246001, г. Гомель



А. П. Кончиц
Институт леса НАН Беларуси
Беларусь

к. б. н., ведущий научный сотрудник лаборатории лесной селекции и семеноводства

ул. Пролетарская, д. 71, 246001, г. Гомель



Л. П. Титов
РНПЦ эпидемиологии и микробиологии
Россия

д. м. н., профессор, член-корреспондент НАН Беларуси, заведующий лабораторией клинической и экспериментальной микробиологии РНПЦ эпидемиологии и микробиологии  

ул. Филимонова, д. 23, 220114, г. Минск



Список литературы

1. Conesa, A. A survey of best practices for RNA-seq data analysis / A. Conesa, P. Madrigal, S. Tarazona, D. Gomez-Cabrero, A. Cervera et al. // Genome biology.─ 2016.─ V. 17, № 1.─ P. 13.

2. Eldem, V. Transcriptome Analysis for Non-Model Organism: Current Status and Best-Practices / V. Eldem, G. Zararsiz, T. Taşçi, I. P. Duru, Y. Bakir, et al.// Applications of RNA-Seq and Omics Strategies-From Microorganisms to Human Health.─ 2017.─ V. 1, № 2.─ Pp. 1-19.

3. Liu, X. Normalization Methods for the Analysis of Unbalanced Transcriptome Data: A Review / X. Liu, N. Li, S. Liu, J. Wang, N. Zhang et al. // Front BioengBiotechnol.─ 2019.─ V. 7. ─ P. 358.

4. Mutz, K.-O. Transcriptome analysis using next-generation sequencing / K.-O. Mutz, A. Heilkenbrinker, M. Lönne, J.-G. Walter, F. Stahl // Current opinion in biotechnology.─ 2013.─ V. 24, № 1.─ P. 22-30.

5. Можаровская, Л. В. Идентификация и функциональная аннотация патоген-индуцированных генов проростковсосны обыкновенной. Л. В. Можаровская, С. В. Пантеле-ев, О.Ю. Баранов, В.Е. Падутов// Молекулярная и прикладная генетика: сб.науч.тр./ Ин-ститут генетики и цитологии НАН Беларуси; редкол. А.В. Кильчевский (гл. ред.) [и др.]. – Минск: Институт генетики и цитологии НАН Беларуси, 2019. – Т. 26. – С. 69-78.

6. Можаровская, Л. В. Сравнительный анализ транскрипционных профилей проростков сосны обыкновенной (Pinussylvestris L.) различающихся температурными условиями выращивания / Л. В. Можаровская // Проблемы лесоведения и лесоводства: Сб. науч. Трудов ИЛ НАН Беларуси. – Вып. 78. – Гомель: ИЛ НАН Беларуси, 2018. – С. 70-78.

7. Можаровская, Л. В. Выявление сайтов редактирования мРНК в хлоропластном геноме сосны обыкновенной (Pinussylvestris L.)/ Л. В. Можаровская, С. В. Пантелеев, О. А. Разумова, О. Ю. Баранов, // Сборник научных трудов [Институт леса Национальной академии наук Беларуси]/ Национальная академия наук Беларуси, Институт леса. – Гомель, 2019. – Вып. 79: Проблемы лесоведения и лесоводства. – С. 54-61.

8. Кирьянов, П. С. Выявление генетических особенностей среди форм березы повислой, различающихся по признаку узорчатости древесины/ П. С. Кирьянов, О. Ю. Баранов, В. Е. Падутов // Лесное хозяйство : материалы 84-й науч.-техн. конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным уча-стием), Минск, 03–14 февраля 2020 г. / отв. за издание И. В. Войтов; УО БГТУ. – Минск: БГТУ, 2020. – С. 106-107.

9. Падутов, В. Е. Сравнительный анализ транскрипционных профилей каллусных культур лиственницы сибирской с различным эмбриогенным потенциалом / В. Е. Падутов, И. Н.Третьякова, Л. В. Можаровская, А. В. Константинов, Д. В. Кулагин, М. П. Кусенкова // Лесное хозяйство : материалы 84-й науч.-техн. конференции профессорско-преподавательского состава, научных сотрудников и аспирантов (с международным участием), Минск, 03–14 февраля 2020 г. / отв. за издание И. В. Войтов; УО БГТУ. – Минск: БГТУ, 2020. – С. 131.

10. Wang, Z. RNA-Seq: a revolutionary tool for transcriptomics / Z. Wang, M. Gerstein, M. Snyder // Nature reviews genetics. – 2009. – V. 10. – №. 1. – Pp. 57-63.

11. Haas, B.J. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis / B. J. Haas, A. Papanicolaou, M. Yassour, M. Grabherr, P. D. Blood et al. // Nat Protoc.─ 2013.─ V. 8, № 8.─ Pp. 1494-512.

12. Wang, Y., Sun, M.-a. Transcriptome Data Analysis: Methods and Protocols. Springer, 2018.

13. [Электронный ресурс] – Режим доступа: http://bioinformaticsinstitute.ru/sites/default/files/07-28-04-kasyanov.pdf. – Дата доступа: 04.09.2020.

14. Касьянов, А. С. Новые методы обработки данных, полученных с помощью современных технологий секвенирования, для решения задач анализа экспрессии генов:автореф. дисс. канд. физ.-мат. наук. – 2012.

15. Водясова, Е. А.Новейшие технологии высокопроиз-водительного секвенированиятранскриптома отдельных клеток / Е. А. Водясова, Э. С. Челебиева, О. Н. Кулешова//Вавиловский журнал генетики и селекции. – 2019. – Т. 23. – №. 5. – С. 508-518.

16. Ewing, B. Base-calling of automated sequencer traces using phred. II. Error proba-bilities / B. Ewing, P. Green, //Genome research. – 1998. – V. 8. – №. 3. – P. 186-194

17. Brown, J. FQC Dashboard: integrates FastQC results into a web-based, interactive, and extensible FASTQ quality control tool / J. Brown, M. Pirrung, L. A. McCue// Bioinformatics.─ 2017.─ V. 1, № 1.─ P. 1-9.

18. Dai, M. NGSQC: cross-platform quality analysis pipeline for deep sequencing data / M. Dai, Thompson, R. C. Maher, R. Contreras-Galindo, M. H. Kaplan et al. // BMC Genomics.─ 2010.─ V. 11 Suppl 4, ─ P. S7.

19. Романенков, К. В. Метод оценки качества сборки генома на основе частот k-меров // Препринты ИПМ им. М.В.Келдыша. 2017. № 11. 24 с. doi:10.20948/prepr-2017-11

20. Giannoulatou, E., Park, S.H., Humphreys, D.T., Ho, J.W. Verification and validation of bio-informatics software without a gold standard: a case study of BWA and Bowtie / E. Giannoulatou, S.H. Park, D. T. Humphreys, J. W. Ho // BMC Bioin-formatics.─ 2014.─ V. 15 Suppl 16, ─ P. S15.

21. Langdon, W. B. Performance of genetic programming optimised Bowtie2 on genome comparison and analytic testing (GCAT) benchmarks // BioData Min.─ 2015.─ V. 8, № 1.─ P. 1.

22. Lu, R. Characterization of bHLH/HLH genes that are involved in brassinosteroid (BR) signaling in fiber development of cotton (Gossypiumhirsutum) / R. Lu, J. Zhang, D. Liu, Y. L. Wei, Y. Wang, et al. // BMC Plant Biol.─ 2018.─ V. 18, № 1.─ P. 304.

23. Kim, D. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions /Kim, D., Pertea, G., Trapnell, C., Pimentel, H., Kelley, R. et al. // Genome Biol.─ 2013.─ V. 14, № 4.─ P. R36.

24. Bankevich, A. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing / Bankevich, A., Nurk, S., Antipov, D., Gurevich, A.A., Dvorkin, M. et al.// J Comput Biol.─ 2012.─ V. 19, № 5.─ P. 455-77.

25. Bankar, K.G., Ameliorated de novo transcriptome assembly using Illumina paired end sequence data with Trinity Assembler / Todur, V.N., Shukla, R.N., Vasudevan, M.// Genom Data.─ 2015.─ V. 5. ─ P. 352-9.

26. Cabau, C. Compacting and correcting Trinity and Oases RNA-Seq de novo assemblies / Cabau, C., Escudie, F., Djari, A., Guiguen, Y., Bobe, J. et al.// PeerJ.─ 2017.─ V. 5. ─ P. e2988.

27. Haas, B. J. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis / Haas, B.J., Papanicolaou, A., Yassour, M., Grabherr, M., Blood, P.D. et al.// Nat Protoc.─ 2013.─ V. 8, № 8.─ P. 1494-512.

28. Kim, C.S. K-mer clustering algorithm using a MapReduce framework: application to the parallelization of the Inchworm module of Trinity / Kim, C.S., Winn, M.D., Sachdeva, V., Jordan, K.E.// BMC Bioinformatics.─ 2017.─ V. 18, № 1.─ P. 467.

29. Cabau, C. Compacting and correcting Trinity and Oases RNA-Seq de novo assemblies / Cabau, C., Escudie, F., Djari, A., Guiguen, Y., Bobe, J. et al.// PeerJ.─ 2017.─ V. 5, ─ P. e2988.

30. Schulz, M. H. Oases: robust de novo RNA-seq assembly across the dynamic range of expression levels / Schulz, M.H., Zerbino, D.R., Vingron, M., Birney, E./ Bioinformatics.─ 2012.─ V. 28, № 8.─ P. 1086-92.

31. Birol, I. De novo transcriptome assembly with ABySS / Birol, I., Jackman, S.D., Nielsen, C. B., Qian, J. Q., Varhol, R. et al.// Bioinformatics.─ 2009.─ V. 25, № 21.─ P. 2872-7.

32. Jackman, S.D. ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter / Jackman, S.D., Vandervalk, B.P., Mohamadi, H., Chu, J., Yeo, S. et al.// Genome Res.─ 2017.─ V. 27, № 5.─ P. 768-777.

33. Simpson, J.T. ABySS: a parallel assembler for short read sequence data / Simpson, J.T., Wong, K., Jackman, S.D., Schein, J.E., Jones, S.J.// Genome Res.─ 2009.─ V. 19, № 6.─ P. 1117-23.

34. Boerner, S. Computational Analysis of LncRNA from cDNA Sequences /Boerner, S., McGinnis, K.M. // Methods In Molecular Biology (Clifton, N.J.).─ 2016.─ V. 1402, ─ P. 255-269.

35. Ge, S., Jung, D. ShinyGO: a graphical enrichment tool for animals and plants. 2018.

36. Zhang C. et al. Evaluation and comparison of computational tools for RNA-seq isoform quan-tification //BMC genomics. – 2017. – V. 18. – №. 1. – P. 583.

37. Chen, T.W., Gan, R.C., Wu, T.H., Huang, P.J., Lee, C.Y. et al. FastAnnotator--an efficient transcript annotation web tool // BMC Genomics.─ 2012.─ V. 13 Suppl 7, ─ P. S9.

38. Huerta-Cepas, J. eggNOG 4.5: a hierarchical orthology framework with improved functional annotations for eukaryotic, prokaryotic and viral sequences /Huerta-Cepas, J., Szklarczyk, D., Forslund, K., Cook, H., Heller, D. et al. / Nucleic Acids Research.─ 2016.─ V. 44, № D1.─ P. D286-D293.

39. Van Bel, M. TRAPID: an efficient online tool for the functional and comparative analysis of de novo RNA-Seq transcriptomes /Van Bel, M., Proost, S., Van Neste, C., Deforce, D., Van de Peer, Y. et al. // Genome Biol.─ 2013.─ V. 14, № 12.─ P. R134.

40. Jones, P. InterProScan 5: genome-scale protein function classification / Jones, P., Binns, D., Chang, H.Y., Fraser, M., Li, W. et al.// Bioinformatics.─ 2014.─ V. 30, № 9.─ P. 1236-40.

41. Kelly, R.J. IPRStats: visualization of the functional potential of an InterProScan run /Kelly, R.J., Vincent, D.E., Friedberg, I. // BMC Bioinformatics.─ 2010.─ V. 11 Suppl 12. ─ P. S13.

42. Mulder, N. InterPro and InterProScan: tools for protein sequence classification and comparison / Mulder, N., Apweiler, R.// Methods Mol Biol.─ 2007.─ V. 396, ─ P. 59-70.

43. Quevillon, E. InterProScan: protein domains identifier /Quevillon, E., Silventoinen, V., Pillai, S., Harte, N., Mulder, N. et al. / Nucleic Acids Research.─ 2005.─ V. 33. № Web Server issue.─ P. W116-20.

44. Syed, A. Java GUI for InterProScan (JIPS): a tool to help process multiple InterProScans and perform ortholog analysis / Syed, A., Upton, C.// BMC Bioinformatics.─ 2006.─ V. 7, ─ P. 462.

45. Zdobnov, E.M. InterProScan--an integration platform for the signature-recognition methods in InterPro /Zdobnov, E.M., Apweiler, R. // Bioinformatics.─ 2001.─ V. 17, № 9.─ P. 847-8.

46. Пантелеев, С. В. Молекулярно-генетическая диагностика инфекционных агентов по-бегов сосны обыкновенной с признаками «ведьминых метел» / С. В. Пантелеев, О. Ю. Ба-ранов, И. Э. Рубель // Сб. науч. тр. / НАН Беларуси, Институт леса. – Гомель, 2016. – Вып. 76 : Проблемы лесоведения и лесоводства. – С. 242–249.


Для цитирования:


Спринджук М.В., Можаровская Л.В., Кончиц А.П., Титов Л.П. Cовременные алгоритмы обработки данных транскриптомов: обзор методов и результаты апробации. Цифровая трансформация. 2021;(1):53-64.

For citation:


Sprindzuk M.V., Mozharovskaya L.V., Konchits A.P., Titov L.P. Modern Tanscriptome Data Rrocessing Algorithms: a Review of Methods and Results of Approbation. Digital Transformation. 2021;(1):53-64. (In Russ.)

Просмотров: 11


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2522-9613 (Print)
ISSN 2524-2822 (Online)