Биоинформа тика междисциплинарная область объединяющая общую биологию молекулярную биологию кибернетику генетику химию к
Биоинформатика

Биоинформа́тика — междисциплинарная область, объединяющая общую биологию, молекулярную биологию, кибернетику, генетику, химию, компьютерные науки, математику и статистику. Крупномасштабные биологические проблемы, требующие анализа больших объёмов данных, решаются биоинформатикой с вычислительной точки зрения. Биоинформатика главным образом включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных.

В похожем контексте часто упоминается термин вычислительная биология. Эта область акцентирует свое внимание на разработке алгоритмов и математическом моделировании социальных, поведенческих и биологических систем. Биоинформатику считают областью внутри вычислительной биологии, которая главным образом сфокусирована на статистической обработке биологических данных. Различия в подходе с разных сторон: биоинформатики — это биологи, специализирующиеся на использовании вычислительных систем и инструментов для решения биологических задач, а вычислительные биологи — это специалисты по компьютерным наукам, математики, статистики и инженеры, разрабатывающие инструменты для таких расчётов.
Биоинформатика в широком смысле подразумевает работу с любыми видами биологических данных, включая исследование электронных микрофотографий, поиск ключевых слов в биологической литературе и так далее. Если рассматривать биоинформатику как набор подходов и методов для работы с данными, то в зависимости от типов технических задач она включает в себя:
- Разработку алгоритмов и программ для более эффективной работы с данными
- Хранение и передачу информации или работу с базами данных
Однако, биоинформатические методы анализа также неразрывно связаны со многими научными областями, которые подразумевает поиск ответов на конкретные биологические вопросы. В таком случае основные направления можно выделить на основании исследуемых объектов:
- Биоинформатика последовательностей
- Анализ экспрессий
- Структурная биоинформатика
- Изучение клеточной организации
- Системная биология
Для каждого из перечисленных разделов можно выделить свои стандартные типы данных, способы их обработки, биоинформатические алгоритмы и базы данных.
В биоинформатике используются методы прикладной математики, статистики и информатики. Биоинформатика используется в биохимии, биофизике, экологии и в других областях. Наиболее часто используемыми инструментами и технологиями в этой области являются языки программирования Python, R, Java, C#, C++; язык разметки — XML; язык структурированных запросов к базам данных — SQL; программно-аппаратная архитектура параллельных вычислений — CUDA; пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете — MATLAB, и электронные таблицы.
Введение
Биоинформатика стала важной частью многих областей биологии. Биоинформатические методы анализа дают возможность интерпретировать большие объемы экспериментальных данных, что до развития этой области было практически невозможно. Например, экспериментальной молекулярной биологии часто используются такие методы биоинформатики, как обработка изображений и сигналов. В области генетики и геномики биоинформатика помогает в функциональной аннотации геномов, детекции и анализе мутаций. Важной задачей является изучение экспрессии генов и способов её регуляции. Кроме того, инструменты биоинформатики позволяют сравнивать геномные данные, что является необходимым условием для изучения принципов молекулярной эволюции.
В общем виде, биоинформатика помогает анализировать и каталогизировать биохимические пути и сети, которые являются важной частью системной биологии. В структурной биологии, она помогает в моделировании ДНК, РНК и белковых структур, а также молекулярных взаимодействий.
Последние успехи в обработке биологических данных привели к значительным изменениям в области биомедицины. Благодаря развитию биоинформатики у ученых появилась возможность идентифицировать молекулярные механизмы, лежащие в основе как наследственных, так и приобретенных заболеваний, что помогает в разработке эффективных способов лечения и более точных тестов для диагностики заболеваний. Направление исследований, которое позволяет предсказывать эффективность и неблагоприятные эффекты действия лекарственных средств у пациентов, получило название фармакогенетика, и в его основе также лежат биоинформатические методы.
Важная роль биоинформатики также заключается в анализе биологической литературы и развитии биологических и генетических онтологий по организации биологических данных.
История
Опираясь на признание важной роли передачи, хранения и обработки информации в биологических системах, в 1970 году Полина Хогевег ввела термин «биоинформатика», определив его как изучение информационных процессов в биотических системах. Это определение проводит параллель биоинформатики с биофизикой (учение о физических процессах в биологических системах) или с биохимией (учение о химических процессах в биологических системах).
Последовательности
Историю биоинформатики последовательностей можно отсчитывать от достижений 1950-х годов. В феврале 1953 года Уотсон и Крик предложили модель молекулы ДНК, а в мае 1953 года опубликовали статью в журнале Nature, в которой разбирался вопрос о ДНК как о носителе кода генетической информации. Кроме того, в конце 1950-х Сэнгер опубликовал первую последовательность белка, инсулина.
Наиболее используемым методом секвенирования аминокислотных последовательностей стала деградация Эдмана, основным недостатком которой была сложность в получении длинных белковых последовательностей: теоретический максимум составлял 50—60 аминокислот за одну реакцию. Из-за этого белки нужно было сначала расщеплять на мелкие фрагменты, а затем собирать последовательности белка из сотен коротких цепей, что не всегда удавалось сделать правильно. Решение этой проблемы предложила Маргарет Дейхофф (1925—1983) — американская учёная, физический химик. Дейхофф активно использовала в своей работе компьютерные методы и увидела потенциал в их применении в области биологии и медицины. В 1962 году она завершила разработку COMPROTEIN, инструмента для определения первичной структуры белка с использованием данных секвенирования пептидов по методу Эдмана. В COMPROTEIN ввод и вывод аминокислотной последовательности был представлен в трехбуквенных сокращениях. Чтобы упростить обработку данных о последовательностях белков, Дейхофф позже разработала однобуквенный аминокислотный код, который используется до сих пор. Вклад Дейхофф в эту область настолько значителен, что Дэвид Дж. Липман, бывший директор Национального центра биотехнологической информации (NCBI), называл ее «мать и отец биоинформатики».
С накоплением новых последовательностей белков, в них стали прослеживаться некоторые закономерности. Так, Цукеркандль и Полинг отметили, что ортологичные белки позвоночных (например, гемоглобин), демонстрируют слишком высокую степень сходства последовательностей чтобы быть результатом конвергентной эволюции. Для подтверждения новых эволюционных гипотез были необходимы новые математические и компьютерные методы. Первый алгоритм динамического программирования для парных выравниваний белковых последовательностей был разработан в 1970 году Нидлманом и Вуншем. Алгоритмы множественного выравнивания последовательностей появились значительно позже: первый практически применимый алгоритм был разработан Да-Фэй Фэн и Расселом Ф. Дулитлом в 1987 году. Его упрощение, алгоритм CLUSTAL, используется до сих пор. Кроме того, в 1978 году группа ученых, в которую входила Дейхофф, создала первую модель замен, основанную на наблюдении точечных принятых мутаций (PAMs) в филогенетических деревьях 71 семейства белков, имеющих более 85 % идентичности. В результате была получена матрица, содержащая значения вероятности замен аминокислот.
Центральная догма молекулярной биологии, которая была опубликована Френсисом Криком в 1970 году, а также постепенное определение всех аминокислот, кодируемых 68 кодонами, привели к постепенной смене парадигмы от белковой эволюции к эволюции ДНК в 1970—1980 годах. Появилась необходимость научиться читать последовательности ДНК. Первым методом секвенирования ДНК, получившим широкое распространение, стал метод секвенирования Максама — Гилберта в 1976 году. Однако наибольшее распространение получил метод, разработанный в лаборатории Фредерика Сэнгера в 1977 году, он используется до сих пор. Секвенирование по Сэнгеру позволило получать довольно большие для того времени объёмы информации, но размер фрагментов, которые получалось секвенировать, был ограничен сотнями нуклеотидов, чего хватало только для изучения таких небольших геномов, как геномы бактериофагов. Первое программное обеспечение, предназначенное для анализа последовательностей, полученный в результате секвенирования по Сэнгеру было опубликовано Роджером Стаденом в 1979 году. Этот пакет компьютерных программ позволил не только для сборки последовательносей в контиги, но и для проверки и редактирования этих последовательностей, а также для аннотации.
Геномы
С публикации генома человека в начале XXI века началась геномная эра биоинформатики. Проект был инициирован в 1991 году в США и обошёлся в 2,7 миллиарда долларов, заняв более 13 лет. В 1998 году Celera Genomics произвела конкурирующее частное исследование по секвенированию и сборке человеческого генома. Исследование потребовало в 10 раз меньше денег и катализировало разработку новых экспериментальных стратегий секвенирования, таких как 454 и Illumina. Стоимость секвенирования ДНК упала на несколько порядков, что привело к колоссальному увеличению количества последовательностей в публичных базах данных. Возникла потребность в разработке способов хранения и быстрой обработке биологических данных. В 2005 году был создан Консорциум геномных стандартов и мандат, определивший минимальную информацию необходимую для публикации геномной последовательности. Целью развития технологий изучения генома является удешевление стоимости расшифровки одного генома предположительно до 100$, что существенно сократит затраты и поможет внедрению этих процедур в повседневную жизнь.
Цели
Главная цель биоинформатики — способствовать пониманию биологических процессов. Отличие биоинформатики от других подходов состоит в том, что она фокусируется на создании и применении интенсивных вычислительных методов для достижения этой цели. Примеры подобных методов: распознавание образов, data mining, алгоритмы машинного обучения и . Основные усилия исследователей направлены на решение задач выравнивания последовательностей, нахождения генов (поиск региона ДНК, кодирующего гены), расшифровки генома, конструирования лекарств, разработки лекарств, выравнивания структуры белка, предсказания структуры белка, предсказания экспрессии генов и взаимодействий «белок-белок», полногеномного поиска ассоциаций и моделирования эволюции.
Биоинформатика сегодня подразумевает создание и совершенствование баз данных, алгоритмов, вычислительных и статистических методов и теории для решения практических и теоретических проблем, возникающих при управлении и анализе биологических данных.
Основные области исследований
Анализ генетических последовательностей

C тех пор как в 1977 году был секвенирован фаг [англ.], последовательности ДНК всё большего числа организмов были дешифрованы и сохранены в базах данных. Эти данные используются для определения последовательностей белков и регуляторных участков. Сравнение генов в рамках одного или разных видов может продемонстрировать сходство функций белков или отношения между видами (таким образом могут быть составлены Филогенетические деревья). С возрастанием количества данных уже давно стало невозможным вручную анализировать последовательности. В наши дни для поиска по геномам тысяч организмов, состоящих из миллиардов пар нуклеотидов используются компьютерные программы. Программы могут однозначно сопоставить (выровнять) похожие последовательности ДНК в геномах разных видов; часто такие последовательности несут сходные функции, а различия возникают в результате мелких мутаций, таких как замены отдельных нуклеотидов, вставки нуклеотидов, и их «выпадения» (делеции). Один из вариантов такого выравнивания применяется при самом процессе секвенирования. Так называемая техника «дробного секвенирования» (которая была, например, использована [англ.] для секвенирования первого бактериального генома, Haemophilus influenzae) вместо полной последовательности нуклеотидов даёт последовательности коротких фрагментов ДНК (каждый длиной около 600—800 нуклеотидов). Концы фрагментов накладываются друг на друга и, совмещённые должным образом, дают полный геном. Такой метод быстро даёт результаты секвенирования, но сборка фрагментов может быть довольно сложной задачей для больших геномов. В проекте по расшифровке генома человека сборка заняла несколько месяцев компьютерного времени. Сейчас этот метод применяется для практически всех геномов, и алгоритмы сборки геномов являются одной из острейших проблем биоинформатики на сегодняшний момент.
Другим примером применения компьютерного анализа последовательностей является автоматический поиск генов и регуляторных последовательностей в геноме. Не все нуклеотиды в геноме используются для задания последовательностей белков. Например, в геномах высших организмов, большие сегменты ДНК явно не кодируют белки и их функциональная роль неизвестна. Разработка алгоритмов выявления кодирующих белки участков генома является важной задачей современной биоинформатики.
Биоинформатика помогает связать геномные и протеомные проекты, к примеру, помогая в использовании последовательности ДНК для идентификации белков.
Аннотация геномов
В контексте геномики аннотация — процесс маркировки генов и других объектов в последовательности ДНК. Первая программная система аннотации геномов была создана в 1995 году [англ.], работавшим в команде Института Геномных Исследований (англ. The Institute for Genomic Research), секвенировавшей и проанализировавшей первый декодированный геном свободноживущего организма, бактерии Haemophilus influenzae. Доктор Уайт построил систему для нахождения генов (участок ДНК, задающий последовательность определённого полипептида либо функциональной РНК), тРНК и других объектов ДНК и сделал первые обозначения функций этих генов. Большинство современных систем аннотации генома работают сходным образом, но такие программы доступные для анализа геномной ДНК, как [англ.], используются для нахождения генов, кодирующих белок в Haemophilus influenzae, постоянно меняются и совершенствуются.
Вычислительная эволюционная биология
Эволюционная биология исследует происхождение и появление видов, также как их развитие с течением времени. Информатика помогает эволюционным биологам в нескольких аспектах:
- изучать эволюцию большого числа организмов, измеряя изменения в их ДНК, а не только в строении или физиологии;
- сравнивать целые геномы (см. BLAST), что позволяет изучать более комплексные эволюционные события, такие как: дупликация генов, горизонтальный перенос генов, и предсказывать бактериальные специализирующие факторы;
- строить компьютерные модели популяций, чтобы предсказать поведение системы во времени;
- отслеживать появление публикаций, содержащих информацию о большом количестве видов.
Область в компьютерных науках, которая использует генетические алгоритмы, часто путают с , но две эти области не обязательно связаны. Работа в этой области использует специализированное программное обеспечение для улучшения алгоритмов и вычислений и основывается на , таких, как репликация, диверсификация через рекомбинацию или мутации, и выживании в естественном отборе.
Оценка биологического разнообразия
Биологическое разнообразие экосистемы может быть определено как полная генетическая совокупность определённой среды, состоящая из всех обитающих видов, и пусть это биоплёнка в заброшенной шахте, капля морской воды, горсть земли или вся биосфера планеты Земля. Для сбора видовых имён, описаний, области распространения, генетической информации используются базы данных. Специализированное программное обеспечение применяется для поиска, визуализации и анализа информации, и, что более важно, предоставления её другим людям. Компьютерные симуляторы моделируют такие вещи, как популяционная динамика, или вычисляют общее генетическое здоровье культуры в агрономии. Один из важнейших потенциалов этой области заключается в анализе последовательностей ДНК или полных геномов целых вымирающих видов, позволяя запомнить результаты генетического эксперимента природы в компьютере и возможно использовать вновь в будущем, даже если эти виды полностью вымрут.
Часто из области рассмотрения биоинформатики выпадают методы оценки других компонентов биоразнообразия — таксонов (в первую очередь видов) и экосистем. В настоящее время математические основания биоинформационных методов для таксонов представлены в рамках такого научного направления как фенетика, или численная таксономия. Методы анализа структуры экосистем рассматриваются специалистами таких направлений как системная экология, биоценометрия.
Основные биоинформатические программы
- ACT (Artemis Comparison Tool) — геномный анализ
- Arlequin — анализ популяционно-генетических данных
- Bioconductor — масштабный FLOSS-проект, предоставляющий множество отдельных пакетов для биоинформатических исследований. Написан на R.
- BioEdit — редактор множественного выравнивания нуклеотидных и аминокислотных последовательностей
- BioNumerics — коммерческий универсальный пакет программ
- BLAST — поиск родственных последовательностей в базе данных нуклеотидных и аминокислотных последовательностей
- Clustal — множественное выравнивание нуклеотидных и аминокислотных последовательностей
- DnaSP — анализ полиморфизма последовательностей ДНК
- FigTree — редактор филогенетических деревьев
- Genepop — популяционно-генетический анализ
- Genetix — популяционно-генетический анализ (программа доступна только на французском языке)
- JalView — редактор множественного выравнивания нуклеотидных и аминокислотных последовательностей
- MacClade — коммерческая программа для интерактивного эволюционного анализа данных
- MEGA — молекулярно-эволюционный генетический анализ
- Mesquite — программа для сравнительной биологии на языке Java
- Muscle — множественное сравнение нуклеотидных и аминокислотных последовательностей. Более быстрая и точная по сравнению с ClustalW
- PAUP — филогенетический анализ с использованием метода парсимонии (и других методов)
- PHYLIP — пакет филогенетических программ
- Phylo_win — филогенетический анализ. Программа имеет графический интерфейс.
- PopGene — анализ генетического разнообразия популяций
- Populations — популяционно-генетический анализ
- PSI Protein Classifier — обобщение результатов, полученных с помощью программы PSI-BLAST
- Seaview — филогенетический анализ (с графическим интерфейсом)
- — депонирование последовательностей в GenBank, EMBL, DDBJ
- SPAdes — сборщик бактериальных геномов
- SplitsTree — программа для построения филогенетических деревьев
- T-Coffee — множественное прогрессивное выравнивание нуклеотидных и аминокислотных последовательностей. Более чувствительное, чем в ClustalW/ClustalX.
- UGENE — свободный русскоязычный инструмент, множественное выравнивание нуклеотидных и аминокислотных последовательностей, филогенетический анализ, аннотирование, работа с базами данных.
- Velvet — сборщик геномов
- ZENBU — обобщение результатов
Структурная биоинформатика
К структурной биоинформатике относится разработка алгоритмов и программ для предсказания пространственной структуры белков. Темы исследований в структурной биоинформатике:
- Рентгеноструктурный анализ (РСА) макромолекул
- Индикаторы качества модели макромолекулы, построенной по данным РСА
- Алгоритмы вычисления поверхности макромолекулы
- Алгоритмы нахождения гидрофобного ядра молекулы белка
- Алгоритмы нахождения структурных доменов белков
- Пространственное выравнивание структур белков
- Структурные классификации доменов SCOP и CATH
- Молекулярная динамика
См. также
- Вычислительная биология
- Математическая биология
- Хемоинформатика
- Международное Общество Вычислительной Биологии
- Генная онтология
- Пангеном
- Список научных журналов по биоинформатике (англ.)
- Когнитивная геномика
Примечания
- Can, T. Introduction to bioinformatics // miRNomics : MicroRNA Biology and Computational Analysis : [англ.] / Editors Malik Yousef and Jens Allmer. — Totowa, NJ : Humana Press, 2014. — P. 51–71. — 325 p. — (Methods in Molecular Biology ; vol. 1107). — ISBN 978-1-62703-748-8. — ISBN 978-1-62703-747-1. — doi:10.1007/978-1-62703-748-8_4.
- Nair, A. S. Computational biology & bioinformatics : a gentle overview : [англ.] : [арх. 26 марта 2022] // Communications of the Computer Society of India : журн. — 2007. — Vol. 2 (January).
- Кунин, Е. Суп из гвоздя : Ведущий эволюционист рассказал о Мультивселенной и антропном принципе : [арх. 9 августа 2014] // Лента.ru. — 2012. — 1 декабря.
- Гельфанд, М. С. Биоинформатика как дисциплина : Биоинформатик Михаил Гельфанд о системной биологии, предсказании функций белков и процессах эволюции : [арх. 3 августа 2020] // Постнаука. — 2015. — 28 февраля.
- Manisekhar S. R., Siddesh G. M., Manvi S. S. Introduction to Bioinformatics // Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques, Tools, and Applications. — Springer, Singapore, 2020. — С. 3-9. Дата обращения: 24 апреля 2020. Архивировано 3 июня 2022 года.
- Hogeweg P. The roots of bioinformatics in theoretical biology. (англ.) // Public Library of Science for Computational Biology. — 2011. — Vol. 7, no. 3. — P. e1002021. — doi:10.1371/journal.pcbi.1002021. — PMID 21483479.
- Hesper B., Hogeweg P. Bioinformatica: een werkconcept (неопр.). — Kameleon, 1970. — Т. 1, № 6. — С. 28—29.
- Watson J. D., Crick F. H. Genetical implications of the structure of deoxyribonucleic acid // Nature : journal. — 1953. — May (vol. 171, no. 4361). — P. 964—967. — doi:10.1038/171964b0. — Bibcode: 1953Natur.171..964W. — PMID 13063483.
- Sanger F., Thompson E. O. P. The amino-acid sequence in the glycyl chain of insulin. 1. The identification of lower peptides from partial hydrolysates //Biochemical Journal. — 1953. — Т. 53. — №. 3. — С. 353. Дата обращения: 24 апреля 2020. Архивировано 3 июня 2022 года.
- Sanger F., Thompson E. O. P. The amino-acid sequence in the glycyl chain of insulin. 2. The investigation of peptides from enzymic hydrolysates //Biochemical Journal. — 1953. — Т. 53. — №. 3. — С. 366.
- Dayhoff M. O., Ledley R. S. uter program to aid primary protein structure determination //Proceedings of the December 4-6, 1962, fall joint computer conference. — 1962. — С. 262—274. Дата обращения: 24 апреля 2020. Архивировано 26 июня 2020 года.
- Moody G. Digital code of life: how bioinformatics is revolutionizing science, medicine, and business //John Wiley & Sons, 2004.
- Gauthier J. et al. A brief history of bioinformatics //Briefings in bioinformatics. — 2019. — Т. 20. — №. 6. — С. 1981—1996.
- Needleman SB, Wunsch CD. A general method applicable to the search for similarities in the amino acid sequence of two proteins //J Mol Biol 1970;48:443-53.
- Feng D. F., Doolittle R. F. Progressive sequence alignment as a prerequisitetto correct phylogenetic trees //Journal of molecular evolution. — 1987. — Т. 25. — №. 4. — С. 351—360. Дата обращения: 24 апреля 2020. Архивировано 24 февраля 2021 года.
- Dayhoff M., Schwartz R., Orcutt B. 22 a model of evolutionary change in proteins //Atlas of protein sequence and structure. — MD : National Biomedical Research Foundation Silver Spring, 1978. — Т. 5. — С. 345—352. Дата обращения: 24 апреля 2020. Архивировано 16 августа 2021 года.
- Maxam A. M., Gilbert W. A new method for sequencing DNA //Proceedings of the National Academy of Sciences. — 1977. — Т. 74. — №. 2. — С. 560—564. Дата обращения: 24 апреля 2020. Архивировано 16 сентября 2018 года.
- Staden R. A strategy of DNA sequencing employing computer programs //Nucleic acids research. — 1979. — Т. 6. — №. 7. — С. 2601—2610. Дата обращения: 24 апреля 2020. Архивировано 2 мая 2019 года.
- [NHGRI. Human Genome Project Completion: Frequently Asked Questions. National Human Genome Research Institute (NHGRI). https://www.genome.gov/11006943/ Архивная копия от 16 апреля 2019 на Wayback Machine Human-Genome-Project-Completion-Frequently-]
- Field D, Sterk P, Kottmann R, et al. Genomic standards consortium projects. Stand Genomic Sci 2014;9:599-601.
- Robert Ghrist - Homological Algebra and Data.
Литература
- Jonathan Pevsner (2013) Bioinformatics and Functional Genomics
- Jean-Michel Claverie Ph.D. (2007) Bioinformatics For Dummies. 2nd edition.
- Дурбин Р, Эдди Ш, Крог А, Митчисон Г. «Анализ биологических последовательностей». — М.-Ижевск: НИЦ «Регулярная и хаотичная динамика», 2006. — 480 с. — ISBN 5-93972-559-7
- Бородовский М., Екишева С. «Задачи и решения по анализу биологических последовательностей». — М.-Ижевск: НИЦ «Регулярная и хаотичная динамика», 2008. — 420 с. — ISBN 978-5-93972-644-3
- Сетубал Ж, Мейданис Ж. «Введение в вычислительную молекулярную биологию». — М.-Ижевск: НИЦ «Регулярная и хаотичная динамика», 2007. — 420 с. — ISBN 978-5-93972-623-8
- В. А. Таланов, Математические модели синтеза пептидных цепей и методы теории графов в расшифровке генетическиех текстов
Ссылки
- Биоинформатика. Рубрика «Наука» . ТАСС. — Читать все последние новости на тему. Дата обращения: 7 августа 2023.
Автор: www.NiNa.Az
Дата публикации:
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер
Bioinforma tika mezhdisciplinarnaya oblast obedinyayushaya obshuyu biologiyu molekulyarnuyu biologiyu kibernetiku genetiku himiyu kompyuternye nauki matematiku i statistiku Krupnomasshtabnye biologicheskie problemy trebuyushie analiza bolshih obyomov dannyh reshayutsya bioinformatikoj s vychislitelnoj tochki zreniya Bioinformatika glavnym obrazom vklyuchaet v sebya izuchenie i razrabotku kompyuternyh metodov i napravlena na poluchenie analiz hranenie organizaciyu i vizualizaciyu biologicheskih dannyh Karta H hromosomy cheloveka s sajta NCBI Sborka chelovecheskogo genoma eto odno iz velichajshih dostizhenij bioinformatiki V pohozhem kontekste chasto upominaetsya termin vychislitelnaya biologiya Eta oblast akcentiruet svoe vnimanie na razrabotke algoritmov i matematicheskom modelirovanii socialnyh povedencheskih i biologicheskih sistem Bioinformatiku schitayut oblastyu vnutri vychislitelnoj biologii kotoraya glavnym obrazom sfokusirovana na statisticheskoj obrabotke biologicheskih dannyh Razlichiya v podhode s raznyh storon bioinformatiki eto biologi specializiruyushiesya na ispolzovanii vychislitelnyh sistem i instrumentov dlya resheniya biologicheskih zadach a vychislitelnye biologi eto specialisty po kompyuternym naukam matematiki statistiki i inzhenery razrabatyvayushie instrumenty dlya takih raschyotov Bioinformatika v shirokom smysle podrazumevaet rabotu s lyubymi vidami biologicheskih dannyh vklyuchaya issledovanie elektronnyh mikrofotografij poisk klyuchevyh slov v biologicheskoj literature i tak dalee Esli rassmatrivat bioinformatiku kak nabor podhodov i metodov dlya raboty s dannymi to v zavisimosti ot tipov tehnicheskih zadach ona vklyuchaet v sebya Razrabotku algoritmov i programm dlya bolee effektivnoj raboty s dannymi Hranenie i peredachu informacii ili rabotu s bazami dannyh Odnako bioinformaticheskie metody analiza takzhe nerazryvno svyazany so mnogimi nauchnymi oblastyami kotorye podrazumevaet poisk otvetov na konkretnye biologicheskie voprosy V takom sluchae osnovnye napravleniya mozhno vydelit na osnovanii issleduemyh obektov Bioinformatika posledovatelnostej Analiz ekspressij Strukturnaya bioinformatika Izuchenie kletochnoj organizacii Sistemnaya biologiya Dlya kazhdogo iz perechislennyh razdelov mozhno vydelit svoi standartnye tipy dannyh sposoby ih obrabotki bioinformaticheskie algoritmy i bazy dannyh V bioinformatike ispolzuyutsya metody prikladnoj matematiki statistiki i informatiki Bioinformatika ispolzuetsya v biohimii biofizike ekologii i v drugih oblastyah Naibolee chasto ispolzuemymi instrumentami i tehnologiyami v etoj oblasti yavlyayutsya yazyki programmirovaniya Python R Java C C yazyk razmetki XML yazyk strukturirovannyh zaprosov k bazam dannyh SQL programmno apparatnaya arhitektura parallelnyh vychislenij CUDA paket prikladnyh programm dlya resheniya zadach tehnicheskih vychislenij i odnoimyonnyj yazyk programmirovaniya ispolzuemyj v etom pakete MATLAB i elektronnye tablicy VvedenieBioinformatika stala vazhnoj chastyu mnogih oblastej biologii Bioinformaticheskie metody analiza dayut vozmozhnost interpretirovat bolshie obemy eksperimentalnyh dannyh chto do razvitiya etoj oblasti bylo prakticheski nevozmozhno Naprimer eksperimentalnoj molekulyarnoj biologii chasto ispolzuyutsya takie metody bioinformatiki kak obrabotka izobrazhenij i signalov V oblasti genetiki i genomiki bioinformatika pomogaet v funkcionalnoj annotacii genomov detekcii i analize mutacij Vazhnoj zadachej yavlyaetsya izuchenie ekspressii genov i sposobov eyo regulyacii Krome togo instrumenty bioinformatiki pozvolyayut sravnivat genomnye dannye chto yavlyaetsya neobhodimym usloviem dlya izucheniya principov molekulyarnoj evolyucii V obshem vide bioinformatika pomogaet analizirovat i katalogizirovat biohimicheskie puti i seti kotorye yavlyayutsya vazhnoj chastyu sistemnoj biologii V strukturnoj biologii ona pomogaet v modelirovanii DNK RNK i belkovyh struktur a takzhe molekulyarnyh vzaimodejstvij Poslednie uspehi v obrabotke biologicheskih dannyh priveli k znachitelnym izmeneniyam v oblasti biomediciny Blagodarya razvitiyu bioinformatiki u uchenyh poyavilas vozmozhnost identificirovat molekulyarnye mehanizmy lezhashie v osnove kak nasledstvennyh tak i priobretennyh zabolevanij chto pomogaet v razrabotke effektivnyh sposobov lecheniya i bolee tochnyh testov dlya diagnostiki zabolevanij Napravlenie issledovanij kotoroe pozvolyaet predskazyvat effektivnost i neblagopriyatnye effekty dejstviya lekarstvennyh sredstv u pacientov poluchilo nazvanie farmakogenetika i v ego osnove takzhe lezhat bioinformaticheskie metody Vazhnaya rol bioinformatiki takzhe zaklyuchaetsya v analize biologicheskoj literatury i razvitii biologicheskih i geneticheskih ontologij po organizacii biologicheskih dannyh Istoriya Opirayas na priznanie vazhnoj roli peredachi hraneniya i obrabotki informacii v biologicheskih sistemah v 1970 godu Polina Hogeveg vvela termin bioinformatika opredeliv ego kak izuchenie informacionnyh processov v bioticheskih sistemah Eto opredelenie provodit parallel bioinformatiki s biofizikoj uchenie o fizicheskih processah v biologicheskih sistemah ili s biohimiej uchenie o himicheskih processah v biologicheskih sistemah Posledovatelnosti Istoriyu bioinformatiki posledovatelnostej mozhno otschityvat ot dostizhenij 1950 h godov V fevrale 1953 goda Uotson i Krik predlozhili model molekuly DNK a v mae 1953 goda opublikovali statyu v zhurnale Nature v kotoroj razbiralsya vopros o DNK kak o nositele koda geneticheskoj informacii Krome togo v konce 1950 h Senger opublikoval pervuyu posledovatelnost belka insulina Naibolee ispolzuemym metodom sekvenirovaniya aminokislotnyh posledovatelnostej stala degradaciya Edmana osnovnym nedostatkom kotoroj byla slozhnost v poluchenii dlinnyh belkovyh posledovatelnostej teoreticheskij maksimum sostavlyal 50 60 aminokislot za odnu reakciyu Iz za etogo belki nuzhno bylo snachala rassheplyat na melkie fragmenty a zatem sobirat posledovatelnosti belka iz soten korotkih cepej chto ne vsegda udavalos sdelat pravilno Reshenie etoj problemy predlozhila Margaret Dejhoff 1925 1983 amerikanskaya uchyonaya fizicheskij himik Dejhoff aktivno ispolzovala v svoej rabote kompyuternye metody i uvidela potencial v ih primenenii v oblasti biologii i mediciny V 1962 godu ona zavershila razrabotku COMPROTEIN instrumenta dlya opredeleniya pervichnoj struktury belka s ispolzovaniem dannyh sekvenirovaniya peptidov po metodu Edmana V COMPROTEIN vvod i vyvod aminokislotnoj posledovatelnosti byl predstavlen v trehbukvennyh sokrasheniyah Chtoby uprostit obrabotku dannyh o posledovatelnostyah belkov Dejhoff pozzhe razrabotala odnobukvennyj aminokislotnyj kod kotoryj ispolzuetsya do sih por Vklad Dejhoff v etu oblast nastolko znachitelen chto Devid Dzh Lipman byvshij direktor Nacionalnogo centra biotehnologicheskoj informacii NCBI nazyval ee mat i otec bioinformatiki S nakopleniem novyh posledovatelnostej belkov v nih stali proslezhivatsya nekotorye zakonomernosti Tak Cukerkandl i Poling otmetili chto ortologichnye belki pozvonochnyh naprimer gemoglobin demonstriruyut slishkom vysokuyu stepen shodstva posledovatelnostej chtoby byt rezultatom konvergentnoj evolyucii Dlya podtverzhdeniya novyh evolyucionnyh gipotez byli neobhodimy novye matematicheskie i kompyuternye metody Pervyj algoritm dinamicheskogo programmirovaniya dlya parnyh vyravnivanij belkovyh posledovatelnostej byl razrabotan v 1970 godu Nidlmanom i Vunshem Algoritmy mnozhestvennogo vyravnivaniya posledovatelnostej poyavilis znachitelno pozzhe pervyj prakticheski primenimyj algoritm byl razrabotan Da Fej Fen i Rasselom F Dulitlom v 1987 godu Ego uproshenie algoritm CLUSTAL ispolzuetsya do sih por Krome togo v 1978 godu gruppa uchenyh v kotoruyu vhodila Dejhoff sozdala pervuyu model zamen osnovannuyu na nablyudenii tochechnyh prinyatyh mutacij PAMs v filogeneticheskih derevyah 71 semejstva belkov imeyushih bolee 85 identichnosti V rezultate byla poluchena matrica soderzhashaya znacheniya veroyatnosti zamen aminokislot Centralnaya dogma molekulyarnoj biologii kotoraya byla opublikovana Frensisom Krikom v 1970 godu a takzhe postepennoe opredelenie vseh aminokislot kodiruemyh 68 kodonami priveli k postepennoj smene paradigmy ot belkovoj evolyucii k evolyucii DNK v 1970 1980 godah Poyavilas neobhodimost nauchitsya chitat posledovatelnosti DNK Pervym metodom sekvenirovaniya DNK poluchivshim shirokoe rasprostranenie stal metod sekvenirovaniya Maksama Gilberta v 1976 godu Odnako naibolshee rasprostranenie poluchil metod razrabotannyj v laboratorii Frederika Sengera v 1977 godu on ispolzuetsya do sih por Sekvenirovanie po Sengeru pozvolilo poluchat dovolno bolshie dlya togo vremeni obyomy informacii no razmer fragmentov kotorye poluchalos sekvenirovat byl ogranichen sotnyami nukleotidov chego hvatalo tolko dlya izucheniya takih nebolshih genomov kak genomy bakteriofagov Pervoe programmnoe obespechenie prednaznachennoe dlya analiza posledovatelnostej poluchennyj v rezultate sekvenirovaniya po Sengeru bylo opublikovano Rodzherom Stadenom v 1979 godu Etot paket kompyuternyh programm pozvolil ne tolko dlya sborki posledovatelnosej v kontigi no i dlya proverki i redaktirovaniya etih posledovatelnostej a takzhe dlya annotacii Genomy S publikacii genoma cheloveka v nachale XXI veka nachalas genomnaya era bioinformatiki Proekt byl iniciirovan v 1991 godu v SShA i oboshyolsya v 2 7 milliarda dollarov zanyav bolee 13 let V 1998 godu Celera Genomics proizvela konkuriruyushee chastnoe issledovanie po sekvenirovaniyu i sborke chelovecheskogo genoma Issledovanie potrebovalo v 10 raz menshe deneg i katalizirovalo razrabotku novyh eksperimentalnyh strategij sekvenirovaniya takih kak 454 i Illumina Stoimost sekvenirovaniya DNK upala na neskolko poryadkov chto privelo k kolossalnomu uvelicheniyu kolichestva posledovatelnostej v publichnyh bazah dannyh Voznikla potrebnost v razrabotke sposobov hraneniya i bystroj obrabotke biologicheskih dannyh V 2005 godu byl sozdan Konsorcium genomnyh standartov i mandat opredelivshij minimalnuyu informaciyu neobhodimuyu dlya publikacii genomnoj posledovatelnosti Celyu razvitiya tehnologij izucheniya genoma yavlyaetsya udeshevlenie stoimosti rasshifrovki odnogo genoma predpolozhitelno do 100 chto sushestvenno sokratit zatraty i pomozhet vnedreniyu etih procedur v povsednevnuyu zhizn Celi Glavnaya cel bioinformatiki sposobstvovat ponimaniyu biologicheskih processov Otlichie bioinformatiki ot drugih podhodov sostoit v tom chto ona fokusiruetsya na sozdanii i primenenii intensivnyh vychislitelnyh metodov dlya dostizheniya etoj celi Primery podobnyh metodov raspoznavanie obrazov data mining algoritmy mashinnogo obucheniya i Osnovnye usiliya issledovatelej napravleny na reshenie zadach vyravnivaniya posledovatelnostej nahozhdeniya genov poisk regiona DNK kodiruyushego geny rasshifrovki genoma konstruirovaniya lekarstv razrabotki lekarstv vyravnivaniya struktury belka predskazaniya struktury belka predskazaniya ekspressii genov i vzaimodejstvij belok belok polnogenomnogo poiska associacij i modelirovaniya evolyucii Bioinformatika segodnya podrazumevaet sozdanie i sovershenstvovanie baz dannyh algoritmov vychislitelnyh i statisticheskih metodov i teorii dlya resheniya prakticheskih i teoreticheskih problem voznikayushih pri upravlenii i analize biologicheskih dannyh Osnovnye oblasti issledovanijAnaliz geneticheskih posledovatelnostej Sravnitelnyj analiz posledovatelnotej aminokislot oboznachennyh odnoj bukvoj Cvet bukvy zavisit ot himicheskih svojstv aminokisloty polyarnye i t p C teh por kak v 1977 godu byl sekvenirovan fag angl posledovatelnosti DNK vsyo bolshego chisla organizmov byli deshifrovany i sohraneny v bazah dannyh Eti dannye ispolzuyutsya dlya opredeleniya posledovatelnostej belkov i regulyatornyh uchastkov Sravnenie genov v ramkah odnogo ili raznyh vidov mozhet prodemonstrirovat shodstvo funkcij belkov ili otnosheniya mezhdu vidami takim obrazom mogut byt sostavleny Filogeneticheskie derevya S vozrastaniem kolichestva dannyh uzhe davno stalo nevozmozhnym vruchnuyu analizirovat posledovatelnosti V nashi dni dlya poiska po genomam tysyach organizmov sostoyashih iz milliardov par nukleotidov ispolzuyutsya kompyuternye programmy Programmy mogut odnoznachno sopostavit vyrovnyat pohozhie posledovatelnosti DNK v genomah raznyh vidov chasto takie posledovatelnosti nesut shodnye funkcii a razlichiya voznikayut v rezultate melkih mutacij takih kak zameny otdelnyh nukleotidov vstavki nukleotidov i ih vypadeniya delecii Odin iz variantov takogo vyravnivaniya primenyaetsya pri samom processe sekvenirovaniya Tak nazyvaemaya tehnika drobnogo sekvenirovaniya kotoraya byla naprimer ispolzovana angl dlya sekvenirovaniya pervogo bakterialnogo genoma Haemophilus influenzae vmesto polnoj posledovatelnosti nukleotidov dayot posledovatelnosti korotkih fragmentov DNK kazhdyj dlinoj okolo 600 800 nukleotidov Koncy fragmentov nakladyvayutsya drug na druga i sovmeshyonnye dolzhnym obrazom dayut polnyj genom Takoj metod bystro dayot rezultaty sekvenirovaniya no sborka fragmentov mozhet byt dovolno slozhnoj zadachej dlya bolshih genomov V proekte po rasshifrovke genoma cheloveka sborka zanyala neskolko mesyacev kompyuternogo vremeni Sejchas etot metod primenyaetsya dlya prakticheski vseh genomov i algoritmy sborki genomov yavlyayutsya odnoj iz ostrejshih problem bioinformatiki na segodnyashnij moment Drugim primerom primeneniya kompyuternogo analiza posledovatelnostej yavlyaetsya avtomaticheskij poisk genov i regulyatornyh posledovatelnostej v genome Ne vse nukleotidy v genome ispolzuyutsya dlya zadaniya posledovatelnostej belkov Naprimer v genomah vysshih organizmov bolshie segmenty DNK yavno ne kodiruyut belki i ih funkcionalnaya rol neizvestna Razrabotka algoritmov vyyavleniya kodiruyushih belki uchastkov genoma yavlyaetsya vazhnoj zadachej sovremennoj bioinformatiki Bioinformatika pomogaet svyazat genomnye i proteomnye proekty k primeru pomogaya v ispolzovanii posledovatelnosti DNK dlya identifikacii belkov Annotaciya genomov V kontekste genomiki annotaciya process markirovki genov i drugih obektov v posledovatelnosti DNK Pervaya programmnaya sistema annotacii genomov byla sozdana v 1995 godu angl rabotavshim v komande Instituta Genomnyh Issledovanij angl The Institute for Genomic Research sekvenirovavshej i proanalizirovavshej pervyj dekodirovannyj genom svobodnozhivushego organizma bakterii Haemophilus influenzae Doktor Uajt postroil sistemu dlya nahozhdeniya genov uchastok DNK zadayushij posledovatelnost opredelyonnogo polipeptida libo funkcionalnoj RNK tRNK i drugih obektov DNK i sdelal pervye oboznacheniya funkcij etih genov Bolshinstvo sovremennyh sistem annotacii genoma rabotayut shodnym obrazom no takie programmy dostupnye dlya analiza genomnoj DNK kak angl ispolzuyutsya dlya nahozhdeniya genov kodiruyushih belok v Haemophilus influenzae postoyanno menyayutsya i sovershenstvuyutsya Vychislitelnaya evolyucionnaya biologiya Evolyucionnaya biologiya issleduet proishozhdenie i poyavlenie vidov takzhe kak ih razvitie s techeniem vremeni Informatika pomogaet evolyucionnym biologam v neskolkih aspektah izuchat evolyuciyu bolshogo chisla organizmov izmeryaya izmeneniya v ih DNK a ne tolko v stroenii ili fiziologii sravnivat celye genomy sm BLAST chto pozvolyaet izuchat bolee kompleksnye evolyucionnye sobytiya takie kak duplikaciya genov gorizontalnyj perenos genov i predskazyvat bakterialnye specializiruyushie faktory stroit kompyuternye modeli populyacij chtoby predskazat povedenie sistemy vo vremeni otslezhivat poyavlenie publikacij soderzhashih informaciyu o bolshom kolichestve vidov Oblast v kompyuternyh naukah kotoraya ispolzuet geneticheskie algoritmy chasto putayut s no dve eti oblasti ne obyazatelno svyazany Rabota v etoj oblasti ispolzuet specializirovannoe programmnoe obespechenie dlya uluchsheniya algoritmov i vychislenij i osnovyvaetsya na takih kak replikaciya diversifikaciya cherez rekombinaciyu ili mutacii i vyzhivanii v estestvennom otbore Ocenka biologicheskogo raznoobraziya Biologicheskoe raznoobrazie ekosistemy mozhet byt opredeleno kak polnaya geneticheskaya sovokupnost opredelyonnoj sredy sostoyashaya iz vseh obitayushih vidov i pust eto bioplyonka v zabroshennoj shahte kaplya morskoj vody gorst zemli ili vsya biosfera planety Zemlya Dlya sbora vidovyh imyon opisanij oblasti rasprostraneniya geneticheskoj informacii ispolzuyutsya bazy dannyh Specializirovannoe programmnoe obespechenie primenyaetsya dlya poiska vizualizacii i analiza informacii i chto bolee vazhno predostavleniya eyo drugim lyudyam Kompyuternye simulyatory modeliruyut takie veshi kak populyacionnaya dinamika ili vychislyayut obshee geneticheskoe zdorove kultury v agronomii Odin iz vazhnejshih potencialov etoj oblasti zaklyuchaetsya v analize posledovatelnostej DNK ili polnyh genomov celyh vymirayushih vidov pozvolyaya zapomnit rezultaty geneticheskogo eksperimenta prirody v kompyutere i vozmozhno ispolzovat vnov v budushem dazhe esli eti vidy polnostyu vymrut Chasto iz oblasti rassmotreniya bioinformatiki vypadayut metody ocenki drugih komponentov bioraznoobraziya taksonov v pervuyu ochered vidov i ekosistem V nastoyashee vremya matematicheskie osnovaniya bioinformacionnyh metodov dlya taksonov predstavleny v ramkah takogo nauchnogo napravleniya kak fenetika ili chislennaya taksonomiya Metody analiza struktury ekosistem rassmatrivayutsya specialistami takih napravlenij kak sistemnaya ekologiya biocenometriya Osnovnye bioinformaticheskie programmy ACT Artemis Comparison Tool genomnyj analiz Arlequin analiz populyacionno geneticheskih dannyh Bioconductor masshtabnyj FLOSS proekt predostavlyayushij mnozhestvo otdelnyh paketov dlya bioinformaticheskih issledovanij Napisan na R BioEdit redaktor mnozhestvennogo vyravnivaniya nukleotidnyh i aminokislotnyh posledovatelnostej BioNumerics kommercheskij universalnyj paket programm BLAST poisk rodstvennyh posledovatelnostej v baze dannyh nukleotidnyh i aminokislotnyh posledovatelnostej Clustal mnozhestvennoe vyravnivanie nukleotidnyh i aminokislotnyh posledovatelnostej DnaSP analiz polimorfizma posledovatelnostej DNK FigTree redaktor filogeneticheskih derevev Genepop populyacionno geneticheskij analiz Genetix populyacionno geneticheskij analiz programma dostupna tolko na francuzskom yazyke JalView redaktor mnozhestvennogo vyravnivaniya nukleotidnyh i aminokislotnyh posledovatelnostej MacClade kommercheskaya programma dlya interaktivnogo evolyucionnogo analiza dannyh MEGA molekulyarno evolyucionnyj geneticheskij analiz Mesquite programma dlya sravnitelnoj biologii na yazyke Java Muscle mnozhestvennoe sravnenie nukleotidnyh i aminokislotnyh posledovatelnostej Bolee bystraya i tochnaya po sravneniyu s ClustalW PAUP filogeneticheskij analiz s ispolzovaniem metoda parsimonii i drugih metodov PHYLIP paket filogeneticheskih programm Phylo win filogeneticheskij analiz Programma imeet graficheskij interfejs PopGene analiz geneticheskogo raznoobraziya populyacij Populations populyacionno geneticheskij analiz PSI Protein Classifier obobshenie rezultatov poluchennyh s pomoshyu programmy PSI BLAST Seaview filogeneticheskij analiz s graficheskim interfejsom deponirovanie posledovatelnostej v GenBank EMBL DDBJ SPAdes sborshik bakterialnyh genomov SplitsTree programma dlya postroeniya filogeneticheskih derevev T Coffee mnozhestvennoe progressivnoe vyravnivanie nukleotidnyh i aminokislotnyh posledovatelnostej Bolee chuvstvitelnoe chem v ClustalW ClustalX UGENE svobodnyj russkoyazychnyj instrument mnozhestvennoe vyravnivanie nukleotidnyh i aminokislotnyh posledovatelnostej filogeneticheskij analiz annotirovanie rabota s bazami dannyh Velvet sborshik genomov ZENBU obobshenie rezultatovStrukturnaya bioinformatikaK strukturnoj bioinformatike otnositsya razrabotka algoritmov i programm dlya predskazaniya prostranstvennoj struktury belkov Temy issledovanij v strukturnoj bioinformatike Rentgenostrukturnyj analiz RSA makromolekul Indikatory kachestva modeli makromolekuly postroennoj po dannym RSA Algoritmy vychisleniya poverhnosti makromolekuly Algoritmy nahozhdeniya gidrofobnogo yadra molekuly belka Algoritmy nahozhdeniya strukturnyh domenov belkov Prostranstvennoe vyravnivanie struktur belkov Strukturnye klassifikacii domenov SCOP i CATH Molekulyarnaya dinamikaSm takzheVychislitelnaya biologiya Matematicheskaya biologiya Hemoinformatika Mezhdunarodnoe Obshestvo Vychislitelnoj Biologii Gennaya ontologiya Pangenom Spisok nauchnyh zhurnalov po bioinformatike angl Kognitivnaya genomikaPrimechaniyaCan T Introduction to bioinformatics miRNomics MicroRNA Biology and Computational Analysis angl Editors Malik Yousef and Jens Allmer Totowa NJ Humana Press 2014 P 51 71 325 p Methods in Molecular Biology vol 1107 ISBN 978 1 62703 748 8 ISBN 978 1 62703 747 1 doi 10 1007 978 1 62703 748 8 4 Nair A S Computational biology amp bioinformatics a gentle overview angl arh 26 marta 2022 Communications of the Computer Society of India zhurn 2007 Vol 2 January Kunin E Sup iz gvozdya Vedushij evolyucionist rasskazal o Multivselennoj i antropnom principe arh 9 avgusta 2014 Lenta ru 2012 1 dekabrya Gelfand M S Bioinformatika kak disciplina Bioinformatik Mihail Gelfand o sistemnoj biologii predskazanii funkcij belkov i processah evolyucii arh 3 avgusta 2020 Postnauka 2015 28 fevralya Manisekhar S R Siddesh G M Manvi S S Introduction to Bioinformatics Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques Tools and Applications Springer Singapore 2020 S 3 9 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 3 iyunya 2022 goda Hogeweg P The roots of bioinformatics in theoretical biology angl Public Library of Science for Computational Biology 2011 Vol 7 no 3 P e1002021 doi 10 1371 journal pcbi 1002021 PMID 21483479 ispravit Hesper B Hogeweg P Bioinformatica een werkconcept neopr Kameleon 1970 T 1 6 S 28 29 Watson J D Crick F H Genetical implications of the structure of deoxyribonucleic acid Nature journal 1953 May vol 171 no 4361 P 964 967 doi 10 1038 171964b0 Bibcode 1953Natur 171 964W PMID 13063483 Sanger F Thompson E O P The amino acid sequence in the glycyl chain of insulin 1 The identification of lower peptides from partial hydrolysates Biochemical Journal 1953 T 53 3 S 353 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 3 iyunya 2022 goda Sanger F Thompson E O P The amino acid sequence in the glycyl chain of insulin 2 The investigation of peptides from enzymic hydrolysates Biochemical Journal 1953 T 53 3 S 366 Dayhoff M O Ledley R S uter program to aid primary protein structure determination Proceedings of the December 4 6 1962 fall joint computer conference 1962 S 262 274 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 26 iyunya 2020 goda Moody G Digital code of life how bioinformatics is revolutionizing science medicine and business John Wiley amp Sons 2004 Gauthier J et al A brief history of bioinformatics Briefings in bioinformatics 2019 T 20 6 S 1981 1996 Needleman SB Wunsch CD A general method applicable to the search for similarities in the amino acid sequence of two proteins J Mol Biol 1970 48 443 53 Feng D F Doolittle R F Progressive sequence alignment as a prerequisitetto correct phylogenetic trees Journal of molecular evolution 1987 T 25 4 S 351 360 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 24 fevralya 2021 goda Dayhoff M Schwartz R Orcutt B 22 a model of evolutionary change in proteins Atlas of protein sequence and structure MD National Biomedical Research Foundation Silver Spring 1978 T 5 S 345 352 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 16 avgusta 2021 goda Maxam A M Gilbert W A new method for sequencing DNA Proceedings of the National Academy of Sciences 1977 T 74 2 S 560 564 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 16 sentyabrya 2018 goda Staden R A strategy of DNA sequencing employing computer programs Nucleic acids research 1979 T 6 7 S 2601 2610 neopr Data obrasheniya 24 aprelya 2020 Arhivirovano 2 maya 2019 goda NHGRI Human Genome Project Completion Frequently Asked Questions National Human Genome Research Institute NHGRI https www genome gov 11006943 Arhivnaya kopiya ot 16 aprelya 2019 na Wayback Machine Human Genome Project Completion Frequently Field D Sterk P Kottmann R et al Genomic standards consortium projects Stand Genomic Sci 2014 9 599 601 Robert Ghrist Homological Algebra and Data LiteraturaJonathan Pevsner 2013 Bioinformatics and Functional Genomics Jean Michel Claverie Ph D 2007 Bioinformatics For Dummies 2nd edition Durbin R Eddi Sh Krog A Mitchison G Analiz biologicheskih posledovatelnostej M Izhevsk NIC Regulyarnaya i haotichnaya dinamika 2006 480 s ISBN 5 93972 559 7 Borodovskij M Ekisheva S Zadachi i resheniya po analizu biologicheskih posledovatelnostej M Izhevsk NIC Regulyarnaya i haotichnaya dinamika 2008 420 s ISBN 978 5 93972 644 3 Setubal Zh Mejdanis Zh Vvedenie v vychislitelnuyu molekulyarnuyu biologiyu M Izhevsk NIC Regulyarnaya i haotichnaya dinamika 2007 420 s ISBN 978 5 93972 623 8 V A Talanov Matematicheskie modeli sinteza peptidnyh cepej i metody teorii grafov v rasshifrovke geneticheskieh tekstovSsylkiBioinformatika Rubrika Nauka neopr TASS Chitat vse poslednie novosti na temu Data obrasheniya 7 avgusta 2023