Геномный «тетрис» и анализ движения лабораторных мух: проекты первого хакатона по биоинформатике BioHack

Четверг 09 Марта

Первый хакатон по биоинформатике в Петербурге был организован международной IT-компанией ЕРАМ совместно с Институтом биоинформатики. Партнером мероприятия стал Университет ИТМО, на площадке которого и собрались 100 лучших участников, прошедших конкурсный отбор. На протяжении двух суток им предстояло решить по одной прикладной задаче от ведущих научных центров, лабораторий и независимых институтов, работающих в области биоинформатики и смежных сферах. Попробовать свои силы участники смогли в заданиях от МФТИ, компании iBINOM, Института биоинформатики, Медико-генетического научного центра, компании Genotek, Института белка РАН и других организаций.

Как отмечает специалист по маркетингу компании EPAM, руководитель проекта BioHack Анастасия Макарова, около 70% участников представляли петербургские вузы (Университет ИТМО, Институт биоинформатики, Политех, СПбГУ и другие), около 10% — вузы Москвы (МФТИ, МГУ и другие), а остальные — региональные учебные заведения России. 100 участников, прошедших конкурсный отбор, сформировались в 24 команды по 3−5 человек. Главное условие организаторов: в каждой команде должны были быть как биологи, так и программисты.

«Я часто спрашиваю себя: что мы делаем для развития связей внутри нашего профессионального сообщества и как мы стимулируем развитие отрасли. И я убеждена, что именно такой формат, как хакатон, может этому способствовать. BioHack объединил талантливых, инициативных и амбициозных профессионалов и энтузиастов в области биоинформатики. Говоря о командной работе, нам было важно объединить биологов и программистов, поскольку именно совместно, в общем рабочем процессе мы можем достигнуть хороших результатов по проектам», — отмечает Анастасия Макарова.

Проекты: «тетрис» с геномами и ридами, поиск бактериофагов и экспресс-анализ 70 000 научных статей

Выбирать проекты каждый из участников мог по своему вкусу и компетенциям — для этого им изначально предлагалось ранжировать интересные задачи по пятибалльной шкале. В команде, в которую попала студентка кафедры компьютерных технологий Университета ИТМО Дарья Зенкова, оказалось три биолога, включая куратора, и три программиста. Привыкать друг к другу долго не пришлось — участники изначально пришли на хакатон единым составом. В качестве задачи Дарья выбрала проект от СПбГУ «Предскажи их всех!». Его прикладное значение — снизить стоимость на эксперименты, которые сейчас очень дороги. Например, сегодня в России хороший RNA-seq эксперимент будет стоить более миллиона рублей, и можно пересчитать по пальцам учреждения, которые могут себе это позволить, рассказывает руководитель проекта Николай Панюшев.

«Зачем их необходимо проводить? В США и Европе такие эксперименты делают, например, для диагностики сложных синдромов, когда есть какие-то смешанные заболевания и нужно определить, чем именно человек болен. Это в большей степени касается диагностики онкологии и наследственных заболеваний. Поэтому с помощью наших наработок хочется научиться с высокой степенью точности предсказывать результаты заранее, чтобы сразу знать, куда смотреть и стоит ли вообще смотреть», — отмечает он.

«Почему мы выбрали этот проект? Потому что он очень творческий: не сразу понятно, что необходимо делать. Кроме того, проект интересен потому, что здесь используется машинное обучение, — добавляет Дарья Зенкова. — Сложность была в небольшом количестве данных, потому что эксперименты делать дорого. К сожалению, пока не получилось рассмотреть весь спектр взаимодействий. Но мы убедились, что действительно нужно больше данных, нужны дополнительные взаимодействия по физическому расположению ДНК в ядре. Так что проект имеет все шансы быть продолженным и дать какие-либо результаты».

В будущем, уже за рамками хакатона, команда планирует создать рабочий алгоритм, который, возможно, научится с высокой степенью точности предсказывать необходимый результат. Впоследствии его необходимо будет подтвердить в лаборатории. Если все сложится успешно, участники займутся разработкой специализированного сервиса для ученых, которым смогут пользоваться не только программисты, но и специалисты с биологическим образованием.

Анализом данных, касающихся болезни Альцгеймера, занималась команда проекта «What's the buzz about, или что можно узнать о заболевании, вооружившись pubmed и словарем» от Института белка РАН, участником которой стал студент кафедры компьютерных технологий Университета ИТМО Максим Аверин. В ходе работы ребята проанализировали около 70 тысяч научных статей по теме, чтобы наглядно показать, как в течение последних десятилетий менялись подходы к изучению этого заболевания.

«Один из интересных трендов, которые удалось выявить: на одном из этапов среди исследователей бытовало мнение, что болезнь Альцгеймера может быть вызвана большим содержанием алюминия в организме. Но, как только алюминиевая посуда вышла из употребления, в публикациях такие идеи появляться перестали, — рассказывает Максим Аверин. — В целом, проект был очень полезен с технической точки зрения, хотя, если честно, было бы очень сложно разобраться без биолога. Для меня это стало интересным опытом того, как приложить свои знания по программированию к реальной биоинформатической задаче».

Команда пока не успела «обернуть» свои наработки в удобный интерфейс, однако, возможно, займется этим вне хакатона. В перспективе, как отмечают участники, полученные результаты могут стать основой для удобного аналитического сервиса для исследователей.

Среди других проектов, представленных участниками, были и такие, результаты которых смогут оценить не только ученые, но и те, кто только начал постигать азы биоинформатики. Например, студентка Института биоинформатики предложила создать мобильное приложение, которое будет знакомить пользователей c такими понятиями, как комплементарность нуклеотидов, выравнивание последовательностей и сборка генома. На первый взгляд, игра выглядит как обычный тетрис, только снизу вместо привычных фигур расположен геном, а сверху падает рид (короткая нуклеотидная последовательность — прим.ред.). Главная цель — совместить блоки так, чтобы добиться как можно лучшего выравнивания.

Итоги BioHack 2017

Призерами соревнований стали команды проектов «Исследование связанных состояний молекул воды в интерфейсах биомакромолекул» и «Горизонтальный перенос генов бактериофагами в метагеномах» (в этом проекте приняла участие студентка Университета ИТМО Людмила Корнилова). За третье и второе места участники получили 50 и 70 тысяч рублей соответственно. А первое место жюри присудило команде проекта «Анализ демографической истории по геномным данным», получившей главный приз — 100 тысяч рублей.

b=04,center

Как отмечает вошедший в состав жюри хакатона сотрудник международной лаборатории «Компьютерные технологии» Университета ИТМО Владимир Ульянцев, несмотря на то, что участники представили совершенно разные проекты, жюри подходило к анализу полученных результатов максимально объективно.

«Ни один член жюри не был доволен на 100%, и при этом никто не был полностью „загнан“ остальными участниками. Все прошло очень объективно и дисциплинированно, — отметил он по итогам мероприятия. — Что касается научной работы, хотелось бы отметить, что у ребят нет сложностей с программированием, нет проблем с биологическими аспектами, однако пока есть некоторые сложности с общим проектным подходом. Кроме того, и это немаловажная часть мероприятий такого формата, надо запомниться и, даже если вы сделали что-то гениальное, нужно понимать, что надо уметь это доносить до членов жюри. На этот аспект в будущем тоже необходимо обращать внимание».

Владимир Ульянцев уверен, что в ближайшие годы с ростом профессионального сообщества интерес к биоинформатике в Петербурге будет расти. А это значит, что в городе будет появляться все больше научных мероприятий разного формата.

 

«Мне кажется, что это только начало популяризации биоинформатики. Развитию этой области способствует само состояние среды: у нас развивается Институт биоинформатики, в том числе развивается лаборатория в Университете ИТМО, у нас есть мысли открыть магистратуру по биоинформатике в будущем. Поэтому растет число людей, кто хотел бы этим заниматься, а с ростом профессионального сообщества будет расти и количество мероприятий: и хакатоны, и конференции, и, вполне возможно, разного рода стендап-выступления», — говорит он.

Как подчеркивает специалист по маркетингу компании EPAM, руководитель проекта BioHack Анастасия Макарова, первый хакатон по биоинформатике в Петербурге уже показал себя как успешный проект, поэтому в будущем мероприятие планируется проводить на ежегодной основе. Не исключено, что уже в следующем году состав участников будет существенно расширен.