Подводная лодка информатики в степях биологии

Биоинформатика стремительно набирает популярность и превращается из убежища для гиков в широко известную устоявшуюся дисциплину. Думаю, большинство читателей Geektimes с уверенностью могут сказать, что кролик — это не только ценный мех и 3-4 килограмма диетического мяса, но и 44 хромосомы, множество разнообразных белков, механизмов транскрипции и трансляции и чего только не. Также я вряд ли кого-нибудь удивлю, если скажу, что все это можно изучать и анализировать не только стоя в белом халате у микроскопа в стерильной лаборатории, но и лежа на диване с ноутбуком, попивая что-то шотландское со льдом. Однако, дальше этого познания обычно не заходят. Я решил-таки попытаться исправить это досадное недоразумение и сделать короткую экскурсию в то, как выглядит биоинформатика изнутри с практической точки зрения, исходя из своего опыта.

В этой статье я соберу вопросы, которые сам же задавал три года назад, в бытность еще студентом математического факультета, и постараюсь на них ответить.



Зачем нужна биоинформатика?


Задача биоинформатики, неформально говоря, — находить логику в биологических данных. Данные эти получают в ходе экспериментов, и если для биолога данные могут выглядеть как светящаяся рыбка или красивое разноцветное пятно на фотографии, то для биоинформатика данные представлены как:

  • строки (последовательности символов, описывающих ДНК/РНК/белки);
  • трехмерные и двумерные координаты (данные микроскопии);
  • массивы вещественных чисел (например, каждое число может быть экспериментально измеренной массой белка или его части);
  • вектора из целых неотрицательных чисел (например, глубина покрытия дискретными объектами, так называемыми ридами);
  • матрицы из нолей и единиц (например, могут ли разные виды бактерий уживаться друг с другом);

И еще множество других возможных представлений реальных биологических явлений с помощью математических объектов.

У биологов данные интереснее?


Несомненно. Зато биоинформатикам не нужно бегать в лабораторию по выходным (клеточные культуры, например, про выходные не знают и имеют тенденцию умирать без должной заботы). Да и исследования в биологии часто длятся годами (в зависимости от свойств модельных организмов), в то время как в биоинформатике прогресс зависит в основном от способности решать алгоритмические задачи и писать “шустрый” код. Ну, и возможность удаленной работы из любой точки мира тоже несомненный плюс в пользу биоинформатиков.



Сколько в биоинформатике био, а сколько — информатики?


Это очень сильно зависит от конкретного научного центра и исследовательской группы. Понимать биологию на минимальном уровне нужно — никто не будет вам разжевывать научный проект до уровня школьной задачи по математике. Вы сами должны будете смоделировать ситуацию, исходя из вашего понимания биологии. Однако, действительно глубокого понимания не ожидается, поэтому то, что вы помните только про пестики и тычинки, не будет препятствием, если вы решите заняться именно этой наукой. Необходимые основы биологии несложно выучить уже в процессе работы над биоинформатическим проектом.

Что действительно полезно и нужно будущему биоинформатику “от информатики”, так это знание биотехнологий, то есть того, каким образом получены ваши данные, какие в ходе эксперимента могли возникнуть проблемы. На мой взгляд, достаточно пробежаться галопом по какому-нибудь курсу молекулярной биологии, но потратить время и серьезно осмыслить принципы работы современных приборов, используемых для экспериментов.

Будущему биоинформатику “от биологии” в процессе обучения я бы посоветовал пропускать поначалу доказательства и описания методов и алгоритмов и изучать их как “черные ящики”, то есть в сугубо прикладном аспекте: “A на входе — B на выходе”, иначе есть риск “утонуть” в теоретических выкладках на несколько лет. Однако, пропустив теорию и научившись чему-то на практике, вам будет несложно вернуться и взглянуть на нее уже другими глазами.

А вот если я стану биоинформатиком, значит, я буду знать биоинформатику?


К сожалению, нет. Биоинформатика в нынешнем состоянии — это множество довольно объемных разделов, как и в любой другой науке. Если сравнить, например, с физикой, довольно очевидно, что специалист в теоретической механике, скорее всего, будет испытывать определенные трудности в понимании последних статей по квантовой физике, и более того — у него скорее всего не будет времени читать эти статьи.

А разделов в биоинформатике много и на любой вкус:

  • Эволюция (причем не только в виде “сначала были питекантропы”, а и менее известные вопросы, такие, как эволюция, происходящая в раковой опухоли)
  • Поиск генетических вариантов, приводящих к заболеваниям
  • Конструирование и подбор лекарств, связывающихся с определенными видами “опасных для организма” белков
  • Изучение функций генов, их аннотация
  • Структурная биоинформатика (манипуляции с 2D и 3D структурами, такими как, например, белки или РНК)
  • Сборка геномов
  • Построение карт того, каким образом вся эта мешанина из белков/РНК/ДНК/жиров/умных мыслей/занятий в спортзале/кремлевской диеты и прочего между собой реагирует (примерно как в этом видео, но еще интереснее и сложнее)
  • Моделирование сложных систем (таких, как развитие организма из зародыша)
  • Нейробиология (вернее, анализ данных, полученных нейробиологами);

и многое другое (да простят меня биоинформатики, чью область я забыл упомянуть).

Последние три пункта часто относят к системной биологии, но эти науки, что называется, “на стыке”, и перепрыгнуть туда и обратно можно с минимальными усилиями.

Есть ли смысл выбирать биоинформатику своей профессией?


Чтобы ответить на этот вопрос, распределите следующие характеристики по степени значимости для вас (присвойте ранг 6 самой важной характеристике, 1 — наименее важной), а затем суммируйте с указанным знаком.

+ Я всегда хотел быть научным работником и ощущать то, что я вношу определенный вклад в будущее человечества.
+ Меня интересуют науки о жизни, я хотел бы иметь возможность узнавать что-то новое о биологии каждый день, но моя учеба в университете не была связана с биологией — или — Я биолог, но мне надоели монотонные технические манипуляции с пипетками и я хочу больше понимать, какие именно данные я получил и уметь работать с ними.
+ Биоинформатика интересна мне как подраздел информатики, мне кажется, там много задач, надо которыми можно подумать.
— Я хочу получать большую зарплату сразу после выпуска из университета.
— Мне хотелось бы постоянно ходить в белом халате, как настоящий ученый.
— Мне нравится размышлять о задачах и читать интересные статьи о биологии, но не нравится программировать.

Если вы получите результат меньше 0, вам точно не стоит идти в биоинформатику. Вы чувствуете боль от того, насколько нестрог и не универсален этот тест, но его идея вам понятна и чем-то даже нравится? Добавьте себе +3 балла к результату.



Как выглядит карьерная лестница для биоинформатика?


“Если очень захотеть, можно в космос полететь”, однако если вы ростом 2 метра и весом 150 кг — вас вряд ли возьмут в отряд космонавтов. А что же с биоинформатиками?

Основное образование


Карьера закладывается еще с высшего образования. Бакалавриат может быть любым, но все же не гуманитарным. Экономика, физика, химия, математика, не говоря уже про компьютерные науки и биологию.

Наиболее благоприятный выбор магистратуры — либо магистратура по биоинформатике, либо “дополнение” к вашему бакалавриату, чтобы у вас было и что-то биологическое, и что-то вычислительное после этих двух ступеней. Правда, поступать в магистратуру с совершенно другим профилем — задача не из легких.

Что касается возможности получения первой ступени высшего образования (бакалавр/специалист) сразу со специализацией в биоинформатике — отношение к этому у меня неоднозначное.

Биоинформатика должна быть осознанным выбором, а сделать такой выбор после школы выглядит довольно затруднительным, но если вы уверены в том, что это — ваше призвание, то почему бы и нет. Мне же больше импонирует подход “получить общее образование и затем выбрать специализацию”, нежели сразу начать работать в узком направлении. Я не уверен в возможности легко переквалифицироваться в специалиста другого профиля после 4-6 лет обучения, но примеры успешного разбиоинформатизирования есть.

Дополнительное образование


Для шапочного знакомства с биоинформатикой уже создано немало онлайн-курсов (русскоязычный Stepic.org, англоязычные Сoursera, edX и т.п.). Среди онлайн-курсов есть очень полезные (я бы порекомендовал курс от UCSD по алгоритмам в биоинформатике и курс про эволюцию от Duke University), записывайтесь, проходите, если станет скучно или трудно — вы спокойно бросите это дело, не потратив ни чужого времени, ни своих нервов. Ведь для обучения на очной форме прилично идти мотивированным — образно говоря, в костюме-тройке, с букетом в руках и гвоздикой в петлице — чтобы биоинформатика сразу поняла, что эти отношения для вас — серьезные.

Дополнительное образование — это замечательная вещь, у которой практически одни плюсы — занятия по выходным или вечерам (не мешает основной учебе или работе), увлеченный коллектив и часто даже отсутствие платы за обучение. Но — отбор на подобные программы довольно жесткий, курсы объемные и темп быстрый. Именно поэтому, если вы пока только хотите понять, заниматься ли дальше биоинформатикой, лучше сделать это до — посмотреть онлайн-курсы, поговорить с людьми из профессии, почитать что-то научно-популярное (из того что писали люди, которых я знаю лично, — статья на Хабрахабр, статья на Geektimes, обзор “Я б в биоинформатики пошел — пусть меня научат” на Биомолекуле).



Насколько знаю, в России есть две дополнительные программы — в Институте биоинформатики (ИБ) в Питере и в столице — Московская школа биоинформатики (МШБ). На мой взгляд, они примерно равны магистратуре по уровню получаемых знаний по специальности, но вот только “редкая птица долетит до средины Днепра” — многие студенты отваливаются, посетив десяток занятий — ох, нелегкая это работа — собирать геном бегемота.

Сам я закончил Институт биоинформатики как часть магистерской программы Академического университета (СПбАУ), поэтому расскажу подробнее про ИБ (про МШБ после того, как они расстались с Яндексом, практически ничего не знаю). Программа длится год, занятия по субботам. Семинары и лекции почти все мне нравились, но замечательнейшая часть обучения — научные проекты. Научные руководители там из ведущих научных центров России и коварной заграницы. В теории проекты должны быть образовательными в первую очередь, но чаще всего это самая настоящая наука. Славное было время: бессонные ночи, полные арабских сказок “1000 и 1 скрипт” (на самом деле поначалу сказки были индусские), ожесточенные защиты проектов, и ощущение причастности к тому самому переднему краю, с которого и приходят научные статьи, переводы которых можно часто встретить на Geektimes. Да, кстати, там есть буфет. И набор туда идет сейчас. Одновременно и достоинством, и недостатком ИБ является отсутствие фундаментальных дисциплин — только биоинформатика, и ничего кроме.

Если хочется больше предметов и фундаментальной подготовки, то обладатели технических дипломов бакалавра/специалиста, могут, как и я, сразу поступить в 2-х летнюю магистратуру по алгоритмической биоинформатике. Процесс поступления стандартный: онлайн-заявки до середины лета, потом собеседование. Прием заявок на 2016/18 год уже открыт. Но биологам туда идти совсем бессмысленно.

Для полноты рассказа пришлось воспользоваться своей агентурной сетью. Накануне публикации один из разведчиков наконец-то нарушил режим радиомолчания и передал в штаб радиограмму про МШБ. Основными моментами в расшифрованном сообщении про процесс обучения в МШБ были: а) возможность получения официального диплома от Вышки; б) наличие фундаментальных дисциплин вроде матана (на мой взгляд, это издевательство, но матан полезен затем, что он ум в порядок приводит); в) научные проекты выполняются под руководством ведущих биоинформатиков Москвы; г) из-за обилия домашней работы студентам приходится сбиваться в стаи и думать над проблемами коллективно; д) студенты, тем не менее, пищат от восторга и просят еще биоинформатики. Набор в МШБ начнется в мае.

Летние школы


Еще один вид дополнительного образования. Из того, что знаю: для школьников есть Школа молекулярной и теоретической биологии (больше по биологии, но для будущего биоинформатика польза несомненна), для студентов и “начинающих” аспирантов — Летняя школа Института биоинформатики (ЛШБ), из зарубежных — Research Summer School in Statistical Omics (RSSSO). Если совсем кратко о тех школах, на которых я был — ЛШБ идеальна для короткого интенсивного введения в биоинформатику, RSSSO — для тех, кто уже понял, что такое вычислительная биология и хочет “прокачать” свою статистическую базу. На ЛШБ/RSSSO можно/нужно принять участие в интересных научных проектах, в ходе которых можно на короткий срок безболезненно почувствовать себя настоящим научным работником. Кроме того, замечательный способ весело провести время летом в отличной компании. ЛШБ проводится попеременно в Москве и Питере, RSSSO — в Хорватии, город Сплит. ШМТБ будет в Барселоне.

Карьера биоинформатика


Дальше начинается, собственно, карьера — уже после магистратуры можно устроиться на работу биоинформатиком (да, да, слышу возмущенные голоса, можно и после бакалавриата, и после школы, и после детского садика, но давайте сойдемся на том, что окончание магистратуры — наилучшая по многим параметрам точка отсчета). Это можно сделать как в России (база данных по вакансиям собрана на сайте blastim.ru), так и за рубежом. Второй вариант — идти получать степень кандидата наук или Ph.D. Найти аспирантуру (практически в любой стране — хоть в России, хоть в Коста-Рике) довольно просто при условии, что вы — хороший специалист. Оценки в дипломе играют роль, но не определяющую. Куда лучше — за рубеж или на Родине? Подвесим этот вопрос. Пожалуй, к тому моменту, как вы созреете для поступления в аспирантуру, вы уже сами для себя решите. Все равно в процессе обучения в аспирантуре вы, скорее всего, один или несколько раз будете стажироваться в другой стране в течение нескольких месяцев.

После Ph.D. есть уже 3 варианта:

Первый — понять, что жизнь — тлен, бросить науку совсем и уехать в Ямало-Ненецкий автономный округ разводить оленей. На этом варианте мы останавливаться не будем, поскольку с темой статьи он больше не связан (но я бы посоветовал остерегаться волков и не злить оленей, их рога выглядят довольно опасно).

Второй вариант — продолжать академическую карьеру, и третий — уходить в индустрию (множество компаний сейчас ищут специалистов соответствующего профиля). Академическая карьера подразумевает получение нескольких стажировок, которые называются, сокращенно, постдок. Зарплаты у постдоков в несколько раз выше, чем у аспирантов, но, как правило, меньше, чем зарплаты тех специалистов, что уходят в индустрию. Найти вакансию в индустрии после получения ученой степени Ph.D. и (по желанию) нескольких постдоков гораздо проще. Затем можно получить постоянную позицию научного сотрудника или попытаться создать собственную лабораторию и возглавить её. Дело это сложное и, честно говоря, о том, что происходит “за постдоком”, я ничего не знаю.

Вместо заключения


Я продолжу отвечать на ваши вопросы, заданные в комментариях к этой статье. Также, если к тому будет интерес, могу рассказать про то, чем занимаюсь (изучение связей между генетической и эпигенетической вариабельностью и заболеваниями), в отдельной статье.

Об авторе: специалист, мехмат МГУ, 2013; магистр (биоинформатика), МиИТ СПбАУ, 2015; в настоящий момент — аспирант в CRG, Барселона, группа “Genomic and Epigenomic Variation in Disease”.

Надеюсь, этот текст был для вас познавательным.

P.S. Перед отправкой эту статью прочитали коллеги, и заявили, что она написана излишне пессимистично. Смею уверить читателей, что, задавая эти вопросы несколько лет назад, я получал гораздо более мрачные ответы.

Метки:
Поделиться публикацией
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама
Комментарии 35
  • +12
    Главное, чтоб не так:

    «В незапамятные [времена] участвовал в конкурсах работ МАН [Малой Академии Наук]. Сам по математике, но однажды оказался зрителем на докладе в секции биологии. Работа была посвящена изумительному наблюдению, подкрепленному большим числом замеров: окружность любого муравейника примерно втрое длиннее его диаметра.»
  • +3
    Также, если к тому будет интерес, могу рассказать про то, чем занимаюсь (изучение связей между генетической и эпигенетической вариабельностью и заболеваниями), в отдельной статье.

    Свидетельствую, интерес есть.
    • 0
      Вас понял, тогда обобщу свою задачу и задачи коллег и выложу небольшую статью =)
    • 0
      Биоинформатика это раздел вычислительной биологии. Не стоит мешать биоинформатику с другими ее разделами. Бионформатика это алгоритмы обработки массивов данных (днк/рнк/белки). Моделирование же развития организмов, к примеру, это уже математическая биология (биокибернетика). Моделирование белков — это уже молекулярное моделирование.

      В свое время сам занимался выч. биологией. В последнии годы 99% молодежи устремилось именно в бионформатику, которая сейчас в моде и на конференциях 99% докладов студентов и аспирантов посвящены геном, геном, геном, геном, геном… В связи с этим, досадно видеть упадок интереса молодежи к классическому моделированию.
      • 0
        ага, тоже интересовался этим делом, хотел поступить в институт биоинформатики. Но когда понял, что там всё только геном геном геном, то передумал. Меня больше молекулярная биология интересует.
        • 0
          Это другое, это уже не биоинформатика, нужно идти в биологи =)
        • 0
          посвящены геном, геном, геном, геном, геном

          А как иначе, ведь так и обучают, геном геном, нажми розовую кнопку 473289, выпадет конфетка 3729842 (или не выпадет). Конструктор лего, деталек давяще огромное количество, как все регуляторные сети процессов проходят, не уследить (да и нет там как таковых сетей-цепей в большинстве сл.)), поэтому по большому счету остается обезьяний в плане "понимаю что делаю" черный ящик. С розовыми кнопками. Ну и как иначе подходить в такой ситуации? Некоторые надеются на сравнительную генетику, мол или меж видами, или меж особями, или меж близнецами будем брать различие и определять функцию. Вот только это тоже даст далеко не полную и все еще непонятную картину. Главное — не дающую возможность планировать изменения, кроме как через черный ящик. В этом смысле генетика высокого уровня — современный аналог средневековой медицины, с прикладыванием пиявок и т.п. Нужен фундаментальный уровень генетики, которого по мнению многих нет, мы уже все что есть, знаем. Но это не так, к счастью. (аргументировать не буду)
          Чтобы сойти на нижние уровни, нужна не только химия, но прежде всего физика, Максвел, электродинамика. И все чаще квантовая, как не отмахивались от этого дела, связки между гуляющими эм волнами и поглощением-испусканием "фотонов", движением электронов, не избежать. А так как физика тяжела в плане неуклюжести, универсальным лекарством может быть (и должна по-моему) математика. Более динамично и с разных сторон, разного уровня моделирования. В моей группе биологи на уровне химика явно имеют границы, чего не могут понять. Прямо стена, "сюда ходи, сюда не ходи". А "в народе" это ведь как раз определяет круг интересов, убежденности на разные темы… Но кое-как объяснить можно. Что интересно, более полезные чем сам матанализ, в такой ситуации — общие принципы понимания дифференциальных-интегральных уравнений, составления их, качественный анализ, потом гармонический анализ (и пусть с интегрированием проблемы, не критично), связанные осцилляторы. Потом на давно знакомую клетку смотрят совсем новыми глазами.
          Ага, тема же про информатиков вообще)) Если на курсах фундаментальных предметов нет, то желательно восполнить, потом будет — или повезет с иссл. группой, которая умело передаст, что им от тебя надо. или будет data-mining со статистикой (и это тоже нужные и важные задачи вообще-то). В любом случае риск нехватки знаний для задачи немал. Химию (как фундамент, так и "зоопарк"), физику, математику подтягивать вверх любыми способами. И так будет постоянно не хватать )
          • 0
            Однако, примерно половина системной биологии (например, построение сетей) тоже обработка массивов данных, однако к биоинформатике её не относят, так что определение не общее. Моделирование развития относят к системной биологии, о чем в статье есть ремарка.

            В моделировании сейчас есть некоторые проблемы. Точность модели и вычислимость на текущих вычислительных мощностях, на мой взгляд, приблизились к максимуму, то есть повышать точность — значит усложнять модели еще больше, а уже современные модели считаются с трудом.
          • 0
            Как дисциплина- БИ, очень интересная. И может быть в недалеком будущем, будет очень важно дисциплиной. Но проблема БИ на мой взгляд, и на данный момент. Это данные. Которых на данный момент очень, очень, и очень мало. А как писать «код», или инструкцию. Если ты не знаешь точных данных, чисел, алгоритмов. Это проблема.
            Биология организмов, процессов которые происходят внутри организма, клетки, ДНК, и т.д, штука очень сложная, и до конца не изученная.
            И как создать алгоритм поиска каких-то закономерностей, не имея данных, как все это происходит. Где начало, и где -конец. Я себе это трудно представляю. Нужно просто огромное количество данных. Я даже себе представить не могу, сколько…

            Но есть и огромный + БИ. Это как и писалось в статье, возможность проведения опытов неограниченного кол-во раз, и скорости обработки. А вот тут и открывается весь простор для мысли поэта. Но это при условии, если есть точные данные по какому то конкретному случаю, или теме. Или вообще уже есть все возможные данные ( допустим :) ) Вот когда у биоинформатиков, появятся все знания ученых биологов, генетиков, биотехнологов в доступной форме, что бы с ней можно было работать. Вот тогда, биоинформатика превратится в очень и очень интересную дисциплину. Ну а на данный момент, все упирается в данные, которые БИ будут получать от ученых.
            Это и есть пока к сожалению, самое узкое место в данной дисциплине. Но это не делает ее, менее интересной. Чем генетика, биология, генная инженерия, цитология, и т.д.
            Успехов в начинаниях! Через тернии. к звездам друзья! :)
            Кстати, в МФТИ очень много схожих факультетов есть. ФБМФ. Но там надо учится 5 лет.И это не курсы.
            P.S. Сам выбрал для себя, профессию- генетик. Очень уж хочется понять суть биологии организма. В будущем буду поступать в мед. И о данной дисциплине как БО, мечтал. Так как создание моделей, и обкатка их в условиях виртуальной реальности будет происходить быстрее в разы, чем эксперименты на личинках дрозофил. Но и без этого конечно ни куда. :)
            • 0
              Данных очень, очень, и очень много. Возьмите, например, ftp.ncbi.nlm.nih.gov.
              • 0
                Поддерживаю vyahhi, на текущем этапе данных слишком много, обрабатывать их грамотно и полно — задача на годы, а надо писать статьи. Вот и получается — есть консорциум, накопили они террабайты данных, выпустили десять статей — и данные "убираются в стол", хотя по ним еще десять статей написать можно.
              • +1
                Так как создание моделей, и обкатка их в условиях виртуальной реальности будет происходить быстрее в разы, чем эксперименты на личинках дрозофил. Но и без этого конечно ни куда. :)

                Только вот сейчас наоборот — созданию моделей как раз предшествуют сотни экспериментов in vitro. Другое дело, использовать уже созданную модель, дешевле, чем проводить новые эксперименты. Создать и использовать — совершенно разные вещи.

                P.S. Сам выбрал для себя, профессию- генетик. Очень уж хочется понять суть биологии организма.

                Узнаю себя в юности. Только реальность оказывается не такой радужной — вместо понимании сути биологии организма, годами возишься с пониманием динамики взаимодействия пары белков в одной из подзадач твоей основной задачи…
                • 0
                  Узнаю себя в юности. Только реальность оказывается не такой радужной — вместо понимании сути биологии организма, годами возишься с пониманием динамики взаимодействия пары белков в одной из подзадач твоей основной задачи…

                  Все на столько "плохо"? И простите. Вы генетик по профессии?

                  Касательно меня. Я бы конечно хотел получить несколько образований. Это геронтология, клеточной биология, генетика.

                  И дай бог сил, времени. Чтобы их получить, понять.
                  • 0
                    Дико извиняюсь, что лезу в тред, но да, так плохо ) Задачу нужно разбить на ряд простых и однозначных вопросов, каждый из которых имеет качественный (да/нет) ответ. При этом нужно как минимум найти имеющиеся работы по темам, прочесть, часть проверить руками на точность и воспроизводимость. В итоге, помимо работы, нужно в точности по Кэрролу, тратить минимум полчаса на чтение статей (штучек 5 ), просто чтобы не отстать.

                    Еще Вам может помешать разное понимание биологии медиками и собственно биологами. Старая шутка: там, где медик будет расспрашивать о снах и детстве, биолог просто вобьёт пару электродов в мозг и посмотрит. Т.е. экспериментальные подходы различаются чудовищно, особенно если работать на людях. В медицине исследования часто ретроспективные или на малых выборках. Ещё существуют такая наука как "молекулярная биология мыши": несмотря на многие сходства, данные, полученные на мышах, на человека ложатся практически никак; даже данные полученные на одной клеточной линии могут в разы отличаться от полученных на другой.

                    Клеточной биологии в медах учат… препогано. С отставанием от новых понятий минимум лет на 10, может быть и 30. На биофаках МГУ, СпбГУ и в Новосибе учат получше, там отставание поменьше, 3-5 лет. Это я не к тому, что нужно забыть про эту специальность, просто учить её надо как минимум на половину самостоятельно. Первое, что надо понять — это почему учебники по цитологии сначала тонкие, потом толстые, а потом опять тонкие; очень советую почитать 3 последние редакции "Molecular Cell Biology", Harvey Lodish. Ну и чтобы преподаватель объяснил, что такое треды и иконы, и как на них правильно плевать.
                    • 0
                      При этом нужно как минимум найти имеющиеся работы по темам, прочесть, часть проверить руками на точность и воспроизводимость. В итоге, помимо работы, нужно в точности по Кэрролу, тратить минимум полчаса на чтение статей (штучек 5 ), просто чтобы не отстать.

                      Горький опыт из жизни — в одной из глав своей диссертации я решал одну нерешенную на тот момент задачу. Пока решал, был очень поглощен и перестал мониторить литературу. По итогу задачу решил и тут как гром среди ясного неба — парой месяцев до этого в одном из западных журналов выходит статья, где решается та же задача, даже название статьи почти как у меня. Обидно конечно было, но благо было лишь частью моей работы. Хотя знаю случаи, когда даже кандидатские по математике были запороты в связи с тем, что кто-то в это же время доказал эту же теорему.
                      • 0
                        Абсолютно аналогично. Перед подачей статьи обнаружил, что 2 года назад в журнале с маленьким импактом была опубликована статья даже лучше, чем моя. Премного от этого печалился. Литературный поиск — один из самых сложных этапов, на самом деле...
                    • 0
                      Нет, я математик. В вычислительную биологию (в т.ч. биоинформатику) ведут две двери — со стороны математики и со стороны биологии. Вообще уже много встречал д.б.н, которые имеют к.ф-м.н.

                      Насчет "плохо" — тут проблема в завышенном ожидание, которое было у меня. Оказывается, что на пути к понимаю сути лежит еще столько нерешенных проблем. В итоге ты занимаешься не разгадкой сути жизни, а этими весьма посредственными, но необходимыми задачами. И чем больше их решаешь, тем больше понимаешь, как же мы далеки от понимания даже фундаментальных механизмов клеток. Я пришел в аспирантуру с амбициями по окончанию создать рабочую мат. модель клетки. Реальность оказалось другой — за 3 года смог смоделировать разве что несколько механизмов в клетке e.coli.

                      А позвольте узнать, вы сейчас заняты в академической сфере? Т.е. желаете сделать карьеру исследователя, или же просто это ваше хобби?
                      • 0
                        А позвольте узнать, вы сейчас заняты в академической сфере? Т.е. желаете сделать карьеру исследователя, или же просто это ваше хобби?

                        Если вопрос адресован мне, то я на данный момент фельдшер. В медицине 8 лет. Не давно вот, ушел с "03". И только собираюсь поступать в мед. По этому, это пока можно назвать очень увлеченным хобби. Но с желанием, сделать карьеру исследователя.
                        P.S. Спасибо за развернутый ответ, на мой вопрос.
                        P.S.S. Если вопрос был адресован не мне, то прошу извинить меня.
                  • +1
                    Биоинформатики вырастают из биологов, подтянувшихся в CS, или из программистов/математиков, выучивших биологию. Говорят, есть биоинформатики-инженеры, но таких я не встречал. Сам я биолог (клеточник), помогаю коллегам обрабатывать данные, сам больше занимаюсь микроскопией. Немного поделюсь опытом "вычислителя", пришедшего с биологической стороны. С биоинформатиками по диплому не работал, из моих знакомых вычислительной биологией занимаются генетики и биофизики. Как мне рассказывали про инструменты:

                    • геномные дела рассчитывают на perl. У биологических биофизиков (выпускников биофака МГУ, а не физфака, где тоже есть кафедра биофизики) есть спецкурс по программированию (теория, алгоритмы, примеры использования) в основную пятилетку и ещё курсы в аспирантуре
                    • моделирование делают в чем попало. Чаще всего видел матлаб, питон и лисп.
                    • на прикладном уровне ценятся java и скриптоязыки (питон, Tcl). Эти языки в упрощённом виде особенно часто используются в качестве встроенных макроязыков в программах, с которыми я сталкивался на биофаке. Обычно используется или что-то упрощённое С-подобное, или упрощённая java/beanshell

                    Проблемы взаимодействия с коллегами:



                    • не все умеют коротко и однозначно сказать, что же им нужно посчитать. Т.е. какая величина является измеряемой и как это делается вручную (т.е. чтобы алгоритмизировать автоматические измерения, а не "сердце подсказало")
                    • многие естественники отвратительно знают статистику, хотя есть "Медико-биологическая статистика" Гланца. Для специалистов медико-биологической направленности — эта книга самая понятная. Поэтому лучше всегда брать исходники и самому пересчитывать.
                    • нужно знать границы применимости и точность приборов, чтобы понять, какие данные релевантные. Как минимум так удобно выявлять аномальные значения и чистить шум.

                    EDIT: поправил опечатки и форматирование
                    • 0
                      Используют ли R и bioconductor?
                      • 0
                        В публикациях видел, а вот университетских курсов не знаю. В качестве скриптоязыка R не встречал ещё ни разу
                      • 0
                        На perl уже считается в некотором роде "дурным тоном" писать. Python выбор мастеров ныне.

                        Моделирование лучше писать на чем-то очень-очень быстром, если моделирование включает оптимизацию параметров/симуляции. Я бы сказал что Matlab, C, C++, иногда Java.

                        Со статистикой беда, но статистика штука очень tricky, иной раз простейшие вопросы могут ставить в тупик =) вот недавно проводили лекции по статистике, был озадачен наивным вопросом — почему в тесте на пропорции распределение хи-квадрат? Мне кажется статистику знают отвратительно подавляющее большинство научных работников, вопрос лишь в степени отвратительности.
                        • 0
                          Хорошая статья, кстати, в конце несколько слов про знание статистики биологами и как эту проблему решать. За этим, в том числе, и нужны биоинформатики.
                        • 0
                          Желание есть в эту сферу податься, тем более Perl вроде активно в биоинформатике юзается, но учиться наобум лень, не факт что потом работу найдёшь, а время потрачено, стажером на полставки пошёл бы.
                          • 0
                            Если удалёнщиков берут
                            • +1
                              В российскую "академию" очень неохотно берут удалёнщиков, а бизнес хочет портфолио. Я бы посоветовал стукнуться в Финляндию, если у вас медико-биологическое образование. Там и школа хорошая, и денег дают, и ситуация "меня ледоход застал на острове, я пару недель поработаю удаленно" является штатной.
                          • +2
                            Биоинформатика вроде сейчас в тренде, но если хотите получить хорошие знания то стоило идти в американские аспирантуры. После барселоны мала вероятность, что удастся попасть на хорошего посдока. Насчет ухода в промышленность не знаю, возможно будет проще. Ну и зп постдока далеко не в разы больше аспиранта, разве что сравнивать российского аспиранта с американским постдоком

                            Сейчас в тренде машинное обучение, видел много статей по поводу биоинформатики. Если интересно можете написать в личку.

                            По поводу языка, честно скажу, перл наверно не самый удачный. Я бы обратил внимание на питон для будущей карьеры
                            • 0
                              Ну, встречал много людей которые придерживаются такой же, как и вы, точки зрения — "не человек место красит, а место человека". Не согласен. Знания в аспирантуре не дают, аспирант — что гусар, берет знания силой и настойчивостью =)

                              Зп постдока в Барселоне/EMBL/Гроннингене выше в 1.5 — 2 раза. Про остальное, действительно, не знаю.

                              Машинное обучение я бы не сказал что в тренде, просто потому что это выражение не совсем корректно на мой взгляд. Машинное обучение де факто стандарт во всех исследованиях, в которых не все вероятностные факторы можно напрямую вывести из дизайна эксперимента.
                              • 0
                                "не человек место красит, а место человека"

                                Ну это вы скажите, когда на работу будете устраиваться ))) При мне было много случаев, когда предпочитали человека с хорошим дипломом чем более умного и подходящего, но с дипломом из глубинки.

                                Очень часто выходит, что "без бумажки ты букашка"
                                • 0
                                  Совиет Юнион стайл. Если нет возможностей оценить людей по способностям — ценят по диплому, но в серьезном научном мире немного не так. Человек, получивший PhD по биоинформатике в MIT и имеющий одну статью первым автором в хорошем журнале, скорее всего, проиграет конкурс человеку с PhD из Москвы и имеющему 10 статей первым автором в хорошем журнале.

                                  Что правда, так это то, что в Америке больше возможностей поработать в хорошей команде/с самыми новыми данными. Вовсе не бумажка или букашка играют здесь роль.
                            • –1
                              После Ph.D. есть уже 3 варианта:
                              Первый — понять, что жизнь — тлен
                              Знаю я такого биолога-программиста, предсказавшего ресурсный кризис и генетическое вырождение цивилизованного человечества.
                              За 10 лет до «майдана» свалил из Киева на хутор. Виктор Сергиенко АКА Кошастый (1975 г.р.) — известный сурвивалист-дауншифтер.
                              Оленьи рога ему не грозят. Выращивает двух дочек в относительно чистом месте.
                              • 0
                                Для шапочного знакомства с биоинформатикой уже создано немало онлайн-курсов (русскоязычный Stepic.org

                                а есть ссылка на конкретный курс?
                                • 0
                                  вот так-так, я там проходил Algorithms in Bioinformatics от UCSD (он раньше дублировался на курсере), теперь видимо он идет только в виде специализации на курсере...

                                  https://stepic.org/users/651763/teach — вот эти курсы будут полезными, но алгоритмы в биоинформатике убрали =(

                                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.