- BrainTools - https://www.braintools.ru -

Полный геном за $200 и его анализ в домашних условиях: Nebula, Just-DNA и другие. Часть 1

Полный геном за $200 и его анализ в домашних условиях: Nebula, Just-DNA и другие. Часть 1 - 1

Любопытство — один из двигателей прогресса. В один прекрасный момент я захотел узнать, какие тайны хранит мой геном, и для этого пришлось разобраться, как это сделать за вменяемые деньги и как проинтерпретировать результат.

В этой статье я расскажу о том, как я получил сиквенс и начал разбираться в нём с помощью платных и бесплатных программных продуктов.

Уверен, что продвинутый биоинформатик знает об этом намного больше меня, и буду благодарен за дополнения в комментариях.

Секвенирование полного генома vs генотипирование

Whole Genome Sequencing, WGS — это совсем не то, что ДНК-тест за 10 тысяч рублей, который делается на специальных чипах, способных аппаратно детектировать только 300 000 мутаций (старые чипы) или 600–750 тысяч мутаций (современные). Такой чип похож на трафарет, к углублениям которого прилипают кусочки ДНК. При наличии такого прилипания детектируется мутация. Безусловно, генотипирование (так называется подобная процедура) — очень полезная вещь, так как за небольшие деньги позволяет узнать свои типовые проблемы. В себестоимости такой анализ стоит около $20–40, поэтому по акциям иногда можно было и за 7 тысяч поймать.

Генотипирование позволяет увидеть только те мутации, которые заложили в чип инженеры Illumina или Thermo Fisher Scientific (крупнейшие производители SNP-чипов). Если у вас есть редкая, уникальная мутация, но инженеры Illumina не создали под неё физическую ячейку на чипе — тест её просто проигнорирует. WGS (полногеномное секвенирование), напротив, прочитает этот участок «как есть», и биоинформатик всё равно увидит поломку.

Полногеномное секвенирование имеет себестоимость $200-400, но и даёт возможность получить как сырые данные (форматы FASTQ, BAM, VCF), так и полную сборку генома.

Dante Labs: Первая попытка получить полный сиквенс

Ещё в ноябре 2018 года на «чёрную пятницу» была акция, где итальянская лаборатория Dante предлагала сделать полногеномное секвенирование за $199 долларов с mtDNA и покрытием x15. Я купился и заказал. Мне прислали пластиковый контейнер, который я потом отправил почтой по европейскому адресу.

Шли месяцы, никаких результатов не было. Я стал волноваться и разбираться. Оказалось, хитрые ребята придумали неплохую схему: промышленные секвенаторы секвенируют условно сразу целую полку пробирок. И поэтому в учреждениях, в которых они стоят, иногда бывает недогруз, и в эти слоты по остаточному принципу за копейки Dante впихивали свои пробирки. Поэтому всё долго. Шли месяцы, но результатов не было и не было. Тем более Dante то ли потеряли, то ли испортили мою пробирку, и мне (за их счёт) пришлось ещё раз высылать им биоматериал в Италию. В итоге моё терпение кончилось, и я сделал возврат денег через PayPal. После чего я понял, что раздолбайство бывает не только в России и что Dante просто сказочные раздолбаи.

Nebula: Вторая, третья и успешная попытка

В ноябре 2021 опять настала «чёрная пятница», и я увидел предложение полногеномного секвенирования за $180 + $20 подписка за первый месяц. Об этой фирме я никогда не слышал, но погуглил форумы биоинформатиков, где были отзывы, и понял, что с ними можно работать, хоть и секвенируют они в Китае. Видимо, это свойство всех супердешёвых предложений по секвенированию генома. Фирмы готовы везти ваш биоматериал хоть в Новую Зеландию, лишь бы сделали подешевле.

Выбор покрытия: x30 vs x100

На выбор было 2 варианта покрытия: x30 и x100. Чем больше, тем лучше, но и в разы дороже. Покрытие x100 стоило ~$600 (на «чёрную пятницу»).

При секвенировании генома длинная нить ДНК рвётся на кусочки, которые под силу проанализировать секвенаторам (как правило, фирмы Illumina), а после секвенирования специальные программы собирают из этих обрывков опять полный геном.

x30 означает, что длина всех обрывков в 30 раз больше длины всех ваших цепочек ДНК, но засада в том, что это в среднем. Какая-то часть генома может быть представлена в количестве 200 копий, а какие-то куски могут отсутствовать или быть в единичных количествах. Поэтому чем больше покрытие — тем лучше. Секвенирование генома делается 1 раз в жизни, поэтому, если с финансами отлично, то можно позволить и x100.

Гугление показало мне, что покрытие 30x при полногеномном секвенировании — это индустриальный «золотой стандарт» для личного и клинического использования. Этого хватает для предиктивной медицины, фармакогенетики, поиска носительства наследственных заболеваний и генеалогии. Поэтому я выбрал его.

Nebula: логистика

Подписок я боялся, думал, что не отслежу, когда начнут списывать деньги, поэтому взял без неё. В качестве адреса при покупке я указал адрес форвардинговой компании в США, так как в Россию они не высылали. Туда пришёл набор для взятия биоматериала — картонная коробочка с пластиковой пробиркой.

Форвардинговая компания имела строгие правила по поводу пересылки в Россию, поэтому в таможенной декларации я указал «Plastic vial», а стоимость — $7. Вряд ли этот набор стоил больше, ведь деньги брались за услугу, а не за него.

Обратно в США отправил пробирку Почтой России, также указав в таможенной декларации «Plastic vial», обычным почтовым сообщением, не EMS. Так как для курьерских служб всегда более строгие правила.

В конверт для российской почты я вложил американский конверт с наклеенным адресом и QR-кодом от Nebula, а в него уже сам образец, чтобы им там было проще разобраться.

Оказывается, я вовремя подсуетился — Федеральный закон № 43-ФЗ от 20 февраля 2026 года [1] с 1 сентября 2026 года запрещает отправку биоматериала за границу (если я правильно понял), не знаю, как он будет контролироваться и какие там штрафные санкции. Закон не так прост для понимания, так как сделан в виде правок предшествующего закона от 2022 года, а не полноценного документа.

По закону подлости через некоторое время Nebula мне написала, что образец оказался ненадлежащего качества (это был эвфемизм для истинного смысла: «мы его потеряли» или «он протух, потому что мы раздолбаи»), и мне пришлось его выслать повторно. Кстати, у моего друга образец тоже дошёл со второй попытки, но его потеряла почта. Из-за того, что он застраховал посылку, он потерял только время, но не деньги на вторую отправку.

Тест пройден. Что по данным?

После секвенирования я смог скачать файлы:

55G NG101J7C24_1.fq.gz
56G NG101J7C24_2.fq.gz
57G NG101J7C24.mm2.sortdup.bqsr.cram
1,4M NG101J7C24.mm2.sortdup.bqsr.cram.crai
215M NG101J7C24.mm2.sortdup.bqsr.hc.vcf.gz
1,7M NG101J7C24.mm2.sortdup.bqsr.hc.vcf.gz.tbi

Общим объёмом примерно на 170 ГБ.

Интерпретация данных

В личном кабинете Nebula можно увидеть от совсем примитивных интерпретаций генетических черт (Traits) для чайников до репортов по конкретным заболеваниям или особенностям, основанным на конкретных научных исследованиях. Также можно увидеть сводку по ДНК бактерий, которые были найдены в образце, регионы происхождения, ассоциированные с геномом, браузер генома, анализатор генов. Последние 2 вещи небиоинформатику использовать смысла нет. Я покажу на скринах, как это примерно выглядит.

Вообще стоит оговориться, что главный смысл полногеномного секвенирования — не в нескольких картинках и красивых репортах, которые вы увидите, а в том, что оно абсолютно покрывает как все текущие исследования, так и будущие.

Такое секвенирование делается 1 раз в жизни, и в нём есть карта всех мутаций и особенностей организма, как изученных наукой [2], так и тех, которые ждут открытия.

Также, если полный геном на руках, то его можно загрузить в любой сторонний, платный или бесплатный сервис для анализа.

Регионы происхождения

Это очень простой раздел, где в процентах описываются регионы происхождения ваших предков. Но было приятно увидеть подтверждение семейной легенды, что один из моих предков — испанец, отставший от армии Наполеона и оставшийся в России в 1812 году: я увидел, что примерно на 7% француз и баск.

Nebula: генетические черты

Для чайников сделано в районе 33 простых генетических черт. Приведу 3 штуки в пример:

Генетические черты

Генетические черты

Nebula: репорты

Сотрудники Nebula добавили в свою систему примерно 200–300 генетических исследований. После анализа генома автоматически рассчитывается, насколько конкретно это исследование применимо к вам.

Вот парочка примеров репортов.

Бессонница

Бессонница
Рак мочевого пузыря

Рак мочевого пузыря

YFull — глубокая генеалогия

YFull [3] — это независимый исследовательский проект и глобальная база данных, специализирующаяся на глубокой генетической генеалогии. В первую очередь проект сфокусирован на детальном анализе Y-хромосомы (передаётся строго по прямой мужской линии) и митохондриальной ДНК (мтДНК, передается по прямой женской линии).

В Nebula данные можно отправить буквально нажатием 1 кнопки. Через некоторое время получаешь базовый отчёт, в котором был анализ митохондриальной ДНК и ссылка на дерево моей гаплогуппы [4], наподобие такой [5].

Иными словами, проект анализирует мутации по отцовской хромосоме и строит дерево предков. Есть масса людей по всему миру, увлечённых генеалогией, они обожают этот проект.

Мне даже не пришлось платить €44, поскольку мою запись в дереве увидел очень дальний родственник из Эстонии Кирилл Князев, увлечённый генеалогией. Внутри проекта YFull я получил такое сообщение:

User ID ***** wrote:
> Здравствуйте, новый сосед по ветке!
> Как же я вас долго ждал!!! 

Он предложил мне оплатить эту услугу (YFull позволяет такие фокусы, когда можно оплатить анализ за того, кто дал добро на добавление в БД, но не дал денег на анализ). И я узнал много интересного о происхождении моих предков по отцовской и материнской линиям.

Гаплогруппы

Я приведу рассказ о них из письма Кирилла:

У-хромосома передаётся только по мужской линии. От отца к сыну.

Мы все произошли от условного Адама. То есть наша У-хромосома — практически точная копия У-хромосомы Адама. Основная разница — в мутациях. Условно говоря, каждые 100 лет на У-хромосоме появляется мутация — своего рода отметка, зарубка, годовое кольцо, как у дерева, — представляйте как хотите, суть не в этом. Главное, чтобы вы себе ясно представляли, что такое мутация на У-хромосоме.

Вот по этим отметкам (мутациям) можно вычислить степень родства между двумя мужчинами. К примеру, мужчина имеет на У-хромосоме мутацию А. Два его потомка по мужской линии тоже будут иметь мутацию А, а через 100 лет в этих двух ветвях появятся новые мутации. У каждой линии — своя. К примеру, Б и С. То есть если мы сравним У-хромосомы этих потомков, то найдём у одного из них мутацию АБ, а у второго — мутацию АС. На основании этого можно сделать вывод, что приблизительно 100 лет назад у этих двух мужчин был общий предок. Приблизительно так и построена вся система сравнительного анализа мужских У-хромосом.

На основании очень древних мутаций всё мужское население Земли разделили на несколько ветвей — гаплогрупп. Каждой дали условное буквенное обозначение.

На базе генетических анализов древних археологических находок проложили условный путь, по которому двигались представители той или иной гаплогруппы, когда заселяли Землю.

Гаплогруппу нельзя привязать к какому-то конкретному народу, но можно сказать, что та или иная гаплогруппа характерна или доминирует у тех или иных народов.

Так, к примеру, гаплогруппа R1a широко распространена в мире. Но в России она доминирует. Многие мужчины в России имеют У-хромосому, относящуюся к R1a. Гаплогруппа R1b характерна для западных стран. Но её можно встретить и в России, и в других странах, но реже.

Древо происхождения

Оказывается, мои далёкие предки по мужской линии — это обрусевшие монгольские князья, чёрные клобуки [6].

Начало рассказа Кирилла об общих предках

Наша с вами гаплогруппа — N, до недавнего времени считалась «северной». Чаще всего её встречали у жителей Финляндии, Эстонии… А вот дальше начинается интрига…

Ещё раз повторю, что на тот момент, когда я сдавал анализ на У-хромосому, гаплогруппа N относилась исключительно к «северной» гаплогруппе. Финляндия. Эстония. Северные регионы России.

Мои предки из Орловской области, и я предполагал, что получу гаплогруппу R1a — ту гаплогруппу, которую на территории России ассоциируют [7] со славянскими народами. И был шокирован, получив гг «N», и уж тем более вдвойне я был шокирован, когда просмотрел список людей, которые являются моими «совпаденцами» по У-хромосоме…

Список «совпаденцев» по У-хромосоме даёт возможность понять, кто мои «древние братья» по У. У каких народов чаще всего встречается моя У-хромосома.

Так вот, в списке «совпаденцев» были лишь представители Средней Азии, Турции и татары Поволжья…

В общем, глянул я на список своих совпаденцев по У-хромосоме и обомлел. Сплошь представители Средней Азии, Турции, татары и селькупы (народность, проживающая на юге Урала). Что за ветвь у меня? Хрен его знает… Куда ни сунусь почитать про гаплогруппу N — везде одно и то же: северные народы. Да какие, нахрен, «северные», если у меня в совпаденцах одни южные братья! Относился бы я к «северным» — в моих совпаденцах были бы финны, эстонцы и ребята с севера России! А тут сплошной юг!!!

Ситуация усугублялась ещё вот каким обстоятельством. Вы, наверное, знаете, что в ФТДНА анализ У-хромосомы можно делать поэтапно. Сначала на 12 маркеров, затем на 37, потом на 111, а уж в конце — БИГ У — 700 маркеров. Это удобно для тех, кто не очень-то богат. Сначала сделал самый дешёвый анализ на 12 маркеров. Затем накопил денег — сделал на 37. Снова накопил — на 111, ну и так далее… Тем более что многим вполне хватало и анализа по 12 маркерам. И дальше не делали. Не считали нужным продолжать исследования. Или кошелёк не позволял. Я, кстати, первый анализ сделал на 37.

Ну так вот, у большинства моих совпаденцев был сделан только анализ на 12 маркеров… И мало у кого был сделан БИГ У или на У-111. То есть чёткий анализ и выводы при таком раскладе сделать было практически невозможно… Меня это так заинтриговало, что я быстро сделал себе БИГ и залил результат на YFull. И опять — непруха!!! Я в этой ветви был практически один! Как сыч!..

А где-то через год Турция залила на YFull результаты своих генетических исследований населения, да ещё и кое-какие образцы появились в частном порядке, и картина начала вырисовываться…

Я пообщался со специалистами и «профи» из России, связался с турецкой стороной, побеседовал с совпаденцами из южных республик, и пазл собрался воедино. Все, с кем я общался, были однозначно уверены, что эта ветвь принадлежит южным, тюркоязычным кочевникам! Это уже 100%.

Картина получается следующая.

Когда-то в древности в Горном Алтае существовала Пазырыкская культура. Вы можете почитать о ней. Очень интересно! Хотя бы тем, что мумии жителей Пазырыка сохранились настолько хорошо, что была возможность сделать ДНК-тест. Так вот — наши с вами древние предки жили там. Это точно.

После заката Пазырыка часть жителей ушла на юг, и их потомков можно найти в Китае.

Другая часть ушла на север. Сейчас это финны, эстонцы, северные жители России.

Часть обосновалась в Сибири — это селькупы.

А часть переселилась в южные степи России и стала тюркоязычными кочевниками. Их ещё называют огузами. Почитайте про 24 огузских племени.

Среди последних и были наши с вами древние предки…

В общем, в те времена, когда древние русичи закладывали Новгород и Киев, наши с вами предки мотались по степи и жили в вежах — эдаких бобровых хатках.

Откуда у нас с вами в совпаденцах турки?

Если помните историю, то изначально земли Турции населяли греки. Во времена Римской империи сюда пришли римляне. После падения Римской империи на землях Турции возникла Византия.

А Византия пала… под натиском тюркских (огузских) кочевых племён. Сегодняшние турки — это потомки кочевников, захвативших эти земли. Так вот среди тех, кто захватывал Византию, были и наши с вами древние сородичи. Но это далёкая родня.

Наша же более близкая к нам по времени родня со свистом и гиканьем нападала на южные границы Киевской Руси. Грабили и убивали. По-разному их называли. Половцы. Печенеги. В общем — злые кочевники. Это наша с вами ближайшая родня.

Что было дальше — как из степных просторов наши предки перебрались к русским берёзкам — пока можно только предполагать.

Но вероятнее всего около X века наши предки перешли на службу к князьям Киевской Руси. В историю они вошли как чёрные клобуки, торки, берендеи.

В моих совпаденцах есть два или три образца с Украины. Все трое — коренные жители. Это косвенное подтверждение, что наши предки осели на землях Киевской Руси.

Но были среди нашей родни и те, кто не перешёл на службу к русским князьям, а продолжил кочевать по степи. Эти наши родичи в конце концов осели в республиках Средней Азии или стали татарами Поволжья.

… далее идёт рассказ о более близких хронологически родственниках.

Кирилл провёл фантастически детальное расследование, и было очень приятно узнать, что у нас с Кириллом есть среди общих родственников очень неординарные люди.

Бесплатные и Open Source-утилиты для анализа генома

Полный геном на руках не был бы полным геномом, если бы нельзя было данные использовать где-то ещё.

Если у вас уже есть геном на руках, то можно начать с этого бесплатного проекта Lite Just-Dna [8], сделанного энтузиастами, учёными и биоинформатиками (основатели: Антон Кулага и Николай Усанов). На сайте можно поиграть с проектом без инсталляции на основе нескольких публичных геномов.

Руководство [9].

Github-репозиторий [10] проекта для анализа генома. Отрабатывает буквально за пару минут.

Подробнее в следующей части…

Спасибо за внимание [11]!

© 2026 ООО «МТ ФИНАНС»

Автор: inetstar

Источник [12]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/30969

URLs in this post:

[1] Федеральный закон № 43-ФЗ от 20 февраля 2026 года: http://publication.pravo.gov.ru/document/0001202602200064?index=1

[2] наукой: http://www.braintools.ru/article/7634

[3] YFull: https://www.yfull.com/

[4] гаплогуппы: https://ru.wikipedia.org/wiki/%D0%93%D0%B0%D0%BF%D0%BB%D0%BE%D0%B3%D1%80%D1%83%D0%BF%D0%BF%D1%8B

[5] такой: https://www.yfull.com/tree/N-VL85/

[6] чёрные клобуки: https://ru.wikipedia.org/wiki/%D0%A7%D1%91%D1%80%D0%BD%D1%8B%D0%B5_%D0%BA%D0%BB%D0%BE%D0%B1%D1%83%D0%BA%D0%B8

[7] ассоциируют: http://www.braintools.ru/article/621

[8] Lite Just-Dna: https://lite.just-dna.life/

[9] Руководство: https://www.youtube.com/watch?v=81ZKngPbBj0

[10] Github-репозиторий: https://github.com/dna-seq/just-dna-lite

[11] внимание: http://www.braintools.ru/article/7595

[12] Источник: https://habr.com/ru/companies/ruvds/articles/1040878/?utm_campaign=1040878&utm_source=habrahabr&utm_medium=rss

www.BrainTools.ru

Rambler's Top100