Анатомия Райха: вскрытие древнего генома (часть 2) 🧬
Первая часть
https://t.me/DNAbase.
Продолжаем изучать фундаментальное исследование команды Дэвида Райха и Али Акбари. Сегодня сфокусируемся на том, как устроены ранее недоступные публике данные по 10 000+ древних индивидов и как в них ориентироваться.
1. Баланс между наукой и приватностью
Главная особенность этого релиза – строгая анонимизация. Для 9497 образцов точные координаты и названия археологических памятников, где они были обнаружены, скрыты. В статье отмечено, что за координатами можно обращаться к Дэвиду Райху (D. R.), а так все "под замком" на 15 лет. Что-то будет опубликовано учеными в ближайшие годы, что-то станет доступно только в 2041 г. Бэкап бесценной Эксель-таблицы лежит на серверах Амазон.
Что нам доступно: макрорегион (одна из 5 зон Западной Евразии) и датировка сэмплов.
В статью вошли и женские, и мужские образцы. Спасибо лабе, их пол определен. Среди анонимов 4255 Ж, 5169 М, 73 не определено, хотя у 56 из них энтузиаст Miro C обнаружил Y-гапло, так что, вероятно, мужчины.
Как определять контекст. Ученые в лаборатории Райха используют последовательные ID (начинается с I и далее нумерация). Такая формальная структура очень полезна – она касается и предыдущих статей, основанных на анализах дДНК из Гарварда. Благодаря ей мы в том числе понимаем, что далеко не все вошло в работу Акбари-Райха. Но исследователи ориентировались на обеспечение качества данных для своих глубинных статистических исследований процессов естественного отбора, так что выборочный подход понятен.
Мы отсортировали таблицу по ID лабы. Ученые часто отправляют массу своих находок древних останков к Райху, своего рода, "пакетом". Если анонимный образец находится в «пакете» рядом с данными из уже известной статьи и имеет схожую датировку – его можно косвенно соотнести с группой. Таких немного. Но, например, образцы I7215 и I7216 относятся к тому же временному горизонту и региону, что и идущие далее из работы ReitsemaReichPNAS2022. Это мэтч 😎
Для остальных путь идет через аутосомный профиль: смотрим на генетическую близость к известным древним культурам и современным популяциям через https://casperhub.dev/Akbari2026/. Обязательно учитываем макрорегион. Делаем гипотезы.
Пример: анонимный образец I39051. Субклад R-YP372. Датировка – 850 г. н.э. Макрорегион – "Центр". Смотрим близость по аутосомам, 3-4 позиции – Силезия. С наибольшей вероятностью этот образец и происходит с этой исторической территории (Западная Польша, Восточная Германия, Чехия). Мы все время остаемся в поле гипотез и вероятностей, но это совмещение данных все же приближает к возможной истине.
Прокачанная таблица: что добавлено в
https://t.me/DNAbase?
Чтобы работать со всем массивом данных из работы Акбари-Райха было реально, мы взяли оригинальную таблицу ученых и существенно её дополнили. Теперь это полноценный инструмент для анализа:
1️⃣ Сортировка по ID: упорядочили данные Райха, чтобы легче было отслеживать «пакетные» поступления образцов.
2️⃣ Умные фильтры: теперь можно в один клик выделить только New ancient samples (anonymized).
3️⃣ Гаплогруппы (Y и mt): интегрировали данные по Y-хромосоме и митохондриальной ДНК. Использовали как результаты энтузиаста Miro C, так и данные из дополнительных таблиц самого Райха. По Y в основном все хорошо - она определена у тех, кого генетики видят мужчинами, хотя некоторое количество исключений у Miro C есть 😁 Но это мелочи...
4️⃣ Пол и биоматериал: добавлена информация о поле индивидов и типе ткани (зубы, кости и т.д.), из которой извлекали ДНК.
Гайд по территориям: на отдельном листе «Territories» сделали расшифровку макрорегионов. Теперь понятно, какие современные страны входят в зоны «N», «C», «SE» и другие.
Почему это важно?
Даже с учетом анонимности, этот массив данных – «золотая жила» для понимания миграций. С помощью обновленной таблицы и прочих инструментов вы можете сами проследить, как менялся генетический ландшафт Европы и Азии на протяжении тысячелетий.
👇 Файл прикреплен ниже в
https://t.me/DNAbase. Пользуйтесь, фильтруйте и делитесь находками в комментариях! Будут ошибки - пишите.