🔎 Кратко о вопросе разницы систем дистанций FST и G25.
На примере данных одного из (Vien). Генеалогия: старожилы Архангельской области + старожилы Рязанской области + несколько дальних веток тверских карелов и латышей.
По G25 такой результат будет выглядеть, если говорить просто, — суммарно. То есть — в данном случае близость к костромичам, вологжанам, зауральцам и др. (см. 3 скриншот — результат суммы координат Рязани и Архангельска по нашей выборке).
По FST мы видим именно предковые популяции — Рязань (Михайлов, Спасск), Тверь, Архангельск (Красноборск). Поскольку в датасетах Admixture выборки гораздо меньше (в данном случае классический 1240k), то наиболее подходящие популяции установить сложнее. Далее идут Орёл, украинцы, Ярославль, Курск, финные и др. популяции, с которыми есть общие сегменты в рамках выборки Human Origin (. HO) и смоделированого для Admixture файла индивида. И хоть многих из них в генеалогии нет, пересечений может найтись довольно много.
FST — это индекс фиксации (собственно, « https://en.wikipedia.org/wiki/Fixation_index»), который, грубо говоря, показывает уровень скрещивания популяций. Чем ближе дистанции к 0, тем вероятнее https://ru.wikipedia.org/wiki/Панмиксия (свободное скрещивание).
Поэтому, человек даже немного смешанного происхождения по G25 может не увидеть в топе своих дистанций предковые популяции, но может увидеть их в разбивке. + ко всему, Global25 — это система координат по https://ru.wikipedia.org/wiki/Метод_главных_компонент (PCA), где сравниваются не исходные данные (как в Admixture), а преобразованные из них координаты.
Основной плюс G25 — выборки больше и их проще формировать, как и вычислять между ними разницу.
Основной плюс FST — результаты более точные и гораздо лучше определяют родство.
Использовать в популяционной генетике стоит как можно больше разных инструментов, для расширения «общей картины».
🧬