Vitalist Bay. Day 2.
AI в Longevity
Главная мысль повторялась в разных формах: AI сам по себе не решит longevity. Он может сильно ускорить область, но только если мы начнем собирать правильные данные, проверять модели на правильных задачах и не будем сводить биологию к тому, что уже описано в статьях.
Morgan Levine говорила, что старение — это не один сломанный механизм, а изменение состояния всей сложной системы: клеток, тканей, органов, организма и контекста вокруг них.
Поэтому биологические часы и модели под одну задачу полезны, но ограничены. Часы могут показать, что какая-то интервенция что-то сдвинула, но сами по себе не говорят, что именно нужно делать, чтобы сдвинуть старение. А модели под одну задачу обычно хорошо решают узкую задачу, но не учатся понимать биологию как систему.
Ее идея — строить модель, которая учится представлять разные состояния живых систем на разных уровнях и помогает понять, как перейти из одного состояния в другое.
Morgan также скептически относится к идее, что LLM просто прочитает все статьи и решит старение. Статьи — это человеческая интерпретация биологии. Она неполная и смещена в сторону успешных результатов.
LLM может ускорить то, что люди уже умеют делать. Но если мы хотим выйти за пределы человеческого понимания, нужно давать моделям не только тексты, а сами биологические данные.
Martin Borch Jensen сформулировал похожую мысль: AI ничего не сделает для longevity, пока мы не начнем делать правильные эксперименты.
Для AI нужны три вещи:
– много обучающих данных;
– достаточно вычислений;
– проверяемый результат, по которому модель получает обратную связь.
В Go результат очевиден: кто-то выиграл. В коде можно запустить тесты. В математике можно проверить ответ. А в longevity мы часто хотим получить ответ на уровне организма, но данные собираем на уровне клеток.
У клетки нельзя спросить, какое у организма давление. Напрямую из данных о генах нельзя узнать, что произойдет с органом или человеком. Виртуальные клетки будут полезны, но они не закрывают вопрос старения организма.
Поэтому Martin предлагает собирать самые медленные и важные датасеты уже сейчас:
– долгие человеческие когорты;
– эксперименты с измерениями на разных уровнях;
– адаптивные клинические испытания, где гипотезы обновляются по мере поступления данных.
На Fireside Eli Berlin из Terray Therapeutics показывал, что связка «свои экспериментальные данные + AI + быстрый лабораторный цикл» уже работает в drug discovery. Но проблема осталась: хорошая разработка лекарств на молекулярном уровне не равна решению старения. Для aging нужны данные и модели, которые связывают молекулы с клетками, тканями, органами и организмом.
На воркшопе The data foundation to AI models Martin рассказал про новый раунд Impetus Grants, который он хочет сфокусировать на AI-enabling datasets. Начать собирать данные как можно скорее, чтобы через несколько лет AI вообще мог помочь.
Обсуждали:
– данные на разных уровнях: от молекул до целого организма;
– мультимодальные данные из одних и тех же образцов;
– долгие когорты людей с регулярными измерениями;
– эксперименты на животных, где есть настоящий проверяемый результат по продолжительности жизни;
– открытые образцы и биобанки;
– общие бенчмарки для биологических моделей.
Если ничего не менять, AI просто ускорит развитие текущей биологии со всеми ее проблемами: узкими датасетами, плохими стимулами, закрытыми результатами, смещением в сторону красивых историй и нехваткой проверяемых результатов.
Считают выступающие на конференции