🚀 Первые публикации студента – большой скачок в науку!
Продолжая рубрику, посвящённую студенческим публикациям, сегодня мы обсудим работу, которая демонстрирует, что современные исследования – это не только эксперименты, но и грамотный подход к выбору метода.
https://doi.org/10.1016/j.jmgm.2025.109134 подготовленная при участии Георгия Малахова, студента 4 курса ФББ, под руководством Дмитрия Алексеевича Карасева из лаборатории структурно-функционального конструирования лекарств ИБМХ, посвящена виртуальному скринингу — процессу поиска молекул, способных взаимодействовать с белками-мишенями.
В настоящее время разработка лекарств немыслима без виртуального скрининга — вычислительного поиска молекул, способных взаимодействовать с белками-мишенями. Этот метод позволяет значительно сократить количество лабораторных экспериментов и сосредоточиться на наиболее перспективных соединениях.
В основе таких предсказаний лежат различные подходы моделирования, в частности:
💚SAR (structure–activity relationship) — один из классических методов, в котором анализируется только структура молекул, а для каждого белка строится отдельная модель;
💚PCM (proteochemometrics) — более современный метод, который дополнительно учитывает характеристики белков и объединяет их в единую модель с молекулами.
На первый взгляд кажется, что PCM должен быть более эффективным, поскольку он использует больше данных. Именно это предположение и стало предметом анализа в рассматриваемой работе.
Почему это важно?
Выбор метода напрямую влияет на ход исследований. Использование более сложной модели, при этом не повышающей точности, приводит к увеличению требуемых вычислительных ресурсов и усложняет интерпретацию результатов. А некорректная валидация может привести к систематическим ошибкам и ложным выводам, что особенно критично при разработке лекарств.
Георгий и его коллеги разработали новую схему валидации двух методов — PCM и SAR. Благодаря ей удалось обнаружить, что стандартные методы оценки могут завышать результаты PCM, создавая иллюзию его преимущества. Однако в действительности PCM не превосходит SAR в поиске мишеней для хорошо изученных белков.
В то же время авторы подчеркивают, что PCM остается незаменимым инструментом в случаях, когда данных мало или когда исследуется новый белок без известных лигандов, поскольку в PCM для построения предсказаний можно использовать информацию о схожих белках.
Статья представляет собой не просто сравнение двух методов, а пример полноценного вычислительного исследования: от сбора и подготовки данных до выбора признаков, построения моделей машинного обучения и, что особенно важно, разработки новой и корректной схемы валидации.
Умение критически оценивать применимость и ограничения метода, а также достоверность получаемых результатов — вот что формирует современного исследователя.
Желаем Георгию и его коллегам новых открытий и успехов в дальнейшей работе! 💻