Создание новых молекул остается одной из наиболее трудоемких задач современной химии. Разработка лекарственных препаратов или новых материалов требует выстраивания последовательности реакций, для чего ученым часто необходимы десятилетия опыта и стратегического мышления. Традиционные методы планирования, такие как ретросинтетический анализ, предполагают движение от конечной цели к простым исходным веществам, что осложняется необходимостью выбора оптимальных строительных блоков и защиты чувствительных фрагментов молекул. Несмотря на способность современных компьютеров сканировать огромные массивы химических данных, им по-прежнему не хватает стратегического суждения, свойственного опытным специалистам.

Группа исследователей под руководством Филиппа Шваллера из Федеральной политехнической школы Лозанны предложила новый подход к решению этих задач. Ученые разработали систему Synthegy, которая использует большие языковые модели не для генерации структур, а в качестве инструмента логического анализа. Платформа объединяет классические алгоритмы поиска с искусственным интеллектом, способным интерпретировать стратегии химического синтеза на естественном языке. По словам авторов работы, опубликованной в журнале Matter, новый интерфейс позволяет химикам быстрее проверять сложные идеи, заменяя громоздкие системы фильтров обычным общением с моделью.
Основное преимущество нового метода заключается в возможности прямого взаимодействия исследователя с системой. Synthegy позволяет задавать инструкции простыми словами – например, требование сформировать определенное кольцо на ранних этапах или избегать лишних стадий защиты групп. Программное обеспечение генерирует множество возможных путей синтеза, а языковая модель оценивает каждый из них, ранжирует и обосновывает свой выбор. Это помогает ученым быстрее концентрироваться на стратегиях, которые соответствуют их конкретным целям.
Аналогичный принцип применен к изучению механизмов реакций, описывающих перемещение электронов. Программа разбивает процесс на элементарные шаги и анализирует возможные пути развития событий. Языковая модель отсеивает нереалистичные варианты, ориентируясь на заданные условия, температурный режим или экспертные гипотезы. Это позволяет ученым точнее предсказывать поведение химических систем и повышать эффективность экспериментов, минимизируя дорогостоящий метод проб и ошибок.
Эффективность системы была подтверждена в ходе слепого исследования, в котором приняли участие 36 профессиональных химиков. Специалисты провели 368 независимых оценок предложенных маршрутов, и в 71,2% случаев их выводы совпали с результатами работы алгоритма. Исследование показало, что система успешно выявляет лишние стадии и приоритизирует наиболее эффективные решения. При этом более крупные языковые модели продемонстрировали значительно лучшие способности к анализу сложных синтетических цепочек по сравнению с упрощенными версиями.
Разработчики подчеркивают, что их целью не является замена человека искусственным интеллектом. Платформа Synthegy позиционируется как интеллектуальный ассистент, помогающий интерпретировать и уточнять результаты сложных вычислений. Интеграция планирования синтеза и анализа механизмов реакций в рамках единого интерфейса может ускорить поиск новых лекарств и сделать передовые вычислительные инструменты более доступными для научного сообщества. Такой подход сокращает разрыв между теоретическим моделированием и практической работой в лаборатории.