Все просыпались утром с вопросом «насколько актуально то, чем я буду заниматься в будущем?». Что касается химиков, все мы иногда задаемся вопросом каково будущее химии.

В Chemistry Hall мы хотели ответить на вопрос «Каково будущее химии?» Проверьте ЗДЕСЬ, чтобы увидеть исходный пост.

Этот вопрос особенно актуален для молодого поколения. Смогу ли я через 20 лет найти работу, занимаясь тем, чем занимаюсь сейчас? Сосредотачиваюсь ли я на области науки, которая будет важна через пару десятилетий?

Пока невозможно предсказать будущее химии. Однако весьма вероятно, что любая область науки значительно изменится благодаря развитию искусственного интеллекта.

И этого, скорее всего, не избежать. Компьютеры и роботы никуда не денутся, и они только улучшаются. Но насколько лучше они могут стать в нашей жизни?

Искусственный интеллект и машинное обучение

Вероятно, одна из самых больших революций в науке — это появление компьютеров. То, что сегодня мы считаем само собой разумеющимся, в последние десятилетия увеличило скорость научных открытий.

Сегодня мы почти не можем представить себе синтетическую химию без таких инструментов, как SciFinder или Reaxys. Но как скоро вы сможете ввести молекулу, которую никогда раньше не производили, в поле поиска, и вы получите именно те шаги, которые вам нужно предпринять, чтобы создать ее в лаборатории? За этим может стоять искусственный интеллект (ИИ) и машинное обучение в будущем химии.

Если вы не знакомы с этими терминами, потратьте две минуты на просмотр видео ниже:

https://www.youtube.com/watch?v=f_uwKZIAeM0

Вы можете научить компьютер отличать кошку от собаки.

Использование ИИ для решения этой проблемы не очень полезно, так как люди уже довольно хорошо с этим справляются. Однако, когда дело доходит до одновременного анализа сотен или тысяч точек данных, люди значительно уступают компьютерам.

И, в некотором роде, химия во многом связана с этим.

Как будущее химии может быть определено искусственным интеллектом?

Что вы обычно делаете, когда хотите оптимизировать новый синтетический этап или свойства нового материала?

Погрузитесь в SciFinder, загрузите пару обзоров и 10 исследовательских работ, просмотрите схемы и, исходя из этого, экстраполируйте условия, которые вы хотите протестировать в лаборатории.

Если смотреть на это с точки зрения ИИ, эта процедура, мягко говоря, крайне примитивна. И тем не менее это то, что › 90% химиков-экспериментаторов (как и я) делают ежедневно. И компьютеры со временем станут лучше справляться с этим, в этом нет никаких сомнений.

Очевидно, что в исследовательской работе есть значительный творческий компонент. Идентификация или работа с неизвестными результатами. На ранней стадии ИИ и машинного обучения, на которой мы находимся, люди все еще превосходят машины. Трудно сказать, как долго он будет оставаться таким. Честно говоря, я бы удивился, если бы на это ушло более 10–15 лет.

Будущее химии сейчас

ИИ существует уже несколько десятилетий. С каждым днем ​​все лучше и лучше.

Компьютерный химический синтез впервые был предложен Э. Дж. Кори еще в 1985 году, когда он опубликовал в журнале Science очень простую систему для синтетического анализа в органической химии. Это было за 5 лет до присуждения ему Нобелевской премии, в 1990 году, но до недавнего времени не было больших исследований в области химии такого рода.

Однако в последние пару лет взрыв компьютерной химии только начинается. Это прокомментировал Ф. Пейретти и Дж. М. Брюнеля в 2018 году, но даже с того дня свет увидело множество более поздних работ. Это действительно может определить будущее химии.

Некоторые из ключевых игроков в этом подходе — Эбигейл Дойл, Мэтт Сигман, Ли Кронин или команда Массачусетского технологического института во главе с Тимоти Джемисоном и Клавсом Дженсеном. Мы постараемся сделать краткий обзор некоторых из самых последних лет.

Заранее приносим свои извинения, если пропустили какую-то важную работу. Это не всесторонний обзор, а просто набор некоторых примеров, иллюстрирующих идею.

Параметризация и предсказание

У исследовательской группы под руководством Мэтью Сигмана из Университета Юты есть множество совместных проектов, основанных на параметризации и прогнозировании.

Этот метод основан на применении предиктивного статистического анализа к химическим реакциям. Они отходят от расчетов ММ и DFT к абстрактным свойствам или параметрам лигандов или катализа. Затем они проводят статистику, сравнивая эти параметры с экспериментальными результатами, полученными с каждым лигандом или катализатором. Они придумывают модели, которые позволяют предсказать, как поведут себя другие лиганды, катализаторы или субстраты.

Это, видимо, работает!

Недавним примером является сотрудничество с Марком Биско, в котором они показывают, как параметризация лиганда позволяет находить лучшие лиганды для выполнения энантиодивергентного (вы можете выбрать нужный энантиомер в качестве продукта, просто настроив лиганд) Pd-катализируемая перекрестная связь C-C реакция.

Целостные предсказания энантиоселективности

В 2019 году Рид и Сигман сообщили о новаторском отчете о модели целостного предсказания энантиоселективности в асимметричном катализе.

Как мы уже говорили во введении, большая часть работы химика-синтетика состоит в том, чтобы просмотреть литературу, чтобы выбрать некоторые условия реакции для тестирования на новом субстрате. Очевидно, что хорошо запрограммированный компьютер должен выполнять эту работу лучше, чем человек, особенно при наличии сотен или тысяч возможных условий.

Это область, в которой Сигман является пионером, и в результате их усилий уже появились удивительные тенденции, которые позволяют делать очень важные прогнозы.

Многие говорят, что статистика, ИИ и машинное обучение могут стать будущим химии.

Машинное обучение для прогнозирования химических реакций

Как объясняет группа Дойла на своем веб-сайте, машинное обучение (которое в основном представляет собой статистику и информатику) может стать инструментом, который решит проблемы многомерности (что делает сложные проблемы невозможными для анализа человеком), присущие химической реакционной способности и структуре.

В начале 2018 года Дойл сообщил в журнале Science о совместной работе с Merck, в ходе которой они разработали химическую модель на основе машинного обучения. Они использовали модель случайного леса, чтобы предсказать исход реакций кросс-сочетания C–N.

Изучение влияния добавок с помощью машинного обучения

В основном они изучали влияние добавки (семейство изоксазолов) на одну из наиболее полезных реакций — аминирование Бухвальда-Хартвига.

Набор из 15 различных изоксазолов использовали в качестве «обучающего набора» (для получения линейных регрессий), а затем еще 8 из них использовали в качестве «тестового набора». Некоторые примеры показаны ниже вместе с соответствующими регрессиями. Как видите, данные, полученные с помощью тестового набора, хорошо коррелируют с «обучающей регрессией». Это означает, что достигнут хороший уровень предсказания.

Обучение компьютеров фторированию

Позже в том же году та же группа сообщила об аналогичной концепции, в которой удивительная комбинация экспериментов HTS (высокопроизводительный скрининг) и машинного обучения позволила разработать прогностическую модель для фторирования спиртов с помощью PyFluor. Это привело к значительному расширению области, о которой ранее сообщали Дойл и его коллеги.

Слева показан схематический пример типа запуска экспериментов HTS, показывающий, как изменения в источнике фторида и основании резко влияют на выходы реакции.

На правом графике показаны все результаты наблюдаемой доходности по сравнению с прогнозируемая доходность. Получаются очень хорошие корреляции.

Роботы заберут наши рабочие места?

Если под «нашими работами» вы подразумеваете исключительно техническую лабораторную работу химика, то ответ скорее всего.

Но не поймите меня неправильно, я с оптимизмом смотрю в будущее химии. Нам нужно использовать такие инструменты, как ИИ или робототехника. Они здесь, чтобы освободить нас от самой скучной рутинной части исследований, чтобы мы могли сосредоточиться на творчестве для решения важных проблем.

По этому конкретному вопросу несколько исследовательских групп работали над проектированием и созданием химического робота.

Химия будущего: объединение планирования ИИ с роботизированным синтезом

Тимоти Ф. Джемисон и Клавс Ф. Дженсен с химического факультета Массачусетского технологического института (MIT).

В 2018 году они представили в Science свою первую версию робота для химического синтеза. Основной идеей этой машины является сложная система проточного химии, управляемая программным обеспечением, которое позволяет оптимизировать несколько переменных. Таким образом, вы можете буквально ввести параметры, которые хотите оптимизировать, загрузить реагенты и дождаться завершения оптимизации. Тогда в считанные дни объем вашей трансформации также будет выполнен.

Вот как выглядит этот робот-синтез:

Перенесемся всего на один год вперед, и вот этот зверь там, где они есть:

Та же команда Массачусетского технологического института опубликовала пару дней назад совершенно новую версию этого химического робота.

Теперь речь идет не только об химической оптимизации. Синтетическая система полностью интегрирована с программным обеспечением для планирования ИИ.

Это программное обеспечение для искусственного интеллекта основано на том, что мы обсуждаем на протяжении всей статьи: получение точек данных из тысяч опубликованных реакций, передача их сложным алгоритмам и получение оптимальных синтетических путей для нового или соответствующего целевого соединения.

Можно себе представить, что третье поколение этой системы может даже предложить свои собственные идеи о том, что синтезировать. Кто знает, как далеко мы от этого…

Будущее химии: открытия, поддерживаемые химическими роботами

Последний пример в основном основан на системах проточной химии. Но некоторые реакции не подходят для протекания. Традиционный лабораторный органический синтез — это то, что группа Кронин хотела «оцифровать».

Лерой Кронин и его коллеги опубликовали в 2018 году свои взгляды на то, как мы можем использовать алгоритмы для помощи в открытиях с помощью химических роботов. Вскоре после этого, в начале 2019 года, эта группа, работающая в Университете Глазго, сообщила о некоторых своих усилиях по созданию такого робота.

Chemputer Кронина представляет собой модульную роботизированную платформу, которая позволяет выполнять четыре основных этапа органической химии: реакцию, обработку, выделение и очистку.

Для этого он оснащен насосами, реакторами, системами фильтрации, автоматическими делительными воронками, ротационным испарителем и, конечно же, программным обеспечением для управления всем процессом.

Следующее видео позволяет получить представление о том, как работает эта система:

https://www.youtube.com/watch?v=WvEkm7ZBKSc

Эта новая система, основанная на «химическом языке программирования», позволила синтезировать несколько важных с медицинской точки зрения молекул, таких как силденафил или руфинамид.

Компьютерный полный синтез сложных натуральных продуктов

Можно возразить, что мишени, выбранные для тестирования описанных выше синтетических систем, не очень высокой сложности. Типичные синтетические проблемы натуральных продуктов, решаемые большими группами, гораздо сложнее.

Но компьютеры также могут помочь нам в этом! Вопрос лишь в том, насколько хорошо мы можем интегрировать высокоуровневые вычисления на основе ДПФ с методами, описанными выше. Такого рода интеграция будет актуальна в будущем химии.

Примером такого предсказания является недавний синтез паспалина А и эминдола РВ Тимоти Ньюхауса и его сотрудников.

В этой работе авторы предусмотрели биосинтетический подход к этим природным структурам, а также 3 возможных потенциальных промежуточных продукта. Все эти 3 промежуточных продукта в принципе могут привести к желаемым натуральным продуктам.

Но выбранный промежуточный продукт должен циклизоваться с соответствующей селективностью. В противном случае синтез соответствующего интермедиата был бы напрасным (проблема, с которой сталкивался каждый химик, занимающийся синтезом натуральных продуктов).

Как вы можете видеть ниже, предлагаемые структуры довольно похожи, для человека было бы почти азартной игрой предсказывать исход каждой циклизации. Но структурные различия затрудняют их синтез из общего промежуточного соединения.

Первые шаги в области химии натуральных продуктов будущего

Чтобы решить эту проблему, группа Ньюхауса предсказала, с помощью вычисления DFT, какой из трех циклов будет циклироваться так, как они хотели. Получив теоретический ответ, они приготовили только этот промежуточный предшественник (сэкономив 2/3 необходимых синтетических усилий). В итоге он повел себя так, как и предполагалось, и они завершили полный синтез.

До Ньюхауса группа Ричмонда Сарпонга и его сотрудников уже применяла аналогичную концепцию. В 2015 году они сообщили об использовании сетевого анализа для управления ретросинтезом очень сложных натуральных продуктов.

Группа Сарпонга итеративно применила сетевой анализ на ранних этапах синтетического планирования вайсаконитина D и лильестрандинина, опубликованных в Nature. Это позволило придумать эффективное отключение

Еще недавно та же группа исследователей опубликовала в J. Являюсь. хим. Soc. общий синтез дитерпеноидного алкалоида аркутинидина.

Этому синтезу также способствовал сетевой анализ, вдохновленный первоначальной работой, уже выполненной E. Дж. Кори еще в 80-х.

Я хотел закончить этим последним набором примеров, потому что они являются отличной демонстрацией того, что, по моему мнению, было бы идеальным будущим ИИ и вычислений в органической химии.

Искусственный интеллект должен не заменить нас как ученых, а скорее освободить нас от рутинных и скучных задач, позволяя нам сосредоточиться на том, что важно: на решении более сложных и важных задач.

Я хотел бы услышать ваше мнение об ИИ и компьютерах и о том, как они повлияют на то, как мы видим химию и подходим к ней (и науке в целом). Ведь будущее химии в наших руках.