Как вода превращается в лед? Понимание этого процесса долгое время было ограниченным, потому что он был плохо виден человеческому глазу. Пабло Пьяджи и его команде из Принстонского университета удалось смоделировать процесс на компьютере с такой точностью, как никогда прежде. Разговор о моделировании машинного обучения и о том, как знания об образовании льда могут улучшить модели обработки пищевых продуктов и климата.

ЭЛИАН АЙЗЕНРИНГ ОБЩАЛАСЬ С ПАБЛО ПЬЯДЖИ

Г-н. Пьяджи, вам удалось с помощью алгоритма машинного обучения смоделировать «зарождение льда». Что именно означает этот термин?
Зарождение льда — это самая начальная стадия замерзания воды. Молекулы воды сначала движутся относительно свободно, а в какой-то момент начинают сильнее взаимодействовать и образуют вот такую ​​сеть — лед. Как только ледяной кластер сформирован, он растет. Но самый начальный процесс называется зародышеобразованием, и именно его мы смогли смоделировать.

Как вам пришла в голову идея использовать машинное обучение для моделирования такого рода?
Эта идея существует уже около 15 лет. Однако по-настоящему он стал популярным только около 3 или 4 лет назад, когда несколько программных разработок, таких как библиотеки от Google и Meta, сделали необходимые инструменты машинного обучения (ML) более доступными. Кроме того, у нас только сейчас есть достаточно быстрое оборудование для алгоритмов такого типа.

Сочетание этих двух факторов стало настоящей революцией в этой области, и многие исследователи, занимающиеся молекулярным моделированием, начинают использовать модели машинного обучения. Несколько лет назад я написал проект об их использовании для моделирования зарождения льда впервые с квантовой точностью. Затем я приехал в Принстон, потому что здесь разработали программную библиотеку для использования этого типа алгоритма.

А почему вы решили смоделировать зарождение именно льда, а не другого вещества?
Ну, во-первых, вода — одно из самых распространенных веществ на нашей планете, поэтому образование льда влияет на многие процессы, с которыми мы сталкиваемся каждый день — такие вещи, как осадки и все остальное, что связано с круговоротом воды. Кроме того, вода представляет собой интересный объект для изучения, поскольку она проявляет определенное аномальное поведение. И наконец, здесь, в Принстоне, есть несколько преподавателей, которые на протяжении всей своей карьеры работали с водой и льдом.

Как именно вы создаете эти симуляции с помощью машинного обучения? И в чем конкретная польза такого подхода?
Во-первых, нам нужно было получить межатомные силы между атомами и молекулами. Это величины, которые будут управлять динамикой. Эти силы были выведены из первых принципов, то есть из поведения электронов. После этого мы обучили модель машинного обучения, чтобы она изучила силы, действующие на каждый атом, исходя из положения соседних с ними атомов. Используя эту модель, мы можем затем управлять динамикой и моделировать образование льда.

Огромным преимуществом использования модели машинного обучения является то, что это намного дешевле, чем если бы вам приходилось решать уравнения непосредственно на компьютере — это то, что нам пришлось сделать для нескольких тысяч небольших конфигураций, чтобы создать обучающие данные для модели. Когда у нас есть хорошо обученная модель, мы можем изучать гораздо более крупные системы и моделировать их в течение более длительного периода времени.

Вы говорите, что более крупные системы и более длительный период времени — но разве зародышеобразование не происходит очень быстро и при очень малых размерах?
(Смеется) Вы правы! Размер системы, который можно смоделировать, составляет порядка десятых долей нанометра — в миллиард раз меньше метра — что действительно мало. Однако системы по-прежнему состоят примерно из 300 000 атомов. Время на самом деле тоже довольно короткое, всего несколько десятых наносекунд — в миллиард раз меньше секунды. Тем не менее, это в тысячу раз больше, чем то, что мы могли смоделировать раньше. Итак, это очень существенно.

Можете ли вы объяснить подробнее, что такого революционного в вашем подходе?
Хотя мы не первые, кто смоделировал зарождение льда, нам впервые удалось сделать это с помощью машины обучение (точнее, глубокая нейронная сеть) и то, что мы называем вычислениями из первых принципов. Таким образом, мы смогли достичь очень высокой точности, которая действительно является революционной: до сих пор считалось, что моделирование зарождения льда с квантовой точностью невозможно из-за огромных вычислительных затрат на квантово-механические расчеты. Позволив модели машинного обучения выполнять расчеты, эти затраты можно значительно сократить.

Более того, поскольку наши предсказания основаны на первых принципах, нам не нужно ничего знать о поведении вещества в реальном мире. Это верно для того, что мы изучали (лед), но метод может быть применен и к другим веществам и во многих случаях дает такое же высокое качество предсказания.

До сих пор считалось, что моделирование зарождения льда с квантовой точностью невозможно из-за огромных вычислительных затрат на квантово-механические расчеты. Позволив модели машинного обучения выполнять расчеты, эти затраты можно значительно сократить.

Вычисления из первых принципов — что именно вы имеете в виду?
Первые принципы в физике — это фундаментальные законы природы — самые основные принципы, которые не нужно разбивать или доказано дальше. Исходя из этого, мы рассчитали несколько свойств, связанных с явлением нуклеации. В частности, нас интересовало свойство под названием «скорость зарождения» — скорость, с которой формируется скопление льда. Это свойство можно измерить экспериментально, чтобы мы могли напрямую сравнивать наши предсказания с экспериментами. Возможность не только предсказать это свойство с помощью компьютера, но и сделать это из первых принципов была очень увлекательной.

Почему эксперименты не позволяют наблюдать это явление напрямую?
Как мы уже говорили, зародышеобразование происходит за очень короткое время и при размере всего нанометров. Это означает, что очень трудно увидеть невооруженным глазом, что происходит во время фактического процесса в эксперименте. Таким образом, моделирование очень популярно в этом контексте: оно дает представление о молекулярных механизмах, которое невозможно получить иначе — это верно в целом для изучения кристаллизации и зародышеобразования.

Теперь, когда вы можете моделировать зарождение льда с квантовой точностью, как это можно использовать?
Есть три основные области, в которых это может быть полезно. Во-первых, криоконсервация — идея сохранения живых клеток и тканей за счет быстрого охлаждения образца. Понимание того, как образуется лед в этом контексте, может принести технологическое преимущество. Во-вторых, переработка пищевых продуктов, так как продукты часто замораживают, чтобы раздавать. Более того, знания об образовании льда могут улучшить климатические модели, особенно когда мы сможем смоделировать образование льда в атмосфере.

Как вы этого добьетесь?
Сейчас мы пытаемся понять, как образуется лед в более реалистичных условиях. До сих пор мы только изучали, как образуется лед в чистой воде, но в природе бывает и так, что лед образуется, например, на поверхности частиц. Считается, что это играет решающую роль в образовании льда в атмосфере нашей планеты. И мы могли бы использовать тот же метод, что и для моделирования зарождения льда в воде.

Итак, какой следующий шаг?
Мы только что определили, какие частицы больше всего ответственны за образование льда в атмосфере. Это минерал под названием полевой шпат, которого очень много в земной коре. А теперь мы изучаем, как на этих поверхностях образуется лед. Как интересно было бы разгадать тайну образования льда в атмосфере!

* * *

О ПАБЛО ПЬЯДЖИ
Пабло Пьяджи (*1990) в настоящее время занимает постдокторскую должность научного сотрудника химического факультета Принстонского университета. Он получил докторскую степень. в области материаловедения и инженерии в 2019 году от EPFL (Швейцария). Пьяджи получил стипендию для постдокторской мобильности от Швейцарского национального научного фонда, которая привела его в Принстон. За свою работу по использованию передовых методов моделирования для прогнозирования кристаллической структуры материалов он получил несколько наград, в том числе награду IBM Research Award 2021.