Химические науки в эпоху ИИ


Пионерские исследования в области приложения алгоритмов искусственного интеллекта в решении химических задач проводятся в ИОХе на протяжении нескольких лет и в настоящее время сформирован кадровый потенциал, опыт работ, научный задел и инфрастуктура. Результаты работ опубликованы в ведущих мировых научных журналах, и в настоящее время сформирован комплексный проект по применению передовых методов ИИ в химии. В ИОХ РАН впервые в России была проведена Научная конференция-школа «Искусственный интеллект в химии и материаловедении» ("Artificial Intelligence in Chemistry and Materials Science"), 18–20 декабря 2023 г., Москва, https://zioc.ru/science/conf/aichem2023


Накопленные компетенции: В рамках проекта были разработаны и усовершенствованы уникальные компетенции в области применения искусственного интеллекта для решения сложных задач химии. Проект охватывает широкий спектр приложений, от анализа микрофазовых переходов в ионных жидкостях до распознавания наночастиц, анализа катализаторов на микроскопическом уровне и автоматической интерпретации спектров. Ключевой особенностью является использование машинного обучения и глубокого обучения для анализа сложных данных, таких как электронно-микроскопические изображения и масс-спектрометрические данные.

Используемые методы ИИ: Проект активно использует методы глубокого обучения, включая сверточные нейронные сети и алгоритмы компьютерного зрения, для обработки и анализа больших объемов данных. Разработаны методы для автоматизации идентификации структур, классификации присутствующих элементов и определения молекулярных формул. Эти подходы позволяют значительно повысить точность и эффективность анализа.

Фундаментальные результаты: Важным фундаментальным результатом является разработка адаптированных для химических задач алгоритмов, создание модульного комплекта программ и наборов данных для обучения и тестирования моделей ИИ, что позволяет лучше понять сложные химические системы. Также было достигнуто более глубокое понимание механизмов действия катализаторов и взаимодействия ионов в различных средах.

Практические и прикладные результаты: Проект привел к разработке новых инструментов и методик для анализа и синтеза химических соединений. Одним из примеров является использование ИИ для предсказания разрушения материалов, что имеет огромное значение в материаловедении и производстве. Важнейшей частью проекта является создание высокоэффективных катализаторов нового поколения для тонкого органического синтеза.

Перспективы проекта: Проект демонстрирует значительный потенциал для дальнейшего развития и применения ИИ в химии. Планируется расширение исследований в области нанотехнологий, катализа и разработки новых материалов. Особое внимание будет уделено углублению понимания молекулярных механизмов и усовершенствованию методов анализа данных для еще более точных и эффективных исследований.


Научные исследования и практические проекты


Исследование "Toward Totally Defined Nanocatalysis: Deep Learning Reveals the Extraordinary Activity of Single Pd/C Particles" [DOI: 10.1021/jacs.2c01283] направлено на разработку подхода к полностью определенному нанокатализу с использованием глубокого обучения для изучения активности отдельных частиц Pd/C. Решаемая химическая проблема — это создание более эффективных и точно определенных каталитических систем на основе наночастиц. Использовались методы глубокого обучения для анализа электронных микрофотографий, что позволило детально исследовать каждую частицу катализатора и оценить её активность.

Главное научное достижение заключается в разработке метода, позволяющего получить подробное представление о каждой частице нанокатализатора и оценить их каталитическую активность. Это исследование значительно влияет на понимание и развитие нанокатализа, предоставляя новые перспективы для разработки высокоэффективных катализаторов и понимания их работы на микроскопическом уровне.


В работе "Fully Automated Unconstrained Analysis of High-Resolution Mass Spectrometry Data with Machine Learning" [DOI: 10.1021/jacs.2c03631] отработано применение машинного обучения для полностью автоматизированного анализа данных масс-спектрометрии высокого разрешения. Основная проблема, решаемая в статье, связана с анализом сложных смесей и выявлением индивидуальных соединений в них.

В статье использовались методы глубокого обучения для деизотопирования и анализа тонкой изотопной структуры ионов, что позволяло автоматически определять молекулярные формулы соединений. Главное научное достижение заключается в разработке метода, обеспечивающего детальный и неограниченный анализ всего масс-спектра, что значительно ускоряет процесс идентификации и классификации молекулярных составляющих сложных смесей.

Исследование вносит важный вклад в область масс-спектрометрии и химического анализа, предлагая новые возможности для автоматизированного анализа сложных смесей, что имеет большое значение для многих областей науки и промышленности.


В проекте "Time-Resolved Formation and Operation Maps of Pd Catalysts Suggest a Key Role of Single Atom Centers in Cross-Coupling" [DOI: 10.1021/jacs.3c00645] исследована роль одиночных атомных центров в реакциях кросс-сочетания, используя время-разрешенные карты формирования и работы катализаторов на основе палладия. В работе исследуется механизм активности катализаторов на микроскопическом уровне, особенно в контексте динамической природы наночастиц и одиночных атомов.

В исследовании используются методы электронной микроскопии и анализа с помощью нейронных сетей для наблюдения за поведением одиночных атомов и наночастиц в процессе каталитической реакции. Основное научное достижение заключается в определении роли одиночных атомных центров в реакциях кросс-сочетания.

Результаты исследования важны для понимания механизмов нанокатализа и развития новых каталитических систем. Показано, что детальный анализ на атомном уровне может привести к новым открытиям в области катализа и синтеза соединений.


Работа "Neural Network Analysis of Electron Microscopy Video Data Reveals the Temperature-Driven Microphase Dynamics in the Ions/Water System" [DOI: 10.1002/smll.202007726] посвящена анализу динамики микрофаз в системах ионные жидкости/вода с использованием видеоданных электронной микроскопии и нейронных сетей. Целью исследования является изучение поведения микродоменов в смесях различных ионных жидкостей с водой при воздействии температуры.

Применение методов компьютерного зрения и глубокого обучения позволило автоматизировать анализ видео, полученного с помощью электронной микроскопии, и качественно оценить изменения морфологии систем, состоящих из ионных жидкостей и воды при нагревании. Основное научное достижение заключается в разработке методики, обеспечивающей детальный анализ микрофазовых переходов и динамики микродоменов в реальном времени.

Исследование значительно влияет на понимание процессов, происходящих в ионных жидкостях, и раскрывает новые перспективы для их применения в различных областях науки и техники.


Использование возможностей нейронных сетей для анализа расположения наночастиц с целью выявления дефектов в слоистых углеродных материалах проведено в работе "Deep neural network analysis of nanoparticle ordering to identify defects in layered carbon materials" [DOI: 10.1039/d0sc05696k]. В данном проекте решается задача определения дефектов в углеродных материалах, что имеет ключевое значение для различных применений, включая электронику и катализ.

Были использованы методы машинного обучения для анализа изображений, полученных с помощью электронной микроскопии. Это позволило автоматизировать процесс идентификации и классификации дефектов. Основное научное достижение заключается в разработке методики, позволяющей с высокой точностью и эффективностью определять наличие и характер дефектов на поверхности углеродных материалов.

Исследование вносит значительный вклад в науку о материалах и нанотехнологии, предлагая новый подход к анализу и улучшению качества углеродных материалов. Оно открывает перспективы для разработки более эффективных материалов с заданными свойствами и для более глубокого понимания взаимосвязи между структурой материала и его свойствами.


Термографические исследования в сочетании с анализом термограмм методами машинного обучения были использованы в проекте "Integration of thermal imaging and neural networks for mechanical strength analysis and fracture prediction in 3D-printed plastic parts" [DOI: 10.1038/s41598-022-12503-y] для определения и прогнозирования механической прочности пластиковых деталей, изготовленных методом 3D-печати.

Разработка алгоритма, позволяющего с высокой точностью предсказывать время разрушения пластиковых изделий, основываясь на термографических данных, является основным научным достижением данного проекта. Разработанная методика объединяет традиционные механические испытания с инновационными методами анализа данных, что расширяет возможности контроля качества и безопасности изделий, полученных аддитивными методами производства.

Результаты исследования важны для развития технологий 3D-печати и материаловедения, предоставляя новые инструменты для анализа и улучшения механических свойств пластиковых изделий, что открывает новые перспективы в машиностроении.


Статья "Digital biology approach for macroscale studies of biofilm growth and biocide effects with electron microscopy" [DOI: 10.1039/d3dd00048f] посвящена решению задачи анализа биопленок с помощью электронной микроскопии. В статье рассматривается использование автоматизированной сканирующей электронной микроскопии (SEM) в сочетании с комплексной программной системой, использующей нейронные сети для глубокого анализа биопленок. Применение глубокого обучения позволило провести временной анализ изображений биопленок на макромасштабе, полученных с помощью SEM, что дало возможность анализировать микроскопические данные на видимой человеческому глазу площади биопленок.

Важнейшим научным достижением статьи является разработка метода для автоматизированного анализа изображений, полученных с помощью SEM, и демонстрация его применения в исследованиях, где необходим анализ больших объемов данных микроскопии. Этот подход позволил обработать статистические данные о более чем 70 000 отдельных бактериальных клетках, что значительно быстрее, чем традиционный ручной анализ.

Научное значение этой статьи заключается в том, что она предлагает новый способ количественного изучения биопленок и исследования воздействия антимикробных соединений на биопленки. Это является основой дальнейших исследований в области микробиологии и разработки новых антибиотиков, особенно в контексте растущего кризиса антибиотикорезистентности.


Исследование "Boosting the generality of catalytic systems by the synergetic ligand effect in Pd-catalyzed C-N cross-coupling" [DOI: 10.1016/j.jcat.2023.115240] затрагивает важную проблему в химии катализа – разработка универсальных каталитических систем на основе палладия, использующих синергетический эффекта лигандов в реакциях кросс-сочетания по Бухвальду-Хартвигу. В статье основное внимание уделяется разработке универсальной каталитической системы, основанной на комбинации N-гетероциклических карбенов (NHC) и фосфиновых лигандов, и оценке её эффективности в кросс-сочетании по Бухвальду-Хартвигу.

В работе были использованы методы машинного обучения для анализа данных о ходе реакции и выявления ключевых факторов, влияющих на эффективность каталитической системы. Основным достижением проекта является разработка универсальной каталитической системы с высокой эффективностью, что подтверждено экспериментальными данными.

Значительный вклад данного исследования в область катализа заключается в разработке новых подходов к дизайну эффективных каталитических систем с применением машинного обучения для оптимизации их свойств. Такие методы могут служить основой для более рациональной разработки новых каталитических систем с высокой эффективностью.


Методы автоматизированного распознавания каталитически активных наночастиц палладия на электронных микрофотографиях разработаны в проекте "Automated Recognition of Nanoparticles in Electron Microscopy Images of Nanoscale Palladium Catalysts" [DOI: 10.3390/nano12213914]. В работе рассматривается задача анализа изображений, полученных с помощью сканирующей электронной микроскопии и идентификации наночастиц на этих изображениях. Применялись различные методы компьютерного зрения и глубокого машинного обучения для автоматического распознавания и анализа наночастиц. Основное научное достижение статьи заключается в разработке и сравнении различных методов для эффективного и точного распознавания наночастиц.

В статье подчеркивается важность этого исследования для улучшения понимания структуры и свойств наноразмерных катализаторов, что открывает перспективы для дальнейших исследований в области нанотехнологий и катализа.


Проект "Analyzing ionic liquid systems using real-time electron microscopy and a computational framework combining deep learning and classic computer vision techniques" [DOI: 10.1016/j.molliq.2023.121407] посвящен анализу систем ионных жидкостей с использованием электронной микроскопии в реальном времени и вычислительной системы, объединяющей методы глубокого обучения и классического компьютерного зрения. Основная задача, решаемая в статье, связана с анализом динамических процессов в ионных жидкостях с помощью электронной микроскопии и разработкой эффективных алгоритмов для обработки полученных видеоданных.

В работе используются алгоритмы глубокого обучения и компьютерного зрения для обработки видео, полученных в ходе исследований методом электронной микроскопии, что позволяет проводить детальный анализ динамических процессов на микроуровне. Основное научное достижение проекта заключается в разработке комплексного метода анализа, который позволяет изучать структурные и динамические свойства ионных жидкостей с высокой точностью.

Исследование вносит существенный вклад в область изучения ионных жидкостей, предлагая новый подход к анализу динамических процессов на микроуровне, что может быть использовано для дальнейших исследований в данной области.


Анализ степени упорядоченности наноматериалов и расположения наночастиц с использованием данных электронной микроскопии выполнен в работе "Electron microscopy dataset for the recognition of nanoscale ordering effects and location of nanoparticles" [DOI: 10.1038/s41597-020-0439-1]. В данном проекте решена важная задача распознавания и анализа наноструктурированных материалов, особенно в контексте катализаторов на основе палладия.

Основное научное достижение заключается в создании и анализе обширного набора данных, который включает изображения упорядоченных и неупорядоченных наноматериалов. Это позволяет лучше понять структуру и свойства таких материалов. Исследование имеет большое значение для развития методов анализа наноматериалов и может быть использовано для дальнейших исследований в области нанотехнологий и катализа.


Список публикаций

1. Eremin D. B., Galushko A. S., Boiko D. A., Pentsak E. O., Chistyakov I. V., Ananikov V. P., "Toward Totally Defined Nanocatalysis: Deep Learning Reveals the Extraordinary Activity of Single Pd/C Particles", J. Am. Chem. Soc., 2022, 144, 13, 6071-6079. https://doi.org/10.1021/jacs.2c01283 (IF = 15.0, Q1).

2. Boiko D. A., Kozlov K. S., Burykina J. V., Ilyushenkova V. V., Ananikov V. P., "Fully Automated Unconstrained Analysis of High-Resolution Mass Spectrometry Data with Machine Learning", J. Am. Chem. Soc., 2022, 144, 32, 14590-14606. https://doi.org/10.1021/jacs.2c03631 (IF = 15.0, Q1).

3. Galushko A. S., Boiko D. A., Pentsak E. O., Eremin D. B., Ananikov V. P., "Time-Resolved Formation and Operation Maps of Pd Catalysts Suggest a Key Role of Single Atom Centers in Cross-Coupling", J. Am. Chem. Soc., 2023, 145, 16, 9092-9103. https://doi.org/10.1021/jacs.3c00645 (IF = 15.0, Q1).

4. Kashin A. S., Boiko D. A., Ananikov V. P., "Neural Network Analysis of Electron Microscopy Video Data Reveals the Temperature-Driven Microphase Dynamics in the Ions/Water System", Small, 2021, 17, 24, 2007726. https://doi.org/10.1002/smll.202007726 (IF = 13.3, Q1).

5. Boiko D. A., Pentsak E. O., Cherepanova V. A., Ananikov V. P., "Electron microscopy dataset for the recognition of nanoscale ordering effects and location of nanoparticles", Scientific Data, 2020, 7, 101. https://doi.org/10.1038/s41597-020-0439-1 (IF = 9.8, Q1).

6. Boiko D. A., Pentsak E. O., Cherepanova V. A., Gordeev E. G., Ananikov V. P., "Deep neural network analysis of nanoparticle ordering to identify defects in layered carbon materials", Chem. Sci., 2021, 12, 7428-7441. https://doi.org/10.1039/d0sc05696k (IF = 8.4, Q1).

7. Grebennikov N. O., Boiko D. A., Prima D. O., Madiyeva M., Minyaev M. E., Ananikov V. P., "Boosting the generality of catalytic systems by the synergetic ligand effect in Pd-catalyzed C-N cross-coupling", J. Catal., 2024, 429, 115240. https://doi.org/10.1016/j.jcat.2023.115240 (IF = 7.3, Q1).

8. Boiko D. A., Kashin A. S., Sorokin V. R., Agaev Y. V., Zaytsev R. G., Ananikov V. P., "Analyzing ionic liquid systems using real-time electron microscopy and a computational framework combining deep learning and classic computer vision techniques", J. Mol. Liq., 2023, 376, 121407. https://doi.org/10.1016/j.molliq.2023.121407 (IF = 6.0, Q1).

9. Boiko D. A., Sulimova V. V., Kurbakov M. Y., Kopylov A. V., Seredin O. S., Cherepanova V. A., Pentsak E. O., Ananikov V. P., "Automated Recognition of Nanoparticles in Electron Microscopy Images of Nanoscale Palladium Catalysts", Nanomaterials, 2022, 12, 3914. https://doi.org/10.3390/nano12213914 (IF = 5.3, Q1).

10. Boiko D. A., Korabelnikova V. A., Gordeev E. G., Ananikov V. P., "Integration of thermal imaging and neural networks for mechanical strength analysis and fracture prediction in 3D-printed plastic parts", Sci. Rep., 2022, 12, 8944. https://doi.org/10.1038/s41598-022-12503-y (IF = 4.6, Q1).

11. Kozlov K. S., Boiko D. A., Detusheva E. V., Detushev K. V., Pentsak E. O., Vereshchagin A. N., Ananikov V. P., "Digital biology approach for macroscale studies of biofilm growth and biocide effects with electron microscopy", Digital Discovery, 2023, 2, 1522-1539. https://doi.org/10.1039/d3dd00048f.(IF = 6.2, Q1).

12. Kurbakov M. Yu., Sulimova V.V., Kopylov A.V., Seredin O.S., Boiko D.A., Galushko A.S., Cherepanova V.A., Ananikov V.P., "Determining the orderliness of carbon materials with nanoparticle imaging and explainable machine learning", Nanoscale, 2024, 16, 13663-13676. https://doi.org/10.1039/D4NR00952E (IF = 5.8, Q1).

>