В России создали базу данных минералов для анализа ИИ

На модерации Отложенный

Ученые из Института AIRI, компании Sber AI, МГУ и Минералогического музея им. А.Е. Ферсмана объединили свои усилия, чтобы создать базу данных, состоящую из тысячи изображений образцов горных пород. Новая база для обучения искусственного интеллекта поможет классифицировать минералы, определять их размеры и оценивать качество работы алгоритмов компьютерного зрения в геологических задачах. Соответствующие исследования были опубликованы в журнале Computers & Geosciences, подробности кратко изложены пресс-службой Института AIRI порталу Хабр.

В природе существует около 6 тысяч различных видов минералов, однако описаны лишь несколько сотен из них, которые имеют важное значение для промышленности и являются породообразующими. Анализ минералов может занять от 30 минут до нескольких дней, а также не все минералы изучены равномерно.

Первым и наиболее распространенным методом анализа горных пород и минералов является визуальная диагностика, но она не всегда точна из-за человеческого фактора.

Сегодня многие научные группы проводят исследования методов визуальной диагностики с использованием искусственного интеллекта (ИИ) для уменьшения процента ошибок при внешней оценке образцов. Диагностика с использованием ИИ помогает экономить время на рутинных задачах и исключать из процесса более дорогостоящие методы, например спектроскопию или химический анализ.

Также в этой сфере отсутствует общепринятая система сравнительного анализа. Для решения этой проблемы научными группами Fusion Brain и «Глубокое обучение в науках о жизни» Института искусственного интеллекта AIRI был создан проект MineralImage5k, к которому подключились специалисты из Sber AI и МГУ имени Ломоносова. В результате была создана база данных из 44 тысяч изображений более чем 5 тысяч видов минералов. Эта база данных содержит набор подмножеств для классификации, сегментации и оценки размеров образцов. Работа была проведена при поддержке Минералогического музея им. А.Е. Ферсмана, где хранится более 170 тысяч образцов горных пород и минералов. В будущем коллектив намерен расширить набор данных.