Компьютер научили раскрашивать черно-белые фотографии
Результат использования нейросети Дала Ryan Dahl/tinyclouds
Программист Райан Дал (один из активистов платформы Node.js) создал систему для автоматической раскраски снимков на основе сверточных нейронных сетей. Описание сети вместе с примерами работ доступны на сайте программиста.
Нейронные сети представляют собой особым образом организованную систему элементов, называемых нейронами. Каждый такой нейрон имеет один или несколько входов, на который подается сигнал. Нейрон обрабатывает сигнал с помощью встроенной функции, передавая дальше уже обработанный сигнал. Нейроны в сетях обычно организованы в слои, причем нейроны каждого слоя связаны только с предыдущим и последующим слоями.
Процесс обучения нейронной сети выглядит так: на вход подается сигнал. Берется сигнал на выходе и сравнивается с тем, который должен был получиться. Например, если мы обучаем нейронную сеть распознавать котов, то мы подаем на вход изображения кота и смотрим на выходной сигнал. Если на выходе получился «кот», то переходим к следующему изображени. Если получился не кот, то поправляем параметры функций каждого нейрона. Обычно это делается от выхода к входу (так называемый обратный метод распространения ошибки).
Сверточные нейронные сети представляют собой особый класс многослойных нейронных сетей. В них слои нейронов делятся на субдискретизирующие и свертывающие и обычно чередующие. Грубо говоря, первый тип слоев предназначен для разбиения задачи на примитивные составляющие и отдельного их анализа, в то время как свертывающие слои служат для «суммирования» полученных наблюдений.
Технически свертывание осуществляется с помощью специальной матрицы весов, которая, двигаясь по слою, суммирует с весами результаты работы нейронов. Именно веса этой матрицы подправляются во время процесса обучения сети. При этом, как показывает опыт последних нескольких лет разработок, сверточные нейронные сети очень хорошо подходят для распознавания именно изображений — в некоторых задачах системы на основе таких сетей уже превосходят людей.
В своей работе Дал использовал такую сверточную сеть с четырьмя слоями (на большее у него не хватило вычислительных мощностей). Работает система с изображениями 224 на 224 пикселя. Для обучения Дал использовал обычные обесцвеченные цветные фотографии.
По словам самого разработчика, система еще далека от идеала: например, при раскраске предметов, которые могут быть разных цветов (скажем, автомобиля) система усредняет цвета. В результате машины на раскрашенных фотографиях оказываются «невероятных ярких» цветов.
Андрей Коняев
Комментарии
но результат смахивает на волшебство.
а сети-шмети это журнализдов туман
Только красочные образы. Отсюда точное соответствие колера, соответствующего только леопардам.
требуется нечто, понимающее, что леопард - пятнистен, имеет лапы, хвост, нос, глаза, светлое брюхо, ... отличить его и их от окружающих листьев, камней - чего и человек делает с трудом, долго соображая и часто с ошибками
иметь миллиярд эталонов со всеми позициями ... - менее интеллектуально, но требует громадного времени и всего, ... но это тож имеется и у человека
Скорее всего у автора старая и плохая цифровая камера, а все они, как известно, воспринимают картинку в монохроме и синтезируют окраску по разнице возбуждения соседних элементов, прикрытых светофильтрами.
Поэтому из монохромной картинки нормального качества (№1) и некачественно распознанного камерой (№2) строится условно качественный вариант (№3).
То есть обучение - это плохое цветное фото с устаревшей камеры.
И все бы хорошо, да только современные камеры имеют достаточно качественные и на порядки менее ресурсоемкие алгоритмы.
Но в мире все возможно. Если процессоры вырастут в мощности с сотни тысяч раз, то вполне возможно, что алгоритм автора будет работать в каждой мыльнице.
Либо, если результат автора действительно лучше современных быстрых алгоритмов, его алгоритм может быть использован для раскраски уникальных научных или технических фотографий где другие методы окажутся беспомощными.
Так же с деревьями, там применяют другие примеры.
Если автору работы , с его-то возможностями, и то.... Размеры картинки удручают. Но сам факт создания системы изумляет.