Нейросеть распознает эстетически привлекательные фотографии

1474210284191661747.jpg

Разработчики Google представили NIMA - глубокую сверточную нейросеть, которая определяет самые качественные фотографии. Алгоритм ее работы, подробно описанный в блоге компании и препринте на arXiv.org, основывается на двух параметрах: технической составляющей фотографии и ее общей эстетике, оцененной человеком.

Современные технологии позволяют делать снимки отличного качества с помощью камеры смартфона и сопутствующих приложений для обработки изображений. Однако, настоящее качество фотоснимка определяется его эстетикой, которая заключается в правильной композиции и хорошо подобранном освещении - параметрах, автоматическое определение которых является сложной задачей. Ранее другая нейросеть Google, Creatism, научилась создавать эстетически качественные фотографии из снимков, сделанных камерами Google Street View.

Новая нейросеть, созданная Хуссейном Талеби (Hossein Talebi) и Пейманом Миланфаром (Peyman Milanfar) из Google Research, сможет определить лучшие фотографии из тех, которые пользователь сделал сам: NIMA (Neural Image Assessment) натренирована выбирать из серии снимков тот, который обычный пользователь-человек посчитал бы максимально качественными и эстетичными. Для обучения нейросети разработчики использовали базу данных AVA (Aesthetic Visual Analysis), содержащую около 200 тысяч фотографий, каждая из которых оценена профессиональными фотографами по шкале от 1 до 10. Исследователи обучили нейросеть угадывать рейтинг изображения на основе его анализа: NIMA правильно угадывала балл профессиональных фотографов-людей с точностью в 80 процентов.
N+1