Google выпустил усовершенствованную систему распознавания изображений бесплатно

Любой, кто использовал Google Photos или даже систему поиска изображений Google Images, знает, что эти сервисы используют хорошие алгоритмы распознавания изображений.

Фотографии и изображения в этих сервисах можно искать не только по описаниям, но и по содержанию (например, «пейзаж», «озеро», «Эйфелева башня»), а также по особенностям фотографии (доминирующий цвет или размер).

Технологии, используемые для этой цели, были созданы на месте в Google. Команда, занимающаяся обучением искусственному интеллекту описывать изображения, работает под кодовым именем. Google Brain и представил свои достижения в 2014 году, показав программу, которая правильно описывает практически каждую картину. В 2015 году этот алгоритм занял второе место в конкурсе Common Objects In Context, организованном Microsoft.

В 2015 году этот алгоритм занял второе место в конкурсе Common Objects In Context, организованном Microsoft

Кто занял первое место в 2015 году? Естественная нейронная сеть содержится в голове человека. Человека выставили на конкурс для сравнения, потому что можно достичь уровня точности описания фотографий лучше, чем человека.

С тех пор разработчики Google продолжили работу над своим алгоритмом. Он постоянно совершенствовался, чтобы различать как можно больше объектов на изображениях. Сегодня они предоставляют его бесплатно - в рамках более крупного проекта, посвященного машинному обучению, который называется TensorFlow , Помимо Google, решения от TensorFlow также используются такими компаниями, как Snapchat.

Алгоритм, представленный в 2014 году, использовал метод классификации изображений, крещенных инженерами Google, как Inception V1 . Его эффективность составила 89,6%. Код, который был доступен сегодня, уже доступен бесплатно с двумя более продвинутыми версиями - это Inception V3 с эффективностью 93,9%.

В этой версии разработчики сосредоточились на правильных и естественных описаниях. Недостаточно сказать, что на фотографии есть пляж, собака и мяч. Необходимо создать предложение, которое аккуратно описывает его, давая также отношения между объектами (например: коричневая собака бежит по пляжу за мячом ).

Те, кто хочет играть сегодня, могут иметь новый алгоритм и даже использовать его в своих приложениях. Помните, однако, что это не традиционное, готовое к использованию приложение: это система обучения, которую необходимо обучать. Примеры того, как это можно сделать, приведены на Сайт GitHub проект.

Кто занял первое место в 2015 году?