Искусственный интеллект научился описывать фотографии

Американские учёные обучили компьютер определять, кто и что делает на снимке.

Учёные Стэнфордского университета разработали программу NeuralTalk, которая способна описывать содержание изображения, сообщает The Verge.

Созданием программы руководили директор Лаборатории искусственного интеллекта Стэнфорда Фэй Фэй Ли и аспирант Андрей Карпатый. NeuralTalk работает по схожему принципу, что и технология компании Google «Глубокий сон». В её архиве находится огромное количество изображений. Каждое из них описано ключевыми словами. Когда пользователь загружает в программу своё изображение, то искусственный интеллект анализирует формы и линии на нём, после чего подбирает аналоги из своего архива.

Проанализировав изображение, NeuralTalk выдаёт несколько вариантов его описания, из которых пользователь может выбрать наиболее точно соответствующий действительности:


{"img": "/wp-content/uploads/2015/07/Deep-Dream_01.jpg", "text": ""},
{"img": "/wp-content/uploads/2015/07/Deep-Dream_02.jpg", "text": ""},
{"img": "/wp-content/uploads/2015/07/Deep-Dream_04.jpg", "text": ""},
{"img": "/wp-content/uploads/2015/07/Deep-Dream_05.jpg", "text": ""},
{"img": "/wp-content/uploads/2015/07/Deep-Dream_07.jpg", "text": ""},
{"img": "/wp-content/uploads/2015/07/Deep-Dream_08.jpg", "text": ""}

NeuralTalk ещё далёк от совершенства. Например, «женщина с феном в руке» может идентифицироваться программой как «девочка с пирожным». Первая экспериментальная версия программы была разработана ещё в прошлом году. Недавно учёные выложили в открытый доступ демонстрационную версию. В программу нельзя загружать свои изображения, а можно лишь по простейшим ключевым словам фильтровать фотографии на какую-либо тематику (cat, dog, pizza, man, woman) и рассматривать подписи, созданные искусственным интеллектом.

Новое и Лучшее

37 610

8 843

10 798
11 032
Больше материалов