Ничто человеческое не чуждо: Как алгоритмы наследуют наши предрассудки
Сегодня искусственный интеллект сочиняет стихи, выдает музыкальные импровизации и рисует картины. Но, несмотря на всю «машинность», за каждой программой стоит человек, привнося в коды, наборы тегов и базы данных присущие нам стереотипы, предубеждения и погрешности. Например, база ImageNet, оценивая портрет актрисы Сигурни Уивер, присваивает ей тег «гермафродит», а бывшего президента США Барака Обаму классифицирует как антисемита.
По каким принципам изображения попадают в базы данных? Кто и согласно какой логике сопоставляет картинки и теги? И можно ли вообще сделать это однозначно? Экспериментируя с алгоритмами, художница Анна Шустикова заметила, что ко всему, связанному с женщинами и красотой, у них особо предвзятое отношение, и решила подробнее исследовать эту тему.
Художница. Имеет степень бакалавра (Московский физико-технический институт), занималась научной журналистикой и документальной фотографией. Учится в Школе мультимедиа и фотографии имени Родченко. Живет и работает в Москве.
— Работа над проектом началась случайно — как игра с новым инструментом. В прошлом семестре в Школе Родченко мы учились применять алгоритмы машинного обучения для работы с текстом, звуком и изображениями. Обсуждали критические статьи о проблемах, возникающих при создании датасетов для обучения нейронных сетей, и, разумеется, сами пробовали работать с их архитектурами.
Этой весной на слуху была архитектура
Я писала разные слова и фразы, система генерировала изображения, и в какой-то момент результаты стали очень странными.
Contrastive Language-Image Pre-training
Почему алгоритм видел красоту и женщин подобным образом? Причина связана с тем, что он обучался на основе базы ImageNet. Там хранится 14 миллионов картинок с подписями из слов-тегов, обозначающих, что именно изображено, например «стол», «светофор», «кошка», «собака». Но есть и иные подписи: «мужчина», «женщина», «программист», «красавица». И вот к ним возникает множество вопросов.
Дело в том, что слова-теги и картинки сопоставляют люди, которые могут неосознанно передавать личные убеждения. Система тегов заимствована из словарной структуры, и поскольку сама эта структура создана давно, она отражает устаревшие взгляды другого времени.
С каждым словом-тегом или группой синонимов, как заявлено на сайте ImageNet, была сопоставлена хотя бы тысяча картинок, и от того, какие это картинки, будет зависеть репрезентация в базе того или иного понятия. Например очевидно, что слово «женщина» (woman) использовали в описании изображений с обнаженными фигурами, а «красавица» (beauty) обозначало лица улыбающихся белых женщин с укладкой и макияжем. Так алгоритм унаследовал оптику, содержащую определенные предрассудки.
Слово «красавица» (beauty) обозначало лица улыбающихся белых женщин с укладкой и макияжем.
Если разобраться, все кажется очевидным: если у людей есть какие-то предубеждения, вряд ли созданные ими алгоритмы будут объективны и беспристрастны. Все просто, но от осознания этого факта мне стало не по себе. Получается, раньше то, как должна выглядеть женщина, транслировало общество людей, а теперь к ним (с точно такими же предрассудками и гендерными стереотипами) присоединились машины! И мой проект You can touch you can play как раз об этом.
Если у людей есть какие-то предубеждения, вряд ли созданные ими алгоритмы будут объективны.
Название исследования я взяла из строчки песни Barbie Girl группы Aqua. В видео на эту композицию женщина, наряженная куклой Барби, представлена максимально сексуализированно — она не обладает силой воли или собственными желаниями и, кажется, присутствует исключительно ради удовлетворения всех потребностей куклы-мужчины Кена. Я подумала, что цитата отлично иллюстрирует тему проекта — механизм работы machine
с английского — «мужской взгляд», изображение окружающей действительности в искусстве, литературе и так далее с мужской гетеросексуальной точки зрения
Проект You can touch you can play представлен в форме изображений и скульптур, которые можно было увидеть на выставке «Зловещие грезы» в «Электромузее» или сейчас посмотреть на сайте uncannydream.com.
В рамках выставки я решила провести эксперимент и предложить зрителям научить машину видеть женщин иначе. Увы, я не могу повлиять на репрезентацию женщин в самой базе изображений ImageNet, поэтому моя стратегия иная. Сначала я сгенерировала множество телесных изображений по запросу woman и собрала из них небольшой датасет, на основе которого обучила нейронную сеть StyleGAN. Теперь она создает подобные изображения женщин уже сама, не обращаясь к ImageNet. Актуальная задача — сбор новых картинок, которые, как кажется, лучше всего соответствуют слову «женщина». Всех зрителей проекта я приглашаю загрузить такие изображения в гугл-форму. Полученные картинки я использую для создания нового датасета, который позволит переобучить алгоритм.