
Полная версия
Кодозависимые. Жизнь в тени искусственного интеллекта
Иэн знал, что работа в Sama изменила жизнь Бенджи и других его друзей. Он подумал, что, возможно, настал и его черед – может, он получит шанс наконец-то распрощаться с тем жилищем, которое ему приходилось делить с шестью другими молодыми людьми, и даже накопить на будущее. Он устроился в Sama и работает там по сей день.
Когда два года назад во время коронавирусного локдауна мы созвонились по видеосвязи, чтобы поговорить о Sama и его работе, Иэн был худеньким парнишкой с застенчивой улыбкой и редкими усиками. Теперь он позвал нас в гости в свой новый дом в самом сердце Киберы, где живет с женой и четырехмесячным ребенком. «Все изменилось», – говорит он.
Район Кибера в центре Найроби – одно из крупнейших в Африке незаконных поселений, или трущоб, где живут беднейшие семьи страны. Этот миллионный город внутри города постоянно пребывает в движении и пронизан духом товарищества, человечности, но и спорами. Мы качаемся на его волнах, как бумажные кораблики. Тропинками здесь служат дорожные колеи и канавы, которые бесполезно пытаться обойти. Пешеходы то и дело вынуждены уступать эти узкие дорожки мототакси бода-бода, настойчиво сигналящим фургонам и детям, играющим в мяч. Мясные лавки и мужские парикмахерские теснятся рядом с салонами красоты и магазинчиками, где продают кур. Во всех этих заведениях используется M-PESA – широко распространенный в Африке цифровой кошелек. В неподвижном воздухе висит тяжелый и резкий запах гнили, жары и людей.
Кибера – это сложный аморфный организм со своими деревнями, племенами и социальными классами. В нем существует негласная иерархия. Выше, в Лайни-Сабе, процветает преступность. Дома там строят из глины и брезента, и в каждом из них живет по шесть-семь человек. Но здесь, внизу, в мини-деревне Гатвикира, можно поселиться в хижине из кровельной стали или даже из кирпича, которую придется делить всего с одним-двумя соседями, а днем ходить по улицам без страха.
Иэн говорит, что киберцы не живут, а выживают, конкурируя между собой за скудные ресурсы – воду, электричество и работу, – которых на всех не хватает. Вместе с тем их объединяет отчаянная преданность соседям и коллективное недоверие к государству. Споры разрешаются местными лидерами, или старейшинами. Того, который уже двадцать лет стоит там у политического руля, называют Baba, то есть Отец.
Я никогда прежде не бывала в Найроби, но выросла в Мумбаи. И почему-то это место – с его духом предпринимательства, каждодневными тяготами и простыми человеческими радостями – напоминает мне о покинутом мною доме.
Когда мы пришли к Иэну, он показал на деревянную лестницу. «Второй этаж», – улыбнулся он. В этих местах мало кто забирается так высоко, поэтому ему было чем гордиться. Мы поднялись по лестнице и, пригнувшись, прошли по узкому импровизированному тоннелю, образованному соседними хижинами, – по настоящему бульвару из дырявых крыш. Приятно пахло мылом. На улице были одни женщины, которые развешивали постиранное белье. У некоторых за спиной были привязаны младенцы. Женщины кивали нам в знак приветствия.
Иэн подвел меня к последнему дому слева. Внутри было чисто и светила одинокая лампочка без абажура. Издалека приглушенно доносился киберский хип-хоп. Здесь же, в неожиданной тишине ревел настольный вентилятор. «Вот мой дом, – сказал Иэн. – Karibu sana». Добро пожаловать.
Использование каждого квадратного сантиметра этого дома было тщательно продумано. В комнате прекрасно умещались диван, два кресла, перевернутый деревянный ящик, который служил столом, и стоящая в углу большая кровать, закрытая занавеской с узором из «огурцов». На полке был расставлен десяток пар кроссовок Иэна, а под ними аккуратно висели бейсболки. У изножья кровати, скрытая от глаз, расположилась плита, на которой готовили еду.
На высоком столике возле большого телевизора стоял ноутбук – своеобразное божество. На нем был открыт Netflix, где беззвучно крутилась реклама голливудских и болливудских фильмов и сериалов. В конце 2020 года Sama заключила партнерство с местными поставщиками телекоммуникационных услуг, чтобы провести в значительную часть Киберы и другие районы широкополосный оптоволоконный интернет и таким образом дать своим агентам возможность в период пандемии работать из дома. К интернету подключили и дом Иэна, благодаря чему он сразу завоевал популярность среди соседей.
«Это мой мобильный офис, – говорит он. – Здесь я просыпаюсь и здесь целый день работаю, а потом у меня еще остается время на учебу. Я хочу освоить программирование». Год назад Иэн получил от Sama стипендию и поступил в колледж, где теперь учится на бакалавра информационных технологий.
В Sama Иэн занимается аннотированием данных: он помогает обучать создаваемые глобальными корпорациями программы искусственного интеллекта, присваивая подробные ярлыки наборам данных, на которых они учатся.
Иэн главным образом размечает изображения для беспилотных автомобилей. Бортовые компьютеры этих автомобилей, которые разрабатываются такими компаниями, как Volkswagen, BMW, Tesla, Google и Uber, должны понимать, как «читать» дорогу – дорожные знаки и разметку, светофоры, пешеходов и деревья, – чтобы управлять движением. Обычно Иэн получает снятые с позиции водителя видеоролики, в которых автомобили едут по незнакомым дорогам, – такие видео напоминают тест на реакцию на опасные ситуации, который ученики автошкол проходят при обучении вождению. В инструкции Иэна просят отметить все объекты, которые он видит, и он заключает в маленькие прямоугольники транспортные средства, людей, животных, деревья, светофоры, пешеходные переходы, мусорные баки, дома, даже небо и облака.
Это напоминает мне игру в «Я вижу», в которую я часами играю с моими маленькими детьми, когда мы куда-нибудь идем или едем. Своими тоненькими голосами они радостно выкрикивают: «Забор!», «Ворота!», «Девочка!», «Щенок!», «Грузовик!» На разметку часового видеоролика у Иэна порой уходит до восьми часов.
Хотя такая работа может показаться однообразной и даже отупляющей, Иэна это не смущает. «Мне очень интересно, потому что я многое узнаю о правилах дорожного движения и дорожных знаках», – сказал он мне. Эти знания пригодятся ему, когда он научится водить машину. Он также размечал интерьеры домов и многочисленные суставы человеческого скелета. Он говорит, что ему не нужно было знать их названия – достаточно было просто отмечать суставы на изображении.
В детстве Иэн любил возиться с проводами и электроникой и мечтал стать инженером-электриком. Когда он окончил школу, ему пришлось обеспечивать мать и сестер, поэтому у него не нашлось денег на учебу в колледже. «Теперь я хочу стать программистом. Когда я пришел в Sama, я думал, что вещи, которые мы делаем, – это мой первый шаг на пути к компании Tesla или даже к самой ее технологии».
При упоминании о Tesla Бенджа встрепенулся: «Я видел этого типа, Илона Маска, по телевизору. Я сказал: “О, это же он! Я строю его машину!”»
В будущем Иэн – как и многие другие жители Найроби, с которыми я встретилась в Кибере и за ее пределами, – мечтает открыть свой бизнес. «Все же, сея хаос на улицах, ты просто делаешь то, что велит тебе время, – говорит он. – Повторяешь все за своими братьями и сестрами. Но когда появляется дело, которое тебя увлекает, твое мировоззрение меняется. И тогда ты перестаешь думать как обычный парень из гетто, как рядовой киберец, и начинаешь мыслить нестандартно».
Бенджа тоже в прошлом был наемным возмутителем спокойствия. Местные политики платили ему, чтобы он закидывал полицию камнями. Но недавно он основал свою компанию, которая проводит пешие экскурсии. Он также владеет куриным магазином, руководит молодежной политической организацией и готовится открыть собственный бар. Он занимается продажей воды и электричества – этот прибыльный бизнес в Кибере контролируют влиятельные картели. В свободное время он работает с молодежью в Линди, одной из киберских деревень, и помогает юным соискателям готовиться к офисной работе. «Я воспитываю корпоративный дух и культуру Sama в людях, которых встречаю в своем районе. И этой работе конца и края не видно».
Иэн говорит, что тоже помог нескольким друзьям устроиться на официальную работу. «Один парень, с которым мы дружили в школе, промышлял карманными кражами – не было и дня, чтобы он ничего не украл, – рассказывает Иэн. – Послушав моего совета, он пришел работать в Sama и совершенно изменился. Укажи я на него и скажи, что он тот самый карманник, вы никогда бы мне не поверили – вы решили бы, что я вас обманываю».
Упоминание о преступности отрезвило Бенджу. Он взглянул на Иэна. «Я хочу в следующем году уехать из Киберы. И хочу, чтобы ты тоже переехал».
«Я так и планирую сделать. Года через три меня в Кибере не будет», – говорит Иэн.
«Тебе стоит поторопиться, – советует Бенджа. – Ты обязан переехать. Я всегда говорил, что руководить командой в Sama для тебя слишком мелко. В этом мире ты можешь быть кем угодно. Слушай, я уверен, тебя ждет большое будущее».
* * *Момбаса-роуд огибает национальный парк Найроби – природный оазис, который делает столицу Кении одним из немногих городских центров, где, проезжая по скоростному шоссе, можно увидеть жирафов, которые пасутся на фоне высоких домов. Именно на этом шоссе находится главный офис Sama, который занимает четыре этажа в здании на территории крупного коммерческого бизнес-парка на 2800 человек. Снаружи возвышается знак с логотипом Sama и рекламным слоганом «Душа ИИ».
Это впечатляющее бетонное здание, стены которого декорированы деталями из гофрированной стали. Оно обставлено мебелью из переработанной древесины и жести и украшено работами местных художников и цветами в горшках. Мне сказали, что такой декор должен напоминать о домах работников в трущобах. Посоветовавшись с первыми сотрудниками компании, дизайнер решил использовать знакомые им материалы, чтобы пространство казалось им красивым и при этом своим.
Здание Sama выглядит эстетично, но все равно остается офисом. Группы агентов – так в Sama называют сотрудников – сидят за компьютерами, размечая всевозможные изображения. Множество кабинетов заполнено молодыми мужчинами и женщинами, которым не исполнилось и тридцати. Они кликают мышками, рисуют на картинках разные фигуры и присваивают объектам ярлыки. Это требует сосредоточенности и аккуратности, но в конце концов все сводится к однообразной игре, где нужно сортировать формы, размечать слова и нажимать на кнопки. Человеку эти задачи кажутся по большей части простыми, даже тривиальными, но для ИИ-систем они новы и сложны. Иногда агенты переговариваются друг с другом, но в основном их внимание направлено на экран. Они тратят по несколько секунд на картинку и сразу после этого переходят к следующей. Из угла доносится хип-хоп. Мышки щелкают в такт музыке. Одна команда агентов делает разметку для автомобилей, которые ездят по дорогам Китая и Японии, другие размечают крупные планы кукурузных полей, спутниковые снимки европейских городов, изображения груженных бревнами фур и женской одежды. Щелкнул, нарисовал, отметил.
Как правило, сотрудники заступают на смену в семь утра и работают по восемь часов. В основном в Sama приходят люди, которые раньше работали неофициально – убирали дома или торговали на улице лепешками-чапати. Поскольку цепочка процессов по разработке ИИ разбита на маленькие фрагменты, многие сотрудники Sama плохо представляют себе, какую коммерческую ценность имеет итоговый продукт, который они помогают создавать (или не представляют этого вовсе). Но они понимают, что участвуют в обучении программ для наиболее продвинутых технологических приложений в сферах навигации, социальных сетей, электронной коммерции и дополненной реальности.
Компания OpenAI, создавшая ChatGPT, привлекала сотрудников Sama для категоризации и разметки десятков тысяч текстовых фрагментов проблемного и натуралистичного содержания, включая описания сексуальной эксплуатации несовершеннолетних, убийств, самоубийств и инцеста. Проведенная работа помогает ChatGPT распознавать, блокировать и фильтровать соответствующий контент.
Работая в группах, в каждую из которых входит около двадцати человек, агенты целый день аннотируют данные, делая лишь два перерыва по строгому графику, чтобы поесть и попить. Им также разрешается ходить в туалет, но в остальное время они должны сидеть за компьютером. Руководители групп более свободны: они передвигаются от стола к столу и наблюдают за работой подчиненных. На конце каждого ряда рабочих мест сидит контролер, который выборочно проверяет качество работы сотрудников.
Когда приходит время обеденного перерыва, агенты с шумом спускаются вниз, в столовую, не обращая внимания на знаки «Соблюдайте тишину!», и выстраиваются в очередь за едой. Сегодня на обед тушеная говядина с приправленным кориандром рисом, шинкованной капустой в соевом соусе и мукимо – кенийским картофельным пюре с овощами. На бумажных тарелках разложены кусочки арбуза. Все едят вместе.
Я взяла себе еду и выбрала длинный стол, за которым оживленно беседовали разные сотрудники, включая агентов, руководителей групп и линейных менеджеров. Менеджер Лилиоса, которой около сорока, оценивает влияние компании на жизнь агентов. Она завела речь о колониализме, британской королевской семье и выборах в Кении. На досуге она пишет хип-хоп-мюзикл о кенийском борце за свободу, который восстал против британцев. «Политика – наша культура. И она имеет родоплеменной характер: каждое племя хочет, чтобы именно его представители оказались у руля, – сказала она. – Но молодежь это не заботит – они просто хотят иметь доступ в интернет, работу и деньги».
После обеда столовая быстро опустела. Я тоже вернулась на этаж, где происходит разметка данных. Один юноша просматривал десятки фотографий зданий со всего мира, оценивая, старинные на них постройки или современные. Он также проходился по нескольким пунктам, описывая каждое изображение: его настроение, насыщенность, резкость и тон. Щелк, щелк, щелк. У него на экране я увидела изображение древнего японского буддистского храма в Токио, стоящего за телеграфной вышкой. Он решил, что на картинке есть и старина, и современность, и выбрал соответствующий вариант.
Как я узнала позже, каждый щелчок помогает обучать алгоритмы, которые классифицируют изображения для платформы Material Bank, где можно искать и заказывать образцы архитектурных и дизайнерских материалов. Цель состоит в том, чтобы создать объективный инструмент для поиска наиболее релевантной информации. В итоге, когда вам понадобится найти конкретный строительный материал или архитектурный стиль, алгоритм будет выдавать вам идеальную подборку полезных примеров.
Как сотрудник понимает, что правильно разметил данные? «Иногда это бывает нелегко, – говорит он. – Тогда приходится полагаться на чутье».
Призрак в машине
В стремлении к созданию разумных машин со сверхчеловеческими способностями нет ничего нового. В одной еврейской легенде, возникшей в начале XX века, рассказывается о Големе – бездушном гуманоиде, в которого пражский раввин Лёв вдохнул жизнь, чтобы защитить местных евреев от антисемитских гонений.
Легко предугадать, что случилось дальше: Голем вышел из-под контроля, и его создателю пришлось уничтожить собственное детище. Эта история перекликается с «Франкенштейном» Мэри Шелли, одним из первых современных романов в жанре научной фантастики, а также с последними новостями об ИИ, в которых все чаще высказываются опасения, связанные с тем, что однажды ИИ может стать неуправляемым.
Существующий сегодня ИИ – скорее не автономная, а вспомогательная технология. Примерно с 2009 года технологический бум подпитывается огромными объемами данных, которые генерируются при нашем интенсивном использовании подключенных к сети устройств и интернета, а также растущей мощностью кремниевых микросхем. В частности, это привело к активному развитию подтипа ИИ, называемого машинным обучением, и в свою очередь его разновидности, глубокого обучения – широких классов методов, с помощью которых компьютерные программы учатся находить статистические взаимосвязи в огромных наборах данных, будь то слова, числа, изображения или строки кода.
Один из способов обучать ИИ-модели выявлять закономерности состоит в том, чтобы показывать им миллионы размеченных примеров. Для этого людям необходимо тщательно аннотировать все используемые данные, чтобы компьютеры могли их проанализировать. Без этого алгоритмы, лежащие в основе беспилотных автомобилей и систем распознавания лиц, останутся слепыми. Они не увидят закономерностей в данных.
Сегодня созданные подобным образом алгоритмы помогают людям принимать решения – или принимают их самостоятельно – в таких сферах, как медицина, уголовное право, общественное благосостояние, ипотечное и потребительское кредитование. Новейший тип ИИ-программ – порождающий ИИ – создает слова, картинки и код. Это превращает ИИ-системы в творческих ассистентов, которые помогают учителям, финансистам, адвокатам, художникам и программистам, становясь их соавторами.
Разрабатывая ИИ, ведущие компании Кремниевой долины конкурируют за лучших специалистов в области компьютерных технологий и платят сотни тысяч долларов молодым кандидатам наук. Но чтобы обучать свои системы и внедрять их в эксплуатацию с помощью реальных данных, эти же корпорации обращаются к таким компаниям, как Sama, где работают целые армии низкооплачиваемых сотрудников, которые обладают базовой цифровой грамотностью, но не имеют стабильной занятости.
Sama не единственная подобная компания в мире. В этой растущей отрасли, капитализация которой к 2030 году, как ожидается, достигнет 17 трлн долларов, работают такие стартапы, как Scale AI, Appen, Hive Micro, iMerit и Mighty AI (которым теперь владеет Uber), а также более традиционные ИТ-компании, включая Accenture и Wipro{10}.
В силу огромного объема данных, которые необходимо разметить ИИ-компаниям, большинство стартапов привлекают рабочую силу из стран, где труд стоит дешево. В результате сотни работников вроде Иэна и Бенджи сортируют и интерпретируют данные, которые затем используются для обучения ИИ-систем.
Вынужденные покинуть свою страну сирийские врачи тренируют медицинские программы, которые помогают диагностировать рак простаты в Британии. Выпускники венесуэльских колледжей, которые не могут найти работу из-за охватившей страну рецессии, сортируют модные товары для интернет-магазинов{11}. Обездоленные женщины из бедного мусульманского района Метиабруз в Калькутте размечают голосовые сообщения для умной колонки Amazon Echo{12}. Своей работой они раскрывают и без того довольно очевидный секрет так называемых систем искусственного интеллекта – технологии не «учатся» самостоятельно, а нуждаются в миллионах людей, которые их на самом деле обучают. Специалисты по обработке данных – бесценные человеческие звенья во всемирной цепочке процессов по разработке и обучению ИИ.
Эта рабочая сила по большей части атомизирована и состоит из самых уязвимых членов общества: социально незащищенной молодежи, женщин с детьми и прочими иждивенцами, меньшинств, мигрантов и беженцев. ИИ-компании и подрядчики, которых они привлекают к сотрудничеству, заявляют, что стремятся включить эти группы в процесс цифровой революции, давая им стабильную и этичную работу, несмотря на их уязвимость. Однако, как я обнаружила, специалисты по обработке данных защищены не более, чем заводские рабочие, их труд остается за кадром, а их заслуги недооцениваются, хотя именно они закладывают фундамент для всей сферы ИИ{13}.
Сегодня это сообщество выходит из тени, и журналисты вместе с учеными начинают понимать, как разбросанные по всему миру работники влияют на нашу повседневную жизнь: чрезвычайно популярный контент, создаваемый чат-ботами вроде ChatGPT, контент, который мы пролистываем в приложениях TikTok, Instagram и YouTube, товары в интернет-магазинах, наши автомобили, даже наша еда – все сортируется, размечается и классифицируется силами специалистов по обработке данных.
Аргентинская исследовательница Милагрос Мисели, работающая в Берлине, изучает этнографию работы с данными в развивающихся странах. Когда она только приступила к исследованию, она не нашла никакой информации об опыте работников ИИ – ни о том, кто занят в этой сфере, ни о том, в чем состоят их задачи. «Как социолог, я увидела провал, – говорит она. – Почти никто не интересуется этими людьми. Кто они? Как они выполняют свою работу? Чем конкретно они занимаются? В каких условиях трудятся?»
Мисели была права – оказалось очень трудно найти компанию, которая разрешила бы мне поговорить со специалистами по обработке данных при минимальном посредничестве руководства. Конфиденциальность часто прописана в контрактах сотрудников в форме соглашений о неразглашении, которые запрещают им напрямую общаться с клиентами и раскрывать информацию о том, кому предоставляют услуги их работодатели. Например, компания Meta, владеющая Facebook, пользуется услугами Sama и просит сотрудников подписывать соглашения о неразглашении. Специалисты по обработке данных зачастую даже не знают, кто их клиент, с какой алгоритмической системой они работают и сколько получают за такой же труд их коллеги из других стран.
В силу специфики своей работы компании вроде Sama, которые платят низкие зарплаты, вынуждают сотрудников соблюдать конфиденциальность и нанимают людей из уязвимых социальных групп, по сути, эксплуатируют неравенство. В конце концов, им нужна дешевая рабочая сила. Хотя в некоторой степени подобная работа позволяет меньшинствам и молодежи из трущоб почувствовать уверенность в себе и обрести надежду на будущее, не стоит забывать, что платят им довольно мало, а сами они не имеют ни возможности диктовать свои условия, ни рычагов давления, ни ресурсов для протеста.
Даже сама цель работы по разметке данных кажется циничной: эти данные используются для обучения ИИ-систем, которые в конце концов заменят именно тех людей, которые обучают их сегодня. Однако за последние два года я побеседовала с десятками работников, и никто из них не осознавал последствия обучения систем, которые в итоге смогут их заменить, и не догадывался, что им платят за ускорение их собственного ухода с рынка.
«Этим людям так нужна работа, что они покорно выполняют все требования клиента. Они согласны не искать в своих задачах смысл и закрывать глаза на этические вопросы. Их учат думать лишь о том, что может понадобиться клиенту», – объяснила мне Мисели. Разработка ИИ – бурно растущий бизнес, и компании, работающие в сфере аннотирования данных, наперегонки снижают цены на свои услуги, снабжая рабочей силой гигантские корпорации и дерзкие стартапы, с которых они берут по несколько центов за задачу.
«Об этом нужно говорить: технологическая отрасль растет благодаря дешевой рабочей силе и наживается на ней».
Работу, а не пособие
Я решила высказать свои опасения Лейле Джане – женщине, которая с самого начала занималась развитием новой отрасли аннотирования данных. В 2018 года она основала Sama как некоммерческую организацию, которая должна обеспечивать работой в цифровой сфере социально незащищенных людей. «Великая пустая надежда Кремниевой долины – автоматизация. Но все вранье – на самом деле за “автоматизацией” стоят люди», – сказала мне Джана в 2019 году. Незадолго до этого у нее диагностировали редкую форму рака – эпителиоидную саркому, и на борьбу с ней она направила все свои предпринимательские навыки.
Лейла выросла в пригороде Лос-Анджелеса в семье индийских иммигрантов. Летом накануне своего семнадцатого дня рождения она получила стипендию, чтобы преподавать английский в Гане, влюбилась в эту страну и на всю жизнь увлеклась африканским континентом. В 2019 году она превратила Sama в коммерческое социальное предприятие, или благотворительную корпорацию, для развития которой привлекла почти 15 млн долларов частных инвестиций – в том числе от компании Meta, ранее известной как Facebook. Но в итоге отношения между ними оказались сложными.
Большинство сотрудников Sama – около трех тысяч – составляет молодежь из Кении. Компания также работает в Уганде и Индии, где в ее штате состоят более образованные, но столь же бедные сотрудники, принадлежащие к мировому прекариату. Компания обслуживает всех корпоративных гигантов Америки – от Google, Facebook, Apple и Tesla до Walmart, Nvidia, Ford и Microsoft. Бенджа, Иэн и их коллеги работают с беспилотными автомобилями Tesla, онлайн-поиском по товарам Walmart, системой Apple Face ID и контент-фильтрами Instagram. Они даже помогали обучать чат-бот ChatGPT, который OpenAI запустила чуть более года назад.


