
Полная версия
Нейросети. Выстрой свою систему из 5 уровней автоматизации
• в 2024 году дата-центры глобально потребляли 415 ТВт·ч в год,
• это примерно электропотребление крупной развитой страны,
• к 2030 году потребление может удвоиться и более, приближаясь к 900–1000 ТВт·ч, что сопоставимо с потреблением целых регионов мира.
Ключевой парадокс:
ИИ продаётся как «цифровая магия», но за кулисами – это очень материальная история про мегаватты, кабели, бетон, территорию и воду для охлаждения.
Отсюда несколько выводов:
• Страны с дешёвой и устойчивой генерацией (гидро, атом, геотермальная) получают стратегическое преимущество.
• Регионы с дефицитом энергии будут вынуждены ограничивать развитие ИИ-инфраструктуры или импортировать мощности.
• Крупные ИИ-компании уже заключают прямые контракты на поставку энергии и даже инвестируют в собственные энергетические проекты, включая атомную генерацию и SMR (малые модульные реакторы).
По сути, электричество становится тем, чем нефть была в XX веке – базой любой технологической гонки.
Уровень 2. Видеокарты и дата-центры – новые нефтяные вышкиЕсли электричество – это «нефть», то GPU и дата-центры – это нефтяные вышки и НПЗ.
Сегодня рынок дата-центровых GPU растёт двузначными темпами, оценивается в сотни миллиардов долларов, и к 2030 году может практически удвоиться.
При этом на рынке специализированных чипов для ИИ (GPU, ускорители) доминирует NVIDIA, контролируя более 90% сегмента дата-центровых GPU в ключевых отчётах по 2024–2025 годам. На этом фоне неудивительно, что NVIDIA недавно стала крупнейшей компанией в мире по рыночной капитализации, превысив отметку в 5 трлн долларов и обогнав предыдущих лидеров, вроде Apple и Microsoft.
Что это означает:
• Любая крупная компания, которая хочет обучать и запускать свои модели, оказывается в очереди за чипами.
• Пропускная способность этой «очереди» определяется не только деньгами, но и политикой экспортного контроля США и их союзников.
• NVIDIA фактически стала инфраструктурной компанией нового типа: она не продаёт конечный продукт пользователю, но контролирует критически важный слой – тот, через который проходит всё остальное.
Спрос настолько велик, что:
• компании строят целые дата-центровые кластеры под ИИ-сервера;
• капитальные затраты на ИТ-инфраструктуру (серверы, сети, системы хранения) занимают более 70–80% расходов на новые дата-центры;
• любая задержка в поставке GPU может стоить компаниям миллионы долларов упущенной выручки.
Война за GPU – это уже не метафора, а ежедневная реальность: топ-менеджеры договариваются о партиях чипов, как раньше договаривались о доступе к месторождениям.
Уровень 3. Модели (LLM) – мозг этой системыНа третьем уровне находятся модели – те самые большие языковые модели (LLM – large language models) вроде ChatGPT или Claude, Gemini, DeepSeek, QWEN, а также модели для работы с изображениями (которые “видят” и генерируют картинки и видео: Midjourney, Sora, VEO, Kling, NanoBanana и др), модели для звука (распознавание и синтез речи, музыка: ElevenLabs, Suno, и др) и мультимодальные модели, которые одновременно воспринимают и комбинируют текст, изображение, звук и иногда видео.
Чтобы обучить одну фронтирную модель:
• нужны тысячи GPU, работающих недели или месяцы;
• общий бюджет на обучение может превышать десятки-сотни миллионов долларов (учитывая железо, энергию, инженеров, инфраструктуру).
Но самое важное:
Модель – это кристаллизованное знание мира плюс стоимость всех вычислений, которые в неё вложены.
Отсюда вытекают ключевые черты:
• У единиц игроков есть ресурсы, чтобы строить модели мирового уровня (США, Китай, Россия, несколько крупных компаний).
• Остальные становятся пользователями моделей через API или используют открытые/местные варианты.
• Доступ к самым мощным моделям оказывается завязан на те самые GPU, электричество и политические решения наверху пирамиды.
Это похоже на ситуацию, когда определённое число стран контролирует производство самолётов, а все остальные покупают у них билеты.
Уровень 4. Приложения – интерфейсы к мозгуЧетвёртый уровень – это всё, что видит обычный человек:
• чат-боты, ассистенты, GPT-приложения;
• сервисы для маркетинга, дизайна, программирования, образования;
• голосовые помощники, аватары, системы поддержки клиентов.
Здесь происходит настоящее разнообразие и креатив:
• одни делают узкие решения под юристов, врачей, маркетологов;
• другие – системы, которые автоматизируют целые бизнес-процессы;
• третьи – инструменты для творчества и развлечения.
Но важно понимать: ни одно приложение не живёт само по себе.
Оно опирается:
• либо на API крупных моделей (OpenAI, Anthropic, Google, QWEN, локальные провайдеры);
• либо на самостоятельный развёрнутый стек (открытые модели + свои сервера).
Отсюда главный риск для разработчиков приложений:
«Ты строишь бизнес на чужой платформе. Если платформа поднимет цены или ограничит доступ – твой бизнес может исчезнуть за ночь».
И наоборот – отсюда же рождаются возможности:
Если ты понимаешь, как устроена инфраструктура, ты можешь проектировать такие приложения и системы, которые масштабируются, не убивая тебе маржу:
• заранее закладывать работу не с одной моделью, а с несколькими провайдерами;
• разделять “тяжёлые” задачи, которые действительно требуют дорогих мощных моделей, и “рутинные”, которые можно гонять через более простые и дешёвые решения;
• продумывать, что можно кэшировать, переиспользовать и считать локально, а не каждый раз оплачивать полный цикл обработки;
• строить ценовую модель продукта так, чтобы рост числа пользователей не превращал каждый новый запрос в удар по вашему же кошельку.
В результате вы делаете не красивую игрушку на модной нейросети, а систему, которая выдерживает и рост нагрузки, и изменения тарифов, и очередной виток гонки за мощностями.
Уровень 5. Пользователь – вершина и одновременно топливоНа вершине – мы с вами:
• предприниматели, специалисты, фрилансеры, студенты;
• компании, которые внедряют ИИ в процессы;
• государства, которые перестраивают сервисы, налоговые системы, образование.
По данным Всемирного экономического форума, уже сейчас около 34% бизнес-задач в среднем выполняется машинами, а оставшиеся 66% – людьми.
Исследования ОЭСР и крупных консалтингов показывают:
• до 27–30% рабочих мест в развитых странах находятся в зоне высокого риска автоматизации;
• при этом 60% рабочих мест не исчезнут, но будут существенно изменены под воздействием ИИ.
Это означает:
• вы либо становитесь человеком, который умеет работать с ИИ, строить свои системы и управлять ими;
• либо остаетесь на уровне, где за вас всё решают чужие агенты, чужие алгоритмы и чужие интересы.
Пирамида инфраструктуры ИИ показывает простую, но жёсткую мысль:
Да, наверху – человек. Но его положение зависит от того, умеет ли он использовать всё, что под ним.
Геополитика ИИ: война за электроэнергию и чипы
Теперь посмотрим на эту пирамиду глазами стран.
США: контроль за чипами и моделямиСША давно поняли, что тот, кто контролирует продвинутые чипы, контролирует темп развития ИИ.
Поэтому:
• вводятся всё более жёсткие экспортные ограничения на поставку продвинутых GPU и оборудования для их производства в Китай и другие страны;
• ограничивается доступ к самым мощным моделям через лицензирование, правила по безопасности и регулирование оборота ИИ;
• формируется новый уровень зависимости: вместо нефти и доллара – чипы и вычисления.
Ситуация парадоксальна:
С одной стороны, такие ограничения замедляют военные и технологические возможности конкурентов.
С другой – стимулируют их развивать собственную чиповую и ИИ-индустрию ещё активнее.
Но для остального мира это означает одно: доступ к фронтирным моделям и мощностям всё больше зависит не только от денег, но и от геополитики.
Китай, Россия, Европа, другие регионы: гонка за автономиейКитай, Россия, Европа, страны Персидского залива и ряд других регионов:
• активно строят собственные национальные облака и ИИ-кластеры;
• инвестируют в собственные архитектуры чипов и RISC–V;
• запускают национальные LLM, оптимизированные под свои языки, культуры и требования безопасности.
Цель очевидна:
уйти от ситуации, когда любые политические изменения в США могут перекрыть кислород целой индустрии.
Альтернативные сценарии: Россия, атомная энергетика и «биткоиновый» подход к вычислениямЕсли отбросить бренды и названия моделей, у ИИ-инфраструктуры вырисовывается несколько базовых направлений, которые будут актуальны для разных стран и регионов.
1. Энергетические хабы для ИИ-кластеров
• Крупные центры генерации (атомная энергетика, ГЭС, газ, ВИЭ) становятся «магнитом» для дата-центров.
• Там, где энергия дешёвая и предсказуемая, логично строить большие кластеры обучения и инференса.
• В выигрыше оказываются регионы, которые могут обеспечить не только мощность, но и устойчивость: понятные правила, физическую безопасность объектов, подключение к глобальным каналам связи.
2. Распределённые вычисления по мотивам биткоина
• Вместо одного-двух гигантских центров – сеть узлов, связанных общим протоколом и правилами расчётов.
• Участники отдают свои GPU/TPU-мощности в сеть и получают вознаграждение не за «пустой» хэш-рейт, а за полезные задачи: обучение моделей, инференс, поиск.
• Вычисления становятся отдельным типом цифрового актива и экспортируемого ресурса: можно продавать не только железо и энергию, но и выполненную работу моделей.
3. Суверенные модели и открытые экосистемы
• В разных странах появляются собственные базовые модели, учтённые под локальные языки, правовые нормы, культурный контекст.
• Вокруг них строятся открытые API и стандарты, чтобы бизнес мог быстро поднимать свои решения поверх суверенной базы, не теряя совместимость с глобальным миром.
• Конкуренция идёт не только за «самую большую модель», но за сочетание: качество → стоимость владения → удобство для разработчиков.
Все эти сценарии – глобальные. Вопрос для любой страны: на каком из направлений она может играть сильнее и где есть шанс не просто догонять, а задавать правила.
Россия: где здесь окно возможностейУ России есть набор активов, которые можно встроить в эти глобальные сценарии, если смотреть на ИИ именно как на инфраструктуру:
1. Энергетическая база (включая атом) как аргумент для кластеров
• Сильные компетенции в атомной энергетике и крупных инфраструктурных проектах – это не “волшебная палочка”, а один из способов сделать энергию для вычислений более дешёвой и предсказуемой.
• Логичный шаг – развитие кластеров рядом с устойчивыми источниками мощности (не только атом, но и ГЭС, газ, возобновляемые источники).
• Это снижает зависимость от волатильности цен на углеводороды и погодных факторов и даёт аргумент для размещения дата-центров внутри страны.
2. Участие в глобальных или региональных сетях распределённых вычислений
• Региональные центры обработки данных и локальные мощности могут становиться узлами распределённых сетей, которые решают реальные задачи бизнеса и государства.
• Россия может не «изобретать свой биткоин», а подключаться к уже существующим протоколам и инициативам, добавляя в сеть свои энергоёмкие кластеры.
• Важно не замыкаться только на сырье (энергия, железо), а выходить в зону «вычисления как сервис» и «вычисления как цифровой экспорт».
3. Суверенные модели + доступная экосистема для бизнеса
• Развитие моделей, обученных на русском языке и локальных данных, – уже не абстрактная идея, а практическая необходимость: от юридических задач до медицины и промышленности.
• Критично, чтобы эти модели были не только «суверенными», но и открытыми по интерфейсам: понятные API, документация, песочницы для разработчиков.
• Тогда поверх базовой инфраструктуры могут расти десятки и сотни частных решений: от отраслевых ассистентов до автоматизированных производственных систем.
Ключевой момент здесь не в том, что «атомная отрасль решит всё». Вопрос в другом: получится ли превратить существующие сильные стороны – в энергии, инженерии, науке – в платформу, на которой создают ценность частные игроки, а не только государство и крупные корпорации.
На уровне практики это уже происходит: несколько крупнейших российских банков, ИТ-групп и телеком-операторов строят суперкомпьютерные кластеры под обучение моделей, разворачивают собственные LLM и открывают к ним API или опенсорс-доступ, а также инвестируют в облака и дата-центры, заточенные под ИИ-задачи.
Открытый вопрос в ближайшие годы – насколько такие экосистемы смогут конкурировать с глобальными моделями не только по «суверенному» признаку или за счёт регулирования, а по реальным метрикам: качеству ответов, скорости, стоимости инференса и удобству для разработчиков. Пока разрыв с мировым фронтиром велик, но в узких нишах и на локальном (в том числе русскоязычном) рынке у них есть шанс выигрывать именно за счёт адаптации к языку, данным и отраслевым сценариям.
Как эта пирамида связана лично с вами
Геополитика, энергосистемы, кластеры ИИ – всё это звучит как «игра больших». Но внутри той же логики живёт и ваша личная стратегия.
У каждого есть своя мини-«инфраструктура»: энергия и время, навыки и инструменты, проекты и продукты.
Посмотрим, как та же пирамида – от «железа» до приложений – выглядит на уровне вашей карьеры и бизнеса.
1. Электроэнергия
Для вас это превращается в очень практичный вопрос: опирается ли ваш продукт на надёжные облачные сервисы с резервами и понятными гарантиями работы, или всё крутится на случайном дешёвом виртуальном сервере, который может отключиться в самый неподходящий момент.
2. GPU и дата-центры
– это выбор: вы зависите от одного провайдера (единственный API, единственный облачный аккаунт) или закладываете мульти-провайдерную архитектуру, которая выдержит изменения цен и политики.
3. Модели
– это стратегический слой: вы строите всё на одной закрытой модели или понимаете, когда выгоднее использовать opensource-модель, дообученную под свои задачи, и как это сделать.
4. Приложения
– это то, что вы уже делаете: чат-боты, агенты, mini-apps, продукты.
– чем лучше вы понимаете нижележащие слои, тем реалистичнее ваши бизнес-модели и обещания клиентам.
5. Пользователь (вы)
– ваш главный ресурс – не количество часов, которые вы работаете, а способность соединять эти уровни в работающую систему.
Смысл этой главы – не напугать.
Смысл в том, чтобы вы увидели:
ИИ-революция – это не то, что «где-то происходит».
Она проходит через очень конкретные уровни, и вы можете осознанно занять своё место внутри этой структуры.
Дальше в книге мы будем говорить именно о том, как отдельный человек/компания может выстроить свою систему поверх этой инфраструктуры: от базового взаимодействия с моделями до мультиагентных архитектур.
Домашнее задание: Нарисуйте свою карту зависимости от инфраструктуры ИИ
Задание на 15–20 минут.
1. Возьмите лист бумаги (или Miro/Notion) и нарисуйте ту же пирамиду:
2. Электроэнергия → GPU/облако → Модели → Приложения → Пользователь.
3. На уровне «Приложения» впишите всё, чем вы реально пользуетесь:
– ChatGPT, Claude, Gemini, DeepSeek, GigaChat;
– Copilot, Midjourney, Lovable, Gamma.app;
– любые SaaS-сервисы, где внутри «что-то на ИИ».
4. Для каждого приложения попробуйте ответить:
– На каких моделях оно, вероятно, работает?
– Через какого провайдера облака оно может идти (AWS, Azure, локальные)?
– Насколько вы зависите от одного поставщика (1–5 по шкале)?
5. Отметьте красным всё, где зависимость максимальна:
– один аккаунт, одна карта оплаты, один API;
– отсутствие резервного варианта.
6. В конце задайте себе два вопроса:
– Что будет, если завтра этот сервис подорожает в 3 раза или станет недоступен в моём регионе?
– Какие 1–2 шага я могу сделать за ближайший месяц, чтобы снизить эту зависимость (например, освоить альтернативу, изучить opensource-модель, протестировать другого провайдера)?
Цель упражнения – не «паранойя безопасности», а трезвое ощущение:
где именно вы встроены в инфраструктуру ИИ, и какие у вас есть варианты манёвра.
Чек-лист имплементации главы
Короткий список вопросов, на которые стоит ответить после прочтения:
1. Понимаю ли я, какие слои инфраструктуры ИИ существуют и как они связаны?
2. Могу ли я в двух абзацах объяснить клиенту/коллеге, почему ИИ – это не только про «чат», но и про энергию и чипы?
3. Знаю ли я, от каких провайдеров и моделей зависит мой текущий бизнес/работа?
4. Есть ли у меня резервные сценарии на случай роста цен или ограничений доступа к конкретному сервису?
5. Понимаю ли я, какие преимущества есть у моей страны/региона сейчас и в будущем (энергетика, кадры, законы) в контексте инфраструктуры ИИ?
6. Могу ли я сформулировать хотя бы одну гипотезу проекта, опирающуюся на локальные сильные стороны (например, дешёвая энергия, локальные модели, нишевая экспертиза)?
Если вы сейчас не можете уверенно ответить «да» хотя бы на 4–5 пунктов – вернитесь к пирамиде и своей карте зависимости ещё раз.
Анти-паттерны мышления: во что легко попасться
1. «Мне всё равно, где это крутится, я просто использую ИИ»
Опасность: вы строите стратегию на песке. Любое изменение цен/политики API – и ваша воронка, продукт, или бизнес-процессы перестают быть прибыльными.
2. «Это всё про государства и корпорации, я тут ни при чём»
На самом деле, именно индивидуальные специалисты и малые команды чаще всего первыми обкатывают новые модели монетизации поверх инфраструктуры – и забирают сливки.
3. «Надо обязательно строить свою модель / свой дата-центр»
Это крайность в другую сторону. В 99% случаев рациональнее:
– использовать существующие модели;
– понимать их ограничения;
– строить поверх них грамотные системы и процессы, а не дублировать инфраструктуру.
4. «Если США контролируют чипы – всё уже решено»
История показывает: технологическое лидерство никогда не бывает навечно.
Появляются альтернативные архитектуры, новые энергетические решения, распределённые сети.
Вопрос не «кто победит», а насколько гибко вы умеете адаптироваться и использовать новые окна возможностей.
Если вы делаете ИИ-продукт или серьёзно опираетесь на ИИ в работе
Если вы строите ИИ-продукт, сервис или просто сильно завязаны на нейросети в своей работе, для вас глава про инфраструктуру – не теория “для общего развития”.
В пользовательском интерфейсе всё выглядит просто:
модель отвечает, продукт “работает”, клиент доволен.
Но под этим – длинная цепочка: энергия, дата-центры, чипы, провайдеры моделей, правила доступа, ограничения по странам и отраслям. Эта цепочка меняется без вашего участия – а вместе с ней может внезапно измениться и экономика вашего продукта.
Поэтому у создателя ИИ-продукта неизбежно появляются неудобные, но нужные вопросы:
• На каких конкретно моделях и провайдерах вы стоите сейчас?
• Что с вами будет, если один из них подорожает, введёт жёсткие лимиты или уйдёт из вашего региона?
• Насколько жёстко логика продукта “пришита” к одному API?
• Сможете ли вы переключиться на другие модели без полной переделки всего сервиса?
• Где ваше главное узкое место:
• вычислительные ресурсы, данные, регуляция, завязка на чужую платформу, человеческие процессы?
Один и тот же “ИИ-сервис” снаружи может выглядеть одинаково, но в одном случае это тонкая обёртка над одним API,
а в другом – система, где:
• часть логики вынесена в промпты и сценарии,
• часть – в ваши собственные данные и процессы,
• провайдера модели можно заменить без катастрофы.
Чтобы не держать все эти риски только в голове, их можно сразу “выгрузить” на ИИ – в прямом смысле. В следующих главах вы настроите своих агентов, но уже сейчас можно заложить для них первые вопросы.
Вопросы, которые стоит отдать вашему будущему ИИ-агентуЭтот набор вопросов можно будет буквально вставить в персонального агента-стратега по ИИ (которого вы создадите позже по книге), чтобы он помог осмыслить инфраструктурные риски именно под ваш продукт или бизнес:
1. Про текущую зависимость.
«Проанализируй мои текущие инструменты и сервисы ИИ и опиши, на каких моделях и провайдерах они с высокой вероятностью основаны.
Сделай таблицу: сервис → вероятный провайдер → возможные риски зависимости.»
2. Про запасные варианты.
«Подбери 3–5 альтернативных решений (open-source-модели, другие провайдеры, локальные варианты), которые можно использовать в случае подорожания, лимитов или блокировки текущего сервиса.
Оцени, чем они жертствуют (качество, скорость, удобство) и что дают взамен (контроль, цена, независимость).»










