Опубликованы данные OpenRouter: китайские модели вторую неделю подряд превосходят американские. Лидером является «призрак» по имени Хантер Альфа. Вот что должен знать каждый разработчик.
7 минут чтения · 18 марта 2026 г. Mохаммед Абдельменем

Призрачная модель под названием Hunter Alpha появилась из ниоткуда. Четыре дня спустя она обработала 0,66 триллиона токенов.
Модель - призрак по имени Хантер Альфа только что покорила мир искусственного интеллекта.
Никто не знает, кто его построил.
Данные OpenRouter подтверждают сдвиг: китайские модели на прошлой неделе достигли отметки в 4,69 триллиона токенов за неделю. А американские модели? 3,29 триллиона. Две недели подряд.
В конце вы поймете, почему эра агентов перевернула все с ног на голову. Вы получите контрольный список, который поможет избежать построения стратегии на основе умирающей стратегии.
Если вы внедряете функции ИИ в производство, эти данные меняют ваши планы развития.
11 марта 2026 года на OpenRouter появилась модель под названием Hunter Alpha. Четыре дня спустя: 0,666 триллиона токенов в неделю. Больше, чем у большинства американских моделей. Нет веб-сайта. Нет блога. Нет названия компании.
США потеряли не просто неделю. Они потеряли опору.
Но настоящая история не в цифрах. Она в призраке. Вот почему это важно.
Эталонный Mirage
Вы видели заголовки. OpenAI лидирует. Gemini сравнялась с компаниями, имеющими докторские степени. Американская версия событий жива и здорова.
Данные о производстве говорят об обратном.
MiniMax M2.5: занимает первое место в OpenRouter пять недель подряд с объемом 1,75 триллиона токенов. Step 3.5 Flash: рост на 79% за неделю.
DeepSeek V3.2: рост на 25%.
Это не какие-то малоизвестные исследовательские лаборатории. Это рабочие лошадки производственного ИИ.
Рынок проголосовал. Он просто не сообщил об этом прессе. Дайте этому осмыслиться.
Генеральный директор Airbnb Брайан Чески в декабре прямо заявил: «Мы во многом полагаемся на модель Qwen от Alibaba. Она очень хороша… быстрая и недорогая. Мы используем новейшие модели OpenAI, но обычно не так часто применяем их в производственной среде».
Генеральный директор крупной американской технологической компании только что признал, что OpenAI — это всего лишь запасной вариант. (Ирония ситуации, когда американские компании обучают китайские модели на своих данных, по-видимому, не ускользнула от внимания.)
Чтобы понять почему, нужно взглянуть на то, что на самом деле стимулирует внедрение: на агентов.
Согласно общепринятому мнению, искусственный интеллект оценивается по результатам тестов в чатах. В производственных задачах викторины не имеют значения.
OpenClaw, платформа для разработки агентов с открытым исходным кодом, получила стремительное развитие в начале 2026 года. Все крупные китайские лаборатории за несколько недель запустили продукты, созданные на основе OpenClaw. Moonshot AI. MiniMax. Zhipu. Tencent.
Вот почему это важно. Задачи агентов потребляют от 100 000 до более миллиона токенов за один запуск. Это в 10-100 раз больше, чем простой чат. Данные Open Source Securities показывают, что потребление токенов выросло в 300 раз за 18 месяцев. IDC прогнозирует 22,16 миллиарда активных агентов к 2030 году.
В эпоху агентских программ поощряется одно: стоимость выполнения задачи.
Математика здесь жестокая. MiniMax M2.5: 0,30 доллара на входе, 1,10 доллара на выходе за миллион токенов. Claude Opus 4.6: 5 долларов на входе, 25 долларов на выходе. Запустите миллионы задач агента, и это будет разница между прибыльностью и невозможностью.
В эпоху агентов на выполнение задачи уходит 1 миллион токенов. Китай разрабатывал системы именно для этого. США же создавали системы для чата.
Команда OpenRouter подтвердила эти изменения: «Китай стал крупной силой не только благодаря внутреннему потреблению, но и благодаря созданию конкурентоспособных на мировом рынке моделей».
Но значит ли более низкая цена, что качество вполне приемлемое?
Неправильный вопрос. Правильный вопрос: достаточно ли хороши китайские модели для ваших задач, если они стоят на 10% дешевле ? Для большинства производственных нагрузок ответ — да.
Американские разработчики, составляющие 47% пользователей OpenRouter, являются движущей силой доминирования Китая. Если вы — инженер из США, использующий китайские модели, то почему? И знают ли об этом ваши руководители?
Наилучшая модель — это та, которую вы можете себе позволить использовать в больших масштабах.
Эти вычисления приводят к появлению призрака.

В эпоху агентов потребление токенов на задачу увеличилось в 100 раз. Для этого в Китае был разработан OpenClaw, а в США — для чата. Создано автором.
11 марта неизвестная организация загрузила в OpenRouter модель с 1 триллионом параметров. Название: Hunter Alpha. Характеристики: оптимизирована для агентных приложений. Контекст в один миллион токенов. Полная совместимость с OpenClaw.
За 96 часов: 0,666 триллиона еженедельных токенов. 7-е место в общем зачете. Выше Кими. Выше большинства американских моделей.
Никаких следов: ни веб-сайта, ни блога, ни названия компании. Просто модель, которая мгновенно стала одной из самых используемых в мире.
Контекст имеет значение. На долю китайских моделей с открытым весом сейчас приходится 17% мировых загрузок на Hugging Face и аналогичных платформах. А на американские модели? 15,8%. Впервые Китай превзошел США по внедрению моделей с открытым весом за несколько месяцев до переворота токенов.
Один из разработчиков на Hacker News точно подметил настроение: «Я только что перевел весь наш стек агентов на MiniMax. За одну ночь наши расходы на токены упали на 80%. Я одновременно и напуган, и взволнован».
Очевидный контраргумент: экспортный контроль США в отношении передовых микросхем в конечном итоге задушит способность Китая обучать модели следующего поколения.
Это предполагает, что обучение важнее выводов. Это не так. У Китая уже достаточно чипов, чтобы удовлетворить существующий спрос. Их энергетическая инфраструктура, вдвое превышающая потребление электроэнергии в США и на 47% состоящая из возобновляемых источников, дает им структурное преимущество в стоимости, которое не сможет нивелировать никакое количество чипов.
Вот почему это важно для вашего стека технологий.
Если вы оценивали модели исключительно на основе бенчмарков, вы оптимизируете их не для той игры.
Hunter Alpha — это симптом, а не причина. Причина: система, которая разрабатывается с учетом реальных потребностей разработчиков.
У этой системы есть название, и это не Силиконовая долина.

Две недели подряд китайские модели лидируют по единственному показателю, имеющему значение для производства — реальному объему токенов. Автор статьи.
Вы можете подумать, что это просто ценовая война. Но это не так.
По прогнозам, капитальные затраты США на облачные технологии к 2027 году достигнут 700 миллиардов долларов. А в Китае? Примерно 35 миллиардов долларов. Разница в расходах составляет 20 к 1.
Однако китайские модели демонстрируют результаты, сопоставимые или превосходящие американские, при значительно меньших затратах.
Тренировки Kimi K2 Thinking обошлись менее чем в 5 миллионов долларов. Сравнимые американские модели стоят в 10 раз дороже.
Инфраструктура «вычислительных систем Восток-Запад» дает им структурное преимущество. Потребление электроэнергии в Китае вдвое выше, чем в США, причем почти половина приходится на возобновляемые источники. Когда ваши затраты на энергию ниже, а ваши модели более эффективны, вы выигрываете войну за лучшие результаты в области вывода информации.
В январе ВМС США запретили DeepSeek из-за опасений по поводу конфиденциальности. Тем временем инженеры одного из оборонных подрядчиков втайне тестировали ту же модель для оптимизации логистики. Рынок не ждет политических решений.
Это оптимистическая точка зрения. А вот другая сторона вопроса.
На первый взгляд возникает вопрос: это история о национальной безопасности или о бизнесе?
Более глубокая реальность: дело и в том, и в другом. Американские компании, перенимающие китайские модели, создают риски утечки данных. Но рынок игнорирует геополитику, когда затраты в 10 раз ниже. (Пентагон никогда не признает, что ему это любопытно.)
Ваша компания тайно тестировала или внедряла китайскую модель производства? Что произошло, когда руководство узнало об этом?
Но есть и контраргумент, и он заслуживает справедливого рассмотрения.
Прежде чем полностью списать США со счетов, подумайте вот о чём.
В США ужесточается экспортный контроль в отношении чипов Nvidia. Некоторые утверждают, что это в конечном итоге задушит способность Китая обучать модели следующего поколения. Преимущество в аппаратном обеспечении может ограничить их долгосрочный потенциал.
Геополитический риск реален. ВМС США запретили DeepSeek. Вероятны новые правительственные ограничения. Предприятия в регулируемых отраслях могут продолжать сотрудничать с американскими поставщиками исключительно из-за соблюдений нормативных требований.
Один технический директор из Силиконовой долины сказал мне: «Мы не можем позволить себе ставить на кон свой бизнес, полагаясь на модели, которые могут быть запрещены в одночасье. Надежность и доверие по- прежнему имеют значение».
Если вы работаете в регулируемой отрасли, будьте внимательны. Но доверие — это роскошь. Цена — необходимость.
ВМС США запретили DeepSeek. Возможно, ваша компания начнет его использовать уже завтра.
Так что же с этим делать на самом деле? Этот вопрос все игнорируют.
«Переворот» — это не предсказание. Это реальность. Вот как на это реагировать.
Смена мышления
Прекратите оценивать модели по бенчмаркам или принципу «лучший в своем классе». Эра агентных вычислений основана на стоимости выполнения задачи и совместимости с экосистемой. Лучшая модель — это та, которую вы можете позволить себе использовать в больших масштабах. Сейчас это китайские модели.
Немедленные шаги (которые может предпринять каждый уже сегодня)
Шаг 1: Проведите аудит расходов токенов. Получите логи API за последние 30 дней. Рассчитайте стоимость за миллион токенов для каждой рабочей нагрузки. Если вы используете OpenAI или Claude для выполнения больших объемов агентских задач, вы переплачиваете в 4-10 раз. (Это упражнение обычно заставляет пользователей OpenAI замолчать.)
Шаг 2: Протестируйте одну китайскую модель. Запустите некритичную агентную нагрузку на MiniMax M2.5 или DeepSeek V3.2. Сравните стоимость, задержку и качество выходных данных. Не доверяйте бенчмаркам. Доверяйте собственным метрикам.
Шаг 3: Проверьте совместимость с OpenClaw. Если вы разрабатываете агенты, убедитесь, что ваша платформа совместима с OpenClaw.
Экосистема стандартизируется. Если вы не можете получить к ней доступ, значит, вы используете устаревший стек технологий.
Промежуточные этапы (для команд и менеджеров)
Создайте конвейер оценки, готовый к использованию в Китае. Разработайте тестовую среду, в которой ваша команда сможет безопасно тестировать китайские модели, не раскрывая конфиденциальные данные. Документируйте производительность, режимы сбоев и неожиданное поведение.
Используйте двух поставщиков для вашей агентской инфраструктуры. Не позволяйте какому-либо одному поставщику, американскому или китайскому, стать узким местом. Спроектируйте свою агентскую сеть таким образом, чтобы менять поставщиков на уровне API. В сфере ИИ побеждает не лучшая модель, а компания, которая сможет завтра перейти на то, что будет дешевле.
Антипаттерны (что не работает)
Не стоит предполагать, что «лучший результат в бенчмарках» означает лучший результат в производственной среде. Бенчмарки проверяют чат. Для производственной среды нужны агенты. Игры разные.
Не ждите разрешения от американских регуляторов. Рынок начнет движение в феврале 2026 года. Ваши конкуренты уже тестируют китайские модели.
Честное ограничение
Если вы работаете в оборонной, финансовой или медицинской отраслях, то на данный момент опасения по поводу суверенитета данных могут перевесить преимущества с точки зрения затрат. Компромисс реален.
Примите это как данность.
Если вы — ведущий инженер, отвечающий за затраты на инфраструктуру ИИ, этот контрольный список станет вашей отправной точкой.
Если вы — основатель компании, которая сейчас разрабатывает проекты на платформах OpenAI или Anthropic, какой ваш контраргумент к приведенным мной расчетам затрат? Что я упускаю?
Теперь у вас есть необходимые инструменты. Остальное зависит от вас.
«Переворот» — это не разовое событие. Это новый стандарт.
Объём токенов — это высшее выражение доверия. Разработчики просто проголосовали своими API-ключами. Они выбрали стоимость. Они выбрали агентов. Они выбрали Китай.
США могут жаловаться на несправедливые преимущества, или же они могут адаптироваться. Адаптация начинается с признания того, что правила игры изменились. Речь больше не идёт о контрольных показателях. Речь идёт о том, кто управляет инфраструктурой, которой мир действительно пользуется.
Сегодня Hunter Alpha — это призрак. Завтра это может быть единственная игра в городе.
Я предсказываю: разработчик Hunter Alpha будет раскрыт в течение 60 дней, и это будет не кто-то из обычных подозреваемых. MiniMax. DeepSeek. Alibaba.
Делайте ставки ниже.
Вопрос в том: используете ли вы правильный стек технологий при разработке?

Опубликовано в Level Up Coding