Hopper · 141 ГБ HBM3e · SXM 5 / NVL

Купить NVIDIA H200 141 ГБ HBM3e
— серверы и платформы для обучения LLM

  • 141 ГБ HBM3e на 1 GPU — Llama 3.1 405B (FP8) и Qwen2.5 72B (FP16) разворачиваются без шардинга.
  • HGX H200 8-GPU и DGX H200 — готовые платформы под inference и multi-GPU обучение через NVSwitch.
  • Срок поставки 4–6 недель через прямые квоты партнёров в ОАЭ и Гонконге. Договор с НДС, документы для ФНС, постоплата.
141 ГБHBM3e VRAM
4,8 ТБ/спропускная способность
900 ГБ/сNVLink 4
3958TFLOPS FP8
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA H200 · Hopper, 141 ГБ HBM3e

H200 — рефреш Hopper-архитектуры от NVIDIA: тот же чип GH100, что и в H100, но с увеличенным до 141 ГБ HBM3e VRAM и пропускной способностью 4,8 ТБ/с (+43% vs H100). Подходит для обучения и инференса LLM до 405B параметров.

2 форм-фактора · SXM5 + NVL
NVIDIA H200
Hopper · SXM5

NVIDIA H200 SXM 141 ГБ HBM3e

Память141 ГБ HBM3e
Пропускная способность4,8 ТБ/с
Форм-факторSXM5 (для HGX)
NVLink 4900 ГБ/с
TDPдо 700 Вт
FP8 (Transformer Engine)3958 TFLOPS
FP161979 TFLOPS
Срок поставки 4–6 недель · квота партнёра
NVIDIA H200 NVL
Hopper · PCIe

NVIDIA H200 NVL 141 ГБ HBM3e · PCIe

Память141 ГБ HBM3e
Пропускная способность4,8 ТБ/с
Форм-фактор2-слот PCIe 5.0
NVLink 4 (bridge)попарно, до 900 ГБ/с
TDPдо 600 Вт
FP83341 TFLOPS
Совместимостьобычные PCIe-серверы
Срок 4–6 недель · подходит под обычные стойки
NVIDIA HGX H200 8-GPU
Hopper · Платформа

NVIDIA HGX H200 8× H200 SXM

Конфигурация8× H200 SXM5
Суммарный VRAM1128 ГБ HBM3e
NVSwitch4× NVLink-4 Switch
Внутренний bandwidth7,2 ТБ/с
Energy~6,5 кВт стойка
Дляобучения и inference 70-405B
Под заказ от 6 недель · 5 партнёров платформы (SuperMicro, Dell, Gigabyte, ASUS, Lenovo)
Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

H200 vs H100 vs A100

Какой Hopper-GPU выбрать под задачу: чек, память, скорость инференса LLM

Ampere

NVIDIA A100

Память40 / 80 ГБ HBM2e
Пропускная сп.1,5 / 2,0 ТБ/с
FP16312 TFLOPS
FP8
NVLink600 ГБ/с (NVLink 3)
Год2020
Ценапо запросу

Подходит для inference моделей до 70B, обучения средних моделей, R&D-задач. Выпускается с 2020 года.

Hopper

NVIDIA H100

Память80 ГБ HBM3
Пропускная сп.3,35 ТБ/с
FP161979 TFLOPS
FP83958 TFLOPS
NVLink900 ГБ/с (NVLink 4)
Год2022
Ценапо запросу

Hopper-архитектура, Transformer Engine, поддержка FP8. Используется для обучения и инференса моделей 70-200B.

Hopper Refresh ★

NVIDIA H200

Память141 ГБ HBM3e
Пропускная сп.4,8 ТБ/с (+43%)
FP161979 TFLOPS
FP83958 TFLOPS
NVLink900 ГБ/с (NVLink 4)
Год2024
Ценапо запросу

141 ГБ HBM3e вмещает Llama 405B в FP8 на одной карте — без шардинга и NVLink-фабрики из нескольких GPU.

Подробное сравнение с бенчмарками и кейсами — в нашей статье (готовится).

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про H200

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

H200 — апгрейд Hopper-архитектуры. Главное отличие: 141 ГБ HBM3e против 80 ГБ HBM3 у H100, и пропускная способность памяти 4,8 ТБ/с против 3,35 ТБ/с. Вычислительные ядра те же — архитектура Hopper не изменилась. На задачах с большим контекстом (LLM 70B+) H200 даёт буст 1,4–1,9× за счёт памяти. Те же CUDA, Transformer Engine, FP8 — переход без переписывания кода.
141 ГБ HBM3e позволяет развернуть на 1 GPU без шардинга: Llama 3.1 70B (FP16), Llama 3.1 405B (FP8), Qwen2.5 72B (FP16), DeepSeek-V3 (FP8 с подкачкой). Для обучения от 70B параметров обычно нужно 4–8 H200 в NVLink-кластере, для inference часто хватает 1–2.
H200 SXM5 — серверный форм-фактор 80×100 мм для платформ HGX/DGX (8 GPU на baseboard через NVSwitch). H200 NVL — PCIe-видеокарта (2 слота, 600 Вт TDP) для серверов с обычной PCIe-шиной, без NVSwitch. SXM даёт 900 ГБ/с межGPU через NVLink-4, NVL — попарный NVLink через bridge. Цена SXM выше на 15–25%, но он требует HGX-платформу. NVL ставится в любой современный сервер.
H200 — дефицитная модель, квоты у партнёров на Ближнем Востоке формируются под конкретный PO. Типичный сценарий 8× H200 SXM в HGX-сервере — 4-6 недель с подписания. Конфигурация H200 NVL под MGX сервер (до 8× PCIe) — 3-5 недель, проще логистика без baseboard. Отдельные H200 NVL карты иногда есть на складе в Дубае, тогда 10-14 дней до Москвы. По кластеру 32+ GPU — делим на транши.
H200 учитывается у юрлица как объект ОС, ОКОФ 320.26.20.13, амортизация типично 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС. ЭДО через Диадок или СБИС, по запросу — Контур. Комплект для ФНС: договор поставки, спецификация по серийникам, УПД, ТН, нотификация ФСБ по криптомодулю, копия ДТ с отметкой выпуска. Расчёты в валюте партнёра в ОАЭ или Гонконге проходят на стороне иностранной компании группы, вам приходит счёт в ₽.
Стандартная гарантия NVIDIA 3 года с даты выпуска чипа. У партнёра в ОАЭ держим подменный фонд под H200, поэтому RMA проходит за 7-14 дней по PCIe-картам H200 NVL. Для SXM-модулей в составе HGX замена идёт целым GPU board (это политика NVIDIA по baseboard), 14-21 день. Опцию on-site Москва согласуем отдельно — на H200 чаще берут, дорогая карта простаивать не должна.
Типичные сценарии

Под что берут NVIDIA H200

Большой контекст

Llama 405B FP8 на одной карте

141 ГБ HBM3e вмещают Llama 3.1 405B в FP8 без шардинга. Для инференса с context window 128k — одна H200 справляется там, где у H100 требовалось две.

RAG в проде

Корпоративный поиск с эмбеддингами

4× H200 NVL в PCIe-сервере под связку embedder + retriever + reranker + 70B-генератор. 4,8 ТБ/с памяти убирают bottleneck при высоком QPS.

Training

Pre-train MoE моделей

8× H200 SXM в HGX с NVSwitch — рабочая платформа для pre-train DeepSeek-V3-класса (671B параметров с активацией 37B). Память H200 снимает MoE-офлоадинг на CPU.