Hopper · 141 ГБ HBM3e · SXM 5 / NVL

Купить NVIDIA H200 141 ГБ HBM3e
— серверы и платформы для обучения LLM

141 ГБ HBM3e на 1 GPU — Llama 3.1 405B (FP8) и Qwen2.5 72B (FP16) разворачиваются без шардинга.
HGX H200 8-GPU и DGX H200 — готовые платформы под inference и multi-GPU обучение через NVSwitch.
Срок поставки 4–6 недель через прямые квоты партнёров в ОАЭ и Гонконге. Договор с НДС, документы для ФНС, постоплата.

141 ГБHBM3e VRAM

4,8 ТБ/спропускная способность

900 ГБ/сNVLink 4

3958TFLOPS FP8

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA H200 · Hopper, 141 ГБ HBM3e

H200 — рефреш Hopper-архитектуры от NVIDIA: тот же чип GH100, что и в H100, но с увеличенным до 141 ГБ HBM3e VRAM и пропускной способностью 4,8 ТБ/с (+43% vs H100). Подходит для обучения и инференса LLM до 405B параметров.

2 форм-фактора · SXM5 + NVL

Hopper · SXM5

NVIDIA H200 SXM 141 ГБ HBM3e

Память141 ГБ HBM3e

Пропускная способность4,8 ТБ/с

Форм-факторSXM5 (для HGX)

NVLink 4900 ГБ/с

TDPдо 700 Вт

FP8 (Transformer Engine)3958 TFLOPS

FP161979 TFLOPS

Срок поставки 4–6 недель · квота партнёра

Hopper · PCIe

NVIDIA H200 NVL 141 ГБ HBM3e · PCIe

Память141 ГБ HBM3e

Пропускная способность4,8 ТБ/с

Форм-фактор2-слот PCIe 5.0

NVLink 4 (bridge)попарно, до 900 ГБ/с

TDPдо 600 Вт

FP83341 TFLOPS

Совместимостьобычные PCIe-серверы

Срок 4–6 недель · подходит под обычные стойки

Hopper · Платформа

NVIDIA HGX H200 8× H200 SXM

Конфигурация8× H200 SXM5

Суммарный VRAM1128 ГБ HBM3e

NVSwitch4× NVLink-4 Switch

Внутренний bandwidth7,2 ТБ/с

Energy~6,5 кВт стойка

Дляобучения и inference 70-405B

Под заказ от 6 недель · 5 партнёров платформы (SuperMicro, Dell, Gigabyte, ASUS, Lenovo)

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

H200 vs H100 vs A100

Какой Hopper-GPU выбрать под задачу: чек, память, скорость инференса LLM

Ampere

NVIDIA A100

Память40 / 80 ГБ HBM2e

Пропускная сп.1,5 / 2,0 ТБ/с

FP16312 TFLOPS

FP8—

NVLink600 ГБ/с (NVLink 3)

Год2020

Ценапо запросу

Подходит для inference моделей до 70B, обучения средних моделей, R&D-задач. Выпускается с 2020 года.

Hopper

NVIDIA H100

Память80 ГБ HBM3

Пропускная сп.3,35 ТБ/с

FP161979 TFLOPS

FP83958 TFLOPS

NVLink900 ГБ/с (NVLink 4)

Год2022

Ценапо запросу

Hopper-архитектура, Transformer Engine, поддержка FP8. Используется для обучения и инференса моделей 70-200B.

Hopper Refresh ★

NVIDIA H200

Память141 ГБ HBM3e

Пропускная сп.4,8 ТБ/с (+43%)

FP161979 TFLOPS

FP83958 TFLOPS

NVLink900 ГБ/с (NVLink 4)

Год2024

Ценапо запросу

141 ГБ HBM3e вмещает Llama 405B в FP8 на одной карте — без шардинга и NVLink-фабрики из нескольких GPU.

Подробное сравнение с бенчмарками и кейсами — в нашей статье (готовится).

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про H200

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

H200 — апгрейд Hopper-архитектуры. Главное отличие: 141 ГБ HBM3e против 80 ГБ HBM3 у H100, и пропускная способность памяти 4,8 ТБ/с против 3,35 ТБ/с. Вычислительные ядра те же — архитектура Hopper не изменилась. На задачах с большим контекстом (LLM 70B+) H200 даёт буст 1,4–1,9× за счёт памяти. Те же CUDA, Transformer Engine, FP8 — переход без переписывания кода.

141 ГБ HBM3e позволяет развернуть на 1 GPU без шардинга: Llama 3.1 70B (FP16), Llama 3.1 405B (FP8), Qwen2.5 72B (FP16), DeepSeek-V3 (FP8 с подкачкой). Для обучения от 70B параметров обычно нужно 4–8 H200 в NVLink-кластере, для inference часто хватает 1–2.

H200 SXM5 — серверный форм-фактор 80×100 мм для платформ HGX/DGX (8 GPU на baseboard через NVSwitch). H200 NVL — PCIe-видеокарта (2 слота, 600 Вт TDP) для серверов с обычной PCIe-шиной, без NVSwitch. SXM даёт 900 ГБ/с межGPU через NVLink-4, NVL — попарный NVLink через bridge. Цена SXM выше на 15–25%, но он требует HGX-платформу. NVL ставится в любой современный сервер.

H200 — дефицитная модель, квоты у партнёров на Ближнем Востоке формируются под конкретный PO. Типичный сценарий 8× H200 SXM в HGX-сервере — 4-6 недель с подписания. Конфигурация H200 NVL под MGX сервер (до 8× PCIe) — 3-5 недель, проще логистика без baseboard. Отдельные H200 NVL карты иногда есть на складе в Дубае, тогда 10-14 дней до Москвы. По кластеру 32+ GPU — делим на транши.

H200 учитывается у юрлица как объект ОС, ОКОФ 320.26.20.13, амортизация типично 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС. ЭДО через Диадок или СБИС, по запросу — Контур. Комплект для ФНС: договор поставки, спецификация по серийникам, УПД, ТН, нотификация ФСБ по криптомодулю, копия ДТ с отметкой выпуска. Расчёты в валюте партнёра в ОАЭ или Гонконге проходят на стороне иностранной компании группы, вам приходит счёт в ₽.

Стандартная гарантия NVIDIA 3 года с даты выпуска чипа. У партнёра в ОАЭ держим подменный фонд под H200, поэтому RMA проходит за 7-14 дней по PCIe-картам H200 NVL. Для SXM-модулей в составе HGX замена идёт целым GPU board (это политика NVIDIA по baseboard), 14-21 день. Опцию on-site Москва согласуем отдельно — на H200 чаще берут, дорогая карта простаивать не должна.

Типичные сценарии

Под что берут NVIDIA H200

Большой контекст

Llama 405B FP8 на одной карте

141 ГБ HBM3e вмещают Llama 3.1 405B в FP8 без шардинга. Для инференса с context window 128k — одна H200 справляется там, где у H100 требовалось две.

RAG в проде

Корпоративный поиск с эмбеддингами

4× H200 NVL в PCIe-сервере под связку embedder + retriever + reranker + 70B-генератор. 4,8 ТБ/с памяти убирают bottleneck при высоком QPS.

Training

Pre-train MoE моделей

8× H200 SXM в HGX с NVSwitch — рабочая платформа для pre-train DeepSeek-V3-класса (671B параметров с активацией 37B). Память H200 снимает MoE-офлоадинг на CPU.