Hopper · 80 ГБ HBM3 · SXM 5 / PCIe / NVL

Купить NVIDIA H100 80 ГБ HBM3
— SXM, PCIe, NVL для AI и LLM

  • 80 ГБ HBM3 + 3,35 ТБ/с (SXM5) — Llama 3 70B в FP8, Qwen2 32B в FP16. Transformer Engine с FP8 даёт буст 2-3× vs A100.
  • FP8 3958 TFLOPS, FP16 1979 TFLOPS — флагманский Hopper. NVLink 4 (900 ГБ/с между картами в HGX H100).
  • 3 форм-фактора: SXM5 для платформ HGX/DGX, PCIe для обычных серверов, NVL — бендл из двух карт с 188 ГБ суммарно.
80 ГБHBM3 VRAM
3,35 ТБ/спропускная сп. (SXM)
3958TFLOPS FP8
900 ГБ/сNVLink 4
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA H100 · три форм-фактора

H100 — флагман Hopper-архитектуры NVIDIA. 80 ГБ HBM3, Transformer Engine с FP8, NVLink 4. Выпускается в трёх вариантах: SXM5 для HGX/DGX, PCIe для обычных серверов и NVL (бендл из двух карт). Цифры — из официального NVIDIA H100 datasheet.

3 форм-фактора · SXM, PCIe, NVL
NVIDIA H100 SXM5
Hopper · SXM5

NVIDIA H100 SXM 80 ГБ HBM3

Память80 ГБ HBM3
Пропускная способность3,35 ТБ/с
FP8 Tensor3958 TFLOPS
FP16 / BF161979 TFLOPS
FP64 Tensor67 TFLOPS
NVLink 4900 ГБ/с
PCIeGen5 128 ГБ/с
TDPдо 700 Вт
MIGдо 7 × 10 ГБ
Срок поставки 3-5 недель · для HGX H100 8-GPU
NVIDIA H100 PCIe
Hopper · PCIe

NVIDIA H100 PCIe 80 ГБ HBM3

Память80 ГБ HBM3
Пропускная способность2 ТБ/с
FP8 Tensor3026 TFLOPS
FP16 / BF161513 TFLOPS
FP64 Tensor51 TFLOPS
NVLink 4 (bridge)600 ГБ/с
TDP300-350 Вт
Форм-фактор2-слот PCIe Gen5, воздушное охл.
MIGдо 7 × 10 ГБ
Часто в наличии · ставится в любой PCIe-сервер
NVIDIA H100 NVL bundle
Hopper · NVL

NVIDIA H100 NVL 188 ГБ (2× 94 ГБ HBM3)

Конфигурация2× H100 PCIe + NVLink bridge
Суммарная память188 ГБ HBM3
FP8 Tensor сумм.7916 TFLOPS
FP16 сумм.3958 TFLOPS
TDP сумм.2× 350-400 Вт
NVLink 4600 ГБ/с
Форм-фактор2× PCIe dual-slot
Подходит дляinference 70-100B без шардинга
Срок 3-4 недели · для серверов без HGX
Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

H100 vs H200 vs A100

Hopper, Hopper Refresh, Ampere — три поколения NVIDIA для AI и LLM

Ampere

NVIDIA A100

Память40 / 80 ГБ HBM2e
Пропускная сп.1,5 / 2,0 ТБ/с
FP16 Tensor312 TFLOPS
FP8— (нет, добавлен в Hopper)
NVLink 3600 ГБ/с
Год2020
Ценапо запросу

Зрелый Ampere. Подходит для inference моделей до 30B, R&D, средних задач. Дешевле H100 примерно в 2-3 раза.

Hopper ★

NVIDIA H100

Память80 ГБ HBM3
Пропускная сп.3,35 ТБ/с (SXM)
FP16 Tensor1979 TFLOPS
FP83958 TFLOPS (TE)
NVLink 4900 ГБ/с
Год2022
Ценапо запросу

Главный data-center GPU 2022-2024. Transformer Engine с FP8 даёт 2-3× буст на LLM. Покрывает 80% AI-задач: training, inference, RAG.

Hopper Refresh

NVIDIA H200

Память141 ГБ HBM3e
Пропускная сп.4,8 ТБ/с (+43%)
FP161979 TFLOPS (тот же)
FP83958 TFLOPS (тот же)
NVLink 4900 ГБ/с
Год2024
Ценапо запросу

Тот же чип Hopper, но +43% памяти и пропускной способности. Llama 405B FP8 на 1 GPU. Когда нужен большой контекст.

Подробно про H200 · Blackwell B200 · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про H100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

H100 SXM5 — серверный форм-фактор для платформ HGX/DGX (8 GPU на baseboard через NVSwitch). 700 Вт TDP, NVLink 4 900 ГБ/с, 3958 TFLOPS FP8. H100 PCIe — обычная PCIe-видеокарта (2-слот), 300-350 Вт TDP, NVLink 600 ГБ/с через bridge, 3026 TFLOPS FP8 (~80% от SXM). H100 NVL — бендл из двух H100 PCIe карт с NVLink-мостиком, 188 ГБ суммарной памяти (2×94 ГБ HBM3). SXM требует HGX-платформу, PCIe и NVL ставятся в обычные серверы.
Transformer Engine — это специализированный блок в Hopper, который автоматически переключает вычисления между FP8 и FP16 в зависимости от слоя модели. FP8 (8-битный float) даёт в 2 раза больше TFLOPS и меньше VRAM-потребления, но требует калибровки. На H100 SXM это 3958 TFLOPS FP8 (vs 1979 в FP16). Для тренировки LLM Transformer Engine + FP8 даёт буст в 2-3 раза vs A100 без потери точности.
Тот же чип Hopper, тот же FP8 (3958 TFLOPS), тот же NVLink. Главное отличие — память: 80 ГБ HBM3 у H100 vs 141 ГБ HBM3e у H200, и пропускная способность 3,35 ТБ/с vs 4,8 ТБ/с. На задачах с большим контекстом (LLM 70B+) H200 даёт буст 1,4-1,9× за счёт памяти. По чеку H200 дороже на 20-30%. Если планируется работа с моделями 70B+ — берите H200. Для inference моделей до 30B — достаточно H100.
Под inference (FP16): Llama 3 70B (без шардинга, с тесной квантизацией), Llama 3 8B / 13B с большим batch, Qwen2 32B. В FP8: Llama 70B с запасом, Qwen 72B возможно с шардингом. Для обучения 70B+ обычно нужно 8 H100 в HGX-конфигурации через NVLink. На H100 NVL (188 ГБ) можно работать с 70-100B без агрессивной квантизации.
По одиночным H100 PCIe (80 ГБ) часто есть остатки в Москве, отгружаем за 2-5 рабочих дней. Партии 4-8 карт PCIe — 2-3 недели через хаб в ОАЭ. H100 SXM поставляем только в составе HGX-сервера 8× GPU с NVSwitch (это Tier-1 сборка Supermicro / Dell / Gigabyte), цикл 4-6 недель. H100 NVL (бендл 2× 94 ГБ) идёт под заказ, 3-5 недель. Если нужен кластер 32+ GPU — разнесём по двум партиям, чтобы не ловить квоту целиком.
H100 как data-center GPU ставится у юрлица на баланс ОС, ОКОФ 320.26.20.13, средняя амортизация 3-5 лет. Договор поставки с ООО «Легион», цена в рублях, отгрузка с НДС, документооборот через Диадок или СБИС. Бухгалтерская обвязка: договор + спецификация + счёт-фактура + УПД + ТН + нотификация ФСБ + ДТ с отметкой выпуска. Оплата с расчётного счёта в РФ, постоплата после приёмки на вашем складе.
На H100 действует стандартная гарантия NVIDIA 3 года с даты производства. Подменный фонд держим у партнёра в ОАЭ — если карта вышла из строя, отправляем замену из буфера, а дефектная едет на разбор по RMA. Среднее время замены 7-14 дней по PCIe, по SXM дольше — модуль идёт назад на baseboard. Можем оформить опцию on-site инженера в Москве, согласуем в договоре.
Типичные сценарии

Под что берут NVIDIA H100

LLM inference

Llama 3 70B FP8 в проде

1× H100 SXM 80 ГБ держит Llama 70B в FP8 без шардинга, latency ~35 мс/токен при batch=8. Под продакшен-чатбот с 100 rps хватает 4 карт.

Fine-tune

Дообучение 13B-30B

8× H100 SXM в HGX через NVSwitch — стандартный конвейер для LoRA и full fine-tune моделей 13B-30B. Эпоха на 1 млн токенов считается 40-90 минут.

Multi-tenant

7 MIG-инстансов на карту

Через MIG режем H100 на 7 инстансов по 10 ГБ — подходит R&D-команде из 5-7 человек или для размещения нескольких inference-моделей <7B на одной карте.