Hopper · 80 ГБ HBM3 · SXM 5 / PCIe / NVL

Купить NVIDIA H100 80 ГБ HBM3
— SXM, PCIe, NVL для AI и LLM

80 ГБ HBM3 + 3,35 ТБ/с (SXM5) — Llama 3 70B в FP8, Qwen2 32B в FP16. Transformer Engine с FP8 даёт буст 2-3× vs A100.
FP8 3958 TFLOPS, FP16 1979 TFLOPS — флагманский Hopper. NVLink 4 (900 ГБ/с между картами в HGX H100).
3 форм-фактора: SXM5 для платформ HGX/DGX, PCIe для обычных серверов, NVL — бендл из двух карт с 188 ГБ суммарно.

80 ГБHBM3 VRAM

3,35 ТБ/спропускная сп. (SXM)

3958TFLOPS FP8

900 ГБ/сNVLink 4

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA H100 · три форм-фактора

H100 — флагман Hopper-архитектуры NVIDIA. 80 ГБ HBM3, Transformer Engine с FP8, NVLink 4. Выпускается в трёх вариантах: SXM5 для HGX/DGX, PCIe для обычных серверов и NVL (бендл из двух карт). Цифры — из официального NVIDIA H100 datasheet.

3 форм-фактора · SXM, PCIe, NVL

Hopper · SXM5

NVIDIA H100 SXM 80 ГБ HBM3

Память80 ГБ HBM3

Пропускная способность3,35 ТБ/с

FP8 Tensor3958 TFLOPS

FP16 / BF161979 TFLOPS

FP64 Tensor67 TFLOPS

NVLink 4900 ГБ/с

PCIeGen5 128 ГБ/с

TDPдо 700 Вт

MIGдо 7 × 10 ГБ

Срок поставки 3-5 недель · для HGX H100 8-GPU

Hopper · PCIe

NVIDIA H100 PCIe 80 ГБ HBM3

Память80 ГБ HBM3

Пропускная способность2 ТБ/с

FP8 Tensor3026 TFLOPS

FP16 / BF161513 TFLOPS

FP64 Tensor51 TFLOPS

NVLink 4 (bridge)600 ГБ/с

TDP300-350 Вт

Форм-фактор2-слот PCIe Gen5, воздушное охл.

MIGдо 7 × 10 ГБ

Часто в наличии · ставится в любой PCIe-сервер

Hopper · NVL

NVIDIA H100 NVL 188 ГБ (2× 94 ГБ HBM3)

Конфигурация2× H100 PCIe + NVLink bridge

Суммарная память188 ГБ HBM3

FP8 Tensor сумм.7916 TFLOPS

FP16 сумм.3958 TFLOPS

TDP сумм.2× 350-400 Вт

NVLink 4600 ГБ/с

Форм-фактор2× PCIe dual-slot

Подходит дляinference 70-100B без шардинга

Срок 3-4 недели · для серверов без HGX

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

H100 vs H200 vs A100

Hopper, Hopper Refresh, Ampere — три поколения NVIDIA для AI и LLM

Ampere

NVIDIA A100

Память40 / 80 ГБ HBM2e

Пропускная сп.1,5 / 2,0 ТБ/с

FP16 Tensor312 TFLOPS

FP8— (нет, добавлен в Hopper)

NVLink 3600 ГБ/с

Год2020

Ценапо запросу

Зрелый Ampere. Подходит для inference моделей до 30B, R&D, средних задач. Дешевле H100 примерно в 2-3 раза.

Hopper ★

NVIDIA H100

Память80 ГБ HBM3

Пропускная сп.3,35 ТБ/с (SXM)

FP16 Tensor1979 TFLOPS

FP83958 TFLOPS (TE)

NVLink 4900 ГБ/с

Год2022

Ценапо запросу

Главный data-center GPU 2022-2024. Transformer Engine с FP8 даёт 2-3× буст на LLM. Покрывает 80% AI-задач: training, inference, RAG.

Hopper Refresh

NVIDIA H200

Память141 ГБ HBM3e

Пропускная сп.4,8 ТБ/с (+43%)

FP161979 TFLOPS (тот же)

FP83958 TFLOPS (тот же)

NVLink 4900 ГБ/с

Год2024

Ценапо запросу

Тот же чип Hopper, но +43% памяти и пропускной способности. Llama 405B FP8 на 1 GPU. Когда нужен большой контекст.

Подробно про H200 · Blackwell B200 · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про H100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

H100 SXM5 — серверный форм-фактор для платформ HGX/DGX (8 GPU на baseboard через NVSwitch). 700 Вт TDP, NVLink 4 900 ГБ/с, 3958 TFLOPS FP8. H100 PCIe — обычная PCIe-видеокарта (2-слот), 300-350 Вт TDP, NVLink 600 ГБ/с через bridge, 3026 TFLOPS FP8 (~80% от SXM). H100 NVL — бендл из двух H100 PCIe карт с NVLink-мостиком, 188 ГБ суммарной памяти (2×94 ГБ HBM3). SXM требует HGX-платформу, PCIe и NVL ставятся в обычные серверы.

Transformer Engine — это специализированный блок в Hopper, который автоматически переключает вычисления между FP8 и FP16 в зависимости от слоя модели. FP8 (8-битный float) даёт в 2 раза больше TFLOPS и меньше VRAM-потребления, но требует калибровки. На H100 SXM это 3958 TFLOPS FP8 (vs 1979 в FP16). Для тренировки LLM Transformer Engine + FP8 даёт буст в 2-3 раза vs A100 без потери точности.

Тот же чип Hopper, тот же FP8 (3958 TFLOPS), тот же NVLink. Главное отличие — память: 80 ГБ HBM3 у H100 vs 141 ГБ HBM3e у H200, и пропускная способность 3,35 ТБ/с vs 4,8 ТБ/с. На задачах с большим контекстом (LLM 70B+) H200 даёт буст 1,4-1,9× за счёт памяти. По чеку H200 дороже на 20-30%. Если планируется работа с моделями 70B+ — берите H200. Для inference моделей до 30B — достаточно H100.

Под inference (FP16): Llama 3 70B (без шардинга, с тесной квантизацией), Llama 3 8B / 13B с большим batch, Qwen2 32B. В FP8: Llama 70B с запасом, Qwen 72B возможно с шардингом. Для обучения 70B+ обычно нужно 8 H100 в HGX-конфигурации через NVLink. На H100 NVL (188 ГБ) можно работать с 70-100B без агрессивной квантизации.

По одиночным H100 PCIe (80 ГБ) часто есть остатки в Москве, отгружаем за 2-5 рабочих дней. Партии 4-8 карт PCIe — 2-3 недели через хаб в ОАЭ. H100 SXM поставляем только в составе HGX-сервера 8× GPU с NVSwitch (это Tier-1 сборка Supermicro / Dell / Gigabyte), цикл 4-6 недель. H100 NVL (бендл 2× 94 ГБ) идёт под заказ, 3-5 недель. Если нужен кластер 32+ GPU — разнесём по двум партиям, чтобы не ловить квоту целиком.

H100 как data-center GPU ставится у юрлица на баланс ОС, ОКОФ 320.26.20.13, средняя амортизация 3-5 лет. Договор поставки с ООО «Легион», цена в рублях, отгрузка с НДС, документооборот через Диадок или СБИС. Бухгалтерская обвязка: договор + спецификация + счёт-фактура + УПД + ТН + нотификация ФСБ + ДТ с отметкой выпуска. Оплата с расчётного счёта в РФ, постоплата после приёмки на вашем складе.

На H100 действует стандартная гарантия NVIDIA 3 года с даты производства. Подменный фонд держим у партнёра в ОАЭ — если карта вышла из строя, отправляем замену из буфера, а дефектная едет на разбор по RMA. Среднее время замены 7-14 дней по PCIe, по SXM дольше — модуль идёт назад на baseboard. Можем оформить опцию on-site инженера в Москве, согласуем в договоре.

Типичные сценарии

Под что берут NVIDIA H100

LLM inference

Llama 3 70B FP8 в проде

1× H100 SXM 80 ГБ держит Llama 70B в FP8 без шардинга, latency ~35 мс/токен при batch=8. Под продакшен-чатбот с 100 rps хватает 4 карт.

Fine-tune

Дообучение 13B-30B

8× H100 SXM в HGX через NVSwitch — стандартный конвейер для LoRA и full fine-tune моделей 13B-30B. Эпоха на 1 млн токенов считается 40-90 минут.

Multi-tenant

7 MIG-инстансов на карту

Через MIG режем H100 на 7 инстансов по 10 ГБ — подходит R&D-команде из 5-7 человек или для размещения нескольких inference-моделей <7B на одной карте.