Ampere · 40 / 80 ГБ HBM2e · SXM4 и PCIe

Купить NVIDIA A100 40 или 80 ГБ HBM2e
— SXM4 и PCIe для ML и инференса

  • 80 ГБ HBM2e + 2,04 ТБ/с (SXM4) — инференс Llama 3 70B с квантизацией, обучение моделей до 35B в FP16. MIG до 7 инстансов.
  • FP16 / BF16 Tensor 312 TFLOPS, TF32 156 TFLOPS — Ampere. NVLink 3 (600 ГБ/с между картами в HGX A100).
  • 3 формы: SXM4 80 ГБ для HGX, SXM4 40 ГБ legacy, PCIe 80 ГБ для обычных серверов (TDP 250 Вт).
80 ГБHBM2e VRAM
2,04 ТБ/спропускная сп. (SXM)
312TFLOPS FP16
600 ГБ/сNVLink 3
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA A100 · три формы

A100 — карта архитектуры Ampere для дата-центров, выпускается с 2020 года. До 80 ГБ HBM2e, NVLink 3, MIG до 7 инстансов. Доступна в трёх формах: SXM4 80 ГБ, SXM4 40 ГБ (legacy), PCIe 80 ГБ. Цифры — из официального NVIDIA A100 datasheet.

3 формы · SXM4 80 / SXM4 40 / PCIe
NVIDIA A100 SXM4 80GB
Ampere · SXM4 80

NVIDIA A100 SXM4 80 ГБ HBM2e

Память80 ГБ HBM2e
Пропускная способность2,04 ТБ/с
FP16 / BF16 Tensor312 TFLOPS
TF32 Tensor156 TFLOPS
INT8 Tensor624 TOPS
FP64 Tensor19,5 TFLOPS
NVLink 3600 ГБ/с
TDP500 Вт
MIGдо 7 × 10 ГБ
Срок 3-5 недель · для HGX A100 4/8-GPU
NVIDIA A100 PCIe 80GB
Ampere · PCIe

NVIDIA A100 PCIe 80 ГБ HBM2e

Память80 ГБ HBM2e (есть и 40 ГБ HBM2)
Пропускная способность1,94 ТБ/с
FP16 / BF16 Tensor312 TFLOPS
TF32 Tensor156 TFLOPS
NVLink 3 (bridge)600 ГБ/с
TDP250 Вт
Форм-фактор2-слот PCIe Gen4, пассивное охл.
MIGдо 7 × 10 ГБ
Часто в наличии · ставится в любой PCIe-сервер
NVIDIA A100 SXM4 40GB
Ampere · SXM4 40 (legacy)

NVIDIA A100 SXM4 40 ГБ HBM2

Память40 ГБ HBM2
Пропускная способность1,55 ТБ/с
FP16 / BF16 Tensor312 TFLOPS
TF32 Tensor156 TFLOPS
NVLink 3600 ГБ/с
TDP400 Вт
Год2020 (первый релиз)
Подходит дляinference до 13B, R&D, обучение
Дешевле 80 ГБ версии в 1,5-2 раза · вторичка
Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

A100 vs H100 vs Tesla V100

Ampere, Hopper, Volta — три поколения NVIDIA на одной шкале для AI и инференса

Volta · 2017

NVIDIA Tesla V100

Память16 / 32 ГБ HBM2
Пропускная сп.900 ГБ/с
FP16 Tensor125 TFLOPS
TF32— (нет, добавлен в Ampere)
NVLink 2300 ГБ/с
Год2017
Ценапо запросу

Legacy для inference маленьких моделей, R&D, обучения с ограниченным бюджетом. В наличии на вторичке.

Ampere · 2020 ★

NVIDIA A100

Память40 / 80 ГБ HBM2e
Пропускная сп.1,55 / 2,04 ТБ/с
FP16 Tensor312 TFLOPS
TF32156 TFLOPS
NVLink 3600 ГБ/с
Год2020
Ценапо запросу

Зрелый рабочий конь ML 2020-2023. Inference до 30B, обучение моделей до 35B в FP16. MIG до 7. Дешевле H100 в 2-2,5 раза.

Hopper · 2022

NVIDIA H100

Память80 ГБ HBM3
Пропускная сп.3,35 ТБ/с (SXM)
FP16 Tensor1979 TFLOPS
FP83958 TFLOPS (TE)
NVLink 4900 ГБ/с
Год2022
Ценапо запросу

Hopper с Transformer Engine и FP8. Буст 2-3× на LLM vs A100. Главная карта для training 70B+ и production-инференса.

Подробно про H100 · H200 141 ГБ HBM3e · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про A100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

SXM4 — серверный форм-фактор для платформ HGX A100 (4 или 8 GPU на одной baseboard через NVLink 3). TDP 400 Вт (40 ГБ) или 500 Вт (80 ГБ), пропускная способность памяти до 2,04 ТБ/с. PCIe — стандартный 2-слот PCIe Gen4, ставится в любой совместимый сервер. TDP 250 Вт, та же память 80 ГБ HBM2e, но пропускная способность 1,94 ТБ/с. Пиковые FP16/BF16 TFLOPS одинаковые — 312, но при длительной нагрузке SXM держит частоту лучше.
Под инференс в FP16: Llama 3 70B с квантизацией INT8 или AWQ, Llama 2 70B (с AWQ), Qwen 32B без квантизации, Llama 3 8B и 13B с большим batch. В FP16 без квантизации помещаются модели до 35-40B. У A100 нет FP8 (он появился в Hopper), поэтому 70B в нативной форме не помещается — нужна квантизация или 2-3 карты с шардингом.
H100 быстрее A100 в задачах LLM в 2-3 раза за счёт FP8 и Transformer Engine. По FP16 разница меньше — около 1,6× (1979 TFLOPS у H100 vs 312 у A100, но это пиковые числа). H100 дороже A100 в 2-2,5 раза. A100 имеет смысл, если: (1) нужен бюджетный вход в data-center сегмент, (2) задачи R&D и инференс моделей до 30B, (3) FP8 не критичен. Для training больших моделей и production-LLM 70B+ — H100 или H200.
MIG позволяет разделить один A100 на 7 изолированных GPU-инстансов с отдельной памятью, кэшем и compute-блоком. Полезно для multi-tenancy в облаках, размещения нескольких inference-моделей на одной карте, или R&D-команд с разными задачами. Каждый инстанс получает гарантированную долю QoS. Включается через nvidia-smi mig на хосте.
A100 уже несколько лет в производстве, ходит и на вторичке. PCIe (80 ГБ) часто есть в Москве со склада — по отдельным картам отгружаем за 2-5 рабочих дней. Партии 4-8 PCIe — 2-4 недели через ОАЭ. SXM4 поставляем только под HGX-платформу (4× или 8× GPU на baseboard), 3-5 недель. Если бюджет жмёт — смотрим вторичку из decom-кластеров облачных провайдеров, тогда 1-3 недели, но уже с нашей гарантией, а не NVIDIA.
A100 в учёте — объект ОС с амортизацией 3-5 лет, ОКОФ 320.26.20.13. На вторичке часто учитывают через 4 года из-за ускоренного морального устаревания. Договор с ООО «Легион», цена в ₽, отгрузка с НДС. ЭДО через Диадок или СБИС. Комплект для ФНС: договор поставки + спецификация по серийникам + УПД + ТН + копия ДТ + нотификация ФСБ. По вторичной партии добавляем акт б/у с историей наработки. Платите в ₽ на счёт в РФ, валютная часть на стороне иностранной компании группы.
На новые A100 NVIDIA даёт гарантию 1 год по OEM-каналу, у партнёров есть опция продления до 3 лет. По A100 из вторички (decom OEM или data-center pulls) NVIDIA-гарантию уже не дают — мы покрываем своей гарантией 6-12 месяцев, после стресс-тестов 48 часов на нашем стенде в ОАЭ. Подменный фонд по A100 PCIe в Москве держим небольшой — замена 5-10 дней. SXM4-модули заказываем под RMA, 14-21 день.
Типичные сценарии

Под что берут NVIDIA A100

Бюджетный data-center

Вход в Ampere вместо Hopper

A100 80 ГБ стоит в 2-2.5 раза дешевле H100. Под R&D-задачи лабораторий, обучение моделей до 30B и inference моделей до Llama 13B — разница в скорости не окупает разницу в цене.

HPC

FP64-вычисления в науке

19,5 TFLOPS FP64 Tensor у A100 — рабочая платформа для CFD, молекулярной динамики и квантовой химии. Берут университеты и R&D-центры под CUDA-Fortran и PyTorch+HPC.

MIG для лабы

7 студентов на одной карте

Через MIG режем A100 80 ГБ на 7 инстансов по ~10 ГБ. Подходит ВУЗам и ML-командам с multi-tenant подходом, каждый получает изолированный compute.