Ampere · 40 / 80 ГБ HBM2e · SXM4 и PCIe

Купить NVIDIA A100 40 или 80 ГБ HBM2e
— SXM4 и PCIe для ML и инференса

80 ГБ HBM2e + 2,04 ТБ/с (SXM4) — инференс Llama 3 70B с квантизацией, обучение моделей до 35B в FP16. MIG до 7 инстансов.
FP16 / BF16 Tensor 312 TFLOPS, TF32 156 TFLOPS — Ampere. NVLink 3 (600 ГБ/с между картами в HGX A100).
3 формы: SXM4 80 ГБ для HGX, SXM4 40 ГБ legacy, PCIe 80 ГБ для обычных серверов (TDP 250 Вт).

80 ГБHBM2e VRAM

2,04 ТБ/спропускная сп. (SXM)

312TFLOPS FP16

600 ГБ/сNVLink 3

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA A100 · три формы

A100 — карта архитектуры Ampere для дата-центров, выпускается с 2020 года. До 80 ГБ HBM2e, NVLink 3, MIG до 7 инстансов. Доступна в трёх формах: SXM4 80 ГБ, SXM4 40 ГБ (legacy), PCIe 80 ГБ. Цифры — из официального NVIDIA A100 datasheet.

3 формы · SXM4 80 / SXM4 40 / PCIe

Ampere · SXM4 80

NVIDIA A100 SXM4 80 ГБ HBM2e

Память80 ГБ HBM2e

Пропускная способность2,04 ТБ/с

FP16 / BF16 Tensor312 TFLOPS

TF32 Tensor156 TFLOPS

INT8 Tensor624 TOPS

FP64 Tensor19,5 TFLOPS

NVLink 3600 ГБ/с

TDP500 Вт

MIGдо 7 × 10 ГБ

Срок 3-5 недель · для HGX A100 4/8-GPU

Ampere · PCIe

NVIDIA A100 PCIe 80 ГБ HBM2e

Память80 ГБ HBM2e (есть и 40 ГБ HBM2)

Пропускная способность1,94 ТБ/с

FP16 / BF16 Tensor312 TFLOPS

TF32 Tensor156 TFLOPS

NVLink 3 (bridge)600 ГБ/с

TDP250 Вт

Форм-фактор2-слот PCIe Gen4, пассивное охл.

MIGдо 7 × 10 ГБ

Часто в наличии · ставится в любой PCIe-сервер

Ampere · SXM4 40 (legacy)

NVIDIA A100 SXM4 40 ГБ HBM2

Память40 ГБ HBM2

Пропускная способность1,55 ТБ/с

FP16 / BF16 Tensor312 TFLOPS

TF32 Tensor156 TFLOPS

NVLink 3600 ГБ/с

TDP400 Вт

Год2020 (первый релиз)

Подходит дляinference до 13B, R&D, обучение

Дешевле 80 ГБ версии в 1,5-2 раза · вторичка

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение

A100 vs H100 vs Tesla V100

Ampere, Hopper, Volta — три поколения NVIDIA на одной шкале для AI и инференса

Volta · 2017

NVIDIA Tesla V100

Память16 / 32 ГБ HBM2

Пропускная сп.900 ГБ/с

FP16 Tensor125 TFLOPS

TF32— (нет, добавлен в Ampere)

NVLink 2300 ГБ/с

Год2017

Ценапо запросу

Legacy для inference маленьких моделей, R&D, обучения с ограниченным бюджетом. В наличии на вторичке.

Ampere · 2020 ★

NVIDIA A100

Память40 / 80 ГБ HBM2e

Пропускная сп.1,55 / 2,04 ТБ/с

FP16 Tensor312 TFLOPS

TF32156 TFLOPS

NVLink 3600 ГБ/с

Год2020

Ценапо запросу

Зрелый рабочий конь ML 2020-2023. Inference до 30B, обучение моделей до 35B в FP16. MIG до 7. Дешевле H100 в 2-2,5 раза.

Hopper · 2022

NVIDIA H100

Память80 ГБ HBM3

Пропускная сп.3,35 ТБ/с (SXM)

FP16 Tensor1979 TFLOPS

FP83958 TFLOPS (TE)

NVLink 4900 ГБ/с

Год2022

Ценапо запросу

Hopper с Transformer Engine и FP8. Буст 2-3× на LLM vs A100. Главная карта для training 70B+ и production-инференса.

Подробно про H100 · H200 141 ГБ HBM3e · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про A100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

SXM4 — серверный форм-фактор для платформ HGX A100 (4 или 8 GPU на одной baseboard через NVLink 3). TDP 400 Вт (40 ГБ) или 500 Вт (80 ГБ), пропускная способность памяти до 2,04 ТБ/с. PCIe — стандартный 2-слот PCIe Gen4, ставится в любой совместимый сервер. TDP 250 Вт, та же память 80 ГБ HBM2e, но пропускная способность 1,94 ТБ/с. Пиковые FP16/BF16 TFLOPS одинаковые — 312, но при длительной нагрузке SXM держит частоту лучше.

Под инференс в FP16: Llama 3 70B с квантизацией INT8 или AWQ, Llama 2 70B (с AWQ), Qwen 32B без квантизации, Llama 3 8B и 13B с большим batch. В FP16 без квантизации помещаются модели до 35-40B. У A100 нет FP8 (он появился в Hopper), поэтому 70B в нативной форме не помещается — нужна квантизация или 2-3 карты с шардингом.

H100 быстрее A100 в задачах LLM в 2-3 раза за счёт FP8 и Transformer Engine. По FP16 разница меньше — около 1,6× (1979 TFLOPS у H100 vs 312 у A100, но это пиковые числа). H100 дороже A100 в 2-2,5 раза. A100 имеет смысл, если: (1) нужен бюджетный вход в data-center сегмент, (2) задачи R&D и инференс моделей до 30B, (3) FP8 не критичен. Для training больших моделей и production-LLM 70B+ — H100 или H200.

MIG позволяет разделить один A100 на 7 изолированных GPU-инстансов с отдельной памятью, кэшем и compute-блоком. Полезно для multi-tenancy в облаках, размещения нескольких inference-моделей на одной карте, или R&D-команд с разными задачами. Каждый инстанс получает гарантированную долю QoS. Включается через nvidia-smi mig на хосте.

A100 уже несколько лет в производстве, ходит и на вторичке. PCIe (80 ГБ) часто есть в Москве со склада — по отдельным картам отгружаем за 2-5 рабочих дней. Партии 4-8 PCIe — 2-4 недели через ОАЭ. SXM4 поставляем только под HGX-платформу (4× или 8× GPU на baseboard), 3-5 недель. Если бюджет жмёт — смотрим вторичку из decom-кластеров облачных провайдеров, тогда 1-3 недели, но уже с нашей гарантией, а не NVIDIA.

A100 в учёте — объект ОС с амортизацией 3-5 лет, ОКОФ 320.26.20.13. На вторичке часто учитывают через 4 года из-за ускоренного морального устаревания. Договор с ООО «Легион», цена в ₽, отгрузка с НДС. ЭДО через Диадок или СБИС. Комплект для ФНС: договор поставки + спецификация по серийникам + УПД + ТН + копия ДТ + нотификация ФСБ. По вторичной партии добавляем акт б/у с историей наработки. Платите в ₽ на счёт в РФ, валютная часть на стороне иностранной компании группы.

На новые A100 NVIDIA даёт гарантию 1 год по OEM-каналу, у партнёров есть опция продления до 3 лет. По A100 из вторички (decom OEM или data-center pulls) NVIDIA-гарантию уже не дают — мы покрываем своей гарантией 6-12 месяцев, после стресс-тестов 48 часов на нашем стенде в ОАЭ. Подменный фонд по A100 PCIe в Москве держим небольшой — замена 5-10 дней. SXM4-модули заказываем под RMA, 14-21 день.

Типичные сценарии

Под что берут NVIDIA A100

Бюджетный data-center

Вход в Ampere вместо Hopper

A100 80 ГБ стоит в 2-2.5 раза дешевле H100. Под R&D-задачи лабораторий, обучение моделей до 30B и inference моделей до Llama 13B — разница в скорости не окупает разницу в цене.

HPC

FP64-вычисления в науке

19,5 TFLOPS FP64 Tensor у A100 — рабочая платформа для CFD, молекулярной динамики и квантовой химии. Берут университеты и R&D-центры под CUDA-Fortran и PyTorch+HPC.

MIG для лабы

7 студентов на одной карте

Через MIG режем A100 80 ГБ на 7 инстансов по ~10 ГБ. Подходит ВУЗам и ML-командам с multi-tenant подходом, каждый получает изолированный compute.