Ada Lovelace · 48 ГБ GDDR6 ECC · PCIe dual-slot

Купить NVIDIA L40S 48 ГБ GDDR6 ECC
— Ada Lovelace для inference и рендера

  • 48 ГБ GDDR6 ECC + 864 ГБ/с — Llama 3 13B в FP16, Llama 3 30B в FP8. FP8 Tensor Engine даёт 733 TFLOPS, рендер Omniverse, video transcoding.
  • FP8 733 TFLOPS, FP16 366 TFLOPS — Ada Lovelace. RT Cores 3-го поколения для трассировки лучей. Без NVLink (только PCIe Gen4 dual-slot).
  • TDP 350 Вт — ставится в любой совместимый PCIe-сервер. Поддерживает vGPU для multi-tenancy и облачных провайдеров.
48 ГБGDDR6 ECC
864 ГБ/спропускная сп.
733TFLOPS FP8
350 ВтTDP, PCIe Gen4
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA L40S · PCIe dual-slot

L40S — PCIe-карта архитектуры Ada Lovelace для дата-центров, выпускается с 2023 года. 48 ГБ GDDR6 ECC, FP8 Tensor Engine, RT Cores 3-го поколения. Подходит для смешанных нагрузок: inference, рендер, video transcoding, multi-tenancy. Цифры — из официального NVIDIA L40S datasheet.

PCIe dual-slot · 350 Вт · без NVLink
NVIDIA L40S 48GB GDDR6
Ada Lovelace · PCIe

NVIDIA L40S 48 ГБ GDDR6 ECC

Память48 ГБ GDDR6 ECC
Пропускная способность864 ГБ/с
FP3291,6 TFLOPS
TF32 Tensor183 TFLOPS
FP16 / BF16 Tensor366 TFLOPS (733 с sparsity)
FP8 Tensor733 TFLOPS (1466 с sparsity)
INT8 Tensor733 TOPS (1466 с sparsity)
TDP350 Вт
Форм-факторdual-slot PCIe Gen4
NVLinkнет (только PCIe)
vGPUподдерживается
RT Cores3-го поколения
Срок 2-4 недели · в каталогах SuperMicro, Dell, ASUS, Gigabyte

Inference LLM до 30B

Llama 3 13B FP16, Llama 3 30B FP8, Qwen 32B FP8. Batch 1-4 — реал-тайм. Дешевле A100 PCIe в 1,5-2 раза.

Рендер и Omniverse

RT Cores 3-го поколения, поддержка Unreal Engine, Blender, V-Ray. Часто закупают рендер-фермы и студии.

Video transcoding и vGPU

До 10 потоков H.264/HEVC одновременно. vGPU для облаков и multi-tenancy.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение PCIe-карт

L40S vs A100 PCIe vs L4

Три PCIe-карты для дата-центров на одной шкале: 24 / 48 / 80 ГБ, разные сценарии

Ada Lovelace · 72 Вт

NVIDIA L4

Память24 ГБ GDDR6
Пропускная сп.300 ГБ/с
FP16 Tensor121 TFLOPS
FP8 Tensor242 TFLOPS
Форм-факторsingle-slot LP
TDP72 Вт (без доп. питания)
Ценапо запросу

Edge inference, video transcoding в масс-сервисах. Влезает в любой 1U-сервер без доп. питания.

Ada Lovelace · 350 Вт ★

NVIDIA L40S

Память48 ГБ GDDR6 ECC
Пропускная сп.864 ГБ/с
FP16 Tensor366 TFLOPS
FP8 Tensor733 TFLOPS
Форм-факторdual-slot PCIe Gen4
TDP350 Вт
Ценапо запросу

Универсальная карта для inference, рендера и multi-tenancy. RT Cores и FP8 в одном корпусе.

Ampere · 250 Вт

NVIDIA A100 PCIe

Память40 / 80 ГБ HBM2e
Пропускная сп.1,94 ТБ/с
FP16 Tensor312 TFLOPS
FP8— (нет, добавлен в Hopper)
Форм-факторdual-slot PCIe Gen4
NVLink600 ГБ/с через bridge
Ценапо запросу

HBM-память для крупных моделей, MIG до 7, NVLink-bridge для кластеров.

Подробно про L4 · A100 80 ГБ HBM2e · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про L40S

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

L40S имеет FP8 Tensor (733 TFLOPS) и Transformer Engine, A100 PCIe — нет. По FP16 L40S (366 TFLOPS) уступает A100 PCIe (312 TFLOPS на бумаге, но в реальности около одинаково). У L40S 48 ГБ GDDR6 vs 80 ГБ HBM2e у A100 — A100 быстрее по памяти (1,94 ТБ/с vs 864 ГБ/с) и помещает больше моделей. L40S — для inference моделей до 30B, рендеринга, video transcoding, RT Cores для лучей. A100 PCIe — для HBM-нагрузок, MIG, NVLink-кластеров. Цена: L40S обычно дешевле A100 80GB PCIe на 30-50%.
L40S позиционируется как универсальная PCIe-карта для дата-центров (inference + рендер + video). HBM нужен под огромную пропускную способность памяти для training больших LLM. Для inference моделей до 30B, рендеринга 3D-сцен и видеоэнкодинга 864 ГБ/с GDDR6 ECC хватает. Это упрощает производство и снижает цену в 2-3 раза vs HBM-карты. Минус — нельзя обучать большие LLM с тяжёлой работой по памяти.
В FP16 inference: Llama 3 8B, Mistral 7B, Qwen 7B без квантизации; Llama 13B с квантизацией. В FP8 (Transformer Engine): Llama 13-30B без квантизации, Qwen 32B. Llama 70B — только с агрессивной INT4-квантизацией или шардингом на 2 карты. Для training моделей 7B+ — медленнее A100 в 1,5 раза, но реально. Для inference c batch size 1-4 — отлично, batch 16+ зависит от модели.
Да, L40S создан с прицелом на смешанные нагрузки. Внутри есть RT Cores 3-го поколения (для трассировки лучей), CUDA Cores для general-purpose, и Tensor Cores 4-го поколения с FP8. Используется в Omniverse, Unreal Engine, рендер-фермах, для video transcoding (10x H.264/HEVC streams). Поддерживает GPU-партиционирование (vGPU) для облачных провайдеров — несколько арендаторов на одной карте.
L40S как PCIe-карта производства — поставляется массово через NVIDIA Authorized Distributors в ОАЭ и Гонконге. По 1-2 картам обычно отгружаем из Москвы за 3-7 рабочих дней (держим складские остатки под частые заказы). Партии 4-8 карт под один сервер — 2-4 недели через ОАЭ. Готовые сервера с L40S (Supermicro AS-2125GS-TNR, Dell PowerEdge XE9680 и аналоги) собираются 3-5 недель в зависимости от конфигурации шасси, NVMe и сети.
L40S ставится на баланс как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС. ЭДО Диадок или СБИС, по запросу — Контур.ЭДО. Бухгалтерская обвязка: договор, спецификация по серийникам, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ. Оплата в ₽ на счёт в РФ, постоплата после приёмки на вашем складе.
На L40S стандартная NVIDIA-гарантия 12 месяцев, опция расширения до 24-36 месяцев под корпоративного клиента (через NVIDIA Enterprise Care). Подменный фонд по L40S в Москве у нас минимальный из-за широкой доступности карты — замена 5-10 дней, забираем из складского остатка партнёра. На кейсы с HFT, медициной или видеоаналитикой согласуем on-site инженера в Москве по договорному NBD.
Типичные сценарии

Под что берут NVIDIA L40S

Inference 7-30B

Корпоративный LLM-сервис

FP8 Tensor 733 TFLOPS + 48 ГБ GDDR6 ECC закрывают inference моделей 7-30B без квантизации. 4 L40S в PCIe-сервере дают разумный TCO под корпоративный чат-бот.

Рендер и Omniverse

3D-визуализация и цифровые двойники

RT Cores 3-го поколения + NVIDIA Omniverse — L40S держит сцены для цифровых двойников заводов, архитектурной визуализации, продуктового рендера.

Video AI

Транскодирование и аналитика видео

До 10 параллельных потоков H.264/HEVC и AV1 на одной карте. Используется в OTT-сервисах, видеоконференциях, видеоаналитике трафика и ритейла.