Ada Lovelace · 24 ГБ GDDR6 · 72 Вт single-slot

Купить NVIDIA L4 24 ГБ GDDR6
— single-slot, 72 Вт для edge inference

  • 72 Вт без доп. питания — ставится в любой 1U-сервер без замены БП и охлаждения. ECC-память, vGPU, лицензированный data-center driver.
  • FP8 242 TFLOPS, FP16 121 TFLOPS — Ada Lovelace с Transformer Engine. 24 ГБ GDDR6 для inference моделей до 13B.
  • Single-slot low-profile — компактная карта для массового масштабирования: edge-узлы, video transcoding, multi-tenancy в облаках.
24 ГБGDDR6
72 ВтTDP, без доп.питания
242TFLOPS FP8
1-slot LPв любой 1U-сервер
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA L4 · single-slot LP

L4 — компактная PCIe-карта архитектуры Ada Lovelace, выпускается с 2023 года. 24 ГБ GDDR6, TDP 72 Вт без дополнительного питания, single-slot low-profile. Создана как наследник Tesla T4. Цифры — из официального NVIDIA L4 datasheet.

single-slot · 72 Вт · plug-and-play
NVIDIA L4 24GB GDDR6
Ada Lovelace · 72 Вт

NVIDIA L4 24 ГБ GDDR6

Память24 ГБ GDDR6
Пропускная способность300 ГБ/с
FP3230,3 TFLOPS
TF32 Tensor60,7 TFLOPS
FP16 / BF16 Tensor121 TFLOPS (242 с sparsity)
FP8 Tensor242 TFLOPS (485 с sparsity)
INT8 Tensor242 TOPS (485 с sparsity)
TDP72 Вт (без доп. питания)
Форм-факторsingle-slot low-profile PCIe Gen4
NVLinkнет
vGPUподдерживается
Memory ECCда
Срок 1-3 недели · plug-and-play в 1U / 2U / edge-серверы

Edge inference

Llama 3 8B FP16, Mistral 7B. Десятки карт в стойке, масштабирование по числу инстансов.

Video transcoding

H.264, HEVC, AV1 декодер 4-го поколения. Стриминг-сервисы и видеоконтент.

vGPU и облака

Партиционирование одной карты на несколько арендаторов. ECC, лицензированный data-center driver.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение compact-карт

L4 vs Tesla T4 vs L40S

L4 — прямой наследник Tesla T4. L40S — старший брат для серьёзных нагрузок

Turing · 2018

Tesla T4

Память16 ГБ GDDR6
Пропускная сп.320 ГБ/с
FP16 Tensor65 TFLOPS
INT8 Tensor130 TOPS
Форм-факторsingle-slot LP
TDP70 Вт
Ценапо запросу

Legacy 2018 года. Прямой предшественник L4. Дешевле в 2-3 раза, но без FP8 и BF16.

Ada Lovelace · 72 Вт ★

NVIDIA L4

Память24 ГБ GDDR6 ECC
Пропускная сп.300 ГБ/с
FP16 Tensor121 TFLOPS
FP8 Tensor242 TFLOPS
Форм-факторsingle-slot LP
TDP72 Вт (без доп. питания)
Ценапо запросу

Replacement для T4 на Ada Lovelace. FP8, BF16, +8 ГБ памяти, тот же форм-фактор. Сменили T4 в 2023.

Ada Lovelace · 350 Вт

NVIDIA L40S

Память48 ГБ GDDR6 ECC
Пропускная сп.864 ГБ/с
FP16 Tensor366 TFLOPS
FP8 Tensor733 TFLOPS
Форм-факторdual-slot
TDP350 Вт
Ценапо запросу

Старший брат L4 для серьёзных задач. В 3 раза больше памяти, в 3 раза больше FP8. RT Cores для рендера.

Подробно про Tesla T4 · L40S 48 ГБ · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про L4

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

Разные сегменты. L4 — компактный single-slot low-profile с TDP 72 Вт без доп. питания, ставится в любой 1U-сервер. 24 ГБ GDDR6. Подходит для масс-инференса (десятки карт в стойке), video transcoding, edge-сценариев. L40S — dual-slot, TDP 350 Вт, 48 ГБ GDDR6 ECC, FP8 в 3 раза мощнее. Универсальная карта для inference моделей до 30B и рендера. Они дополняют друг друга: L4 — для масштабирования по числу инстансов, L40S — для тяжёлых задач.
L4 потребляет до 72 Вт и питается напрямую через PCIe-слот (75 Вт лимит по спецификации). Это значит, что её можно поставить в любой сервер с PCIe-слотом — не нужны 6/8-пиновые разъёмы дополнительного питания и не нужен мощный БП. Это огромный плюс для plug-and-play в существующую инфраструктуру: 1U-серверы, edge-узлы, телекоммуникационные стойки.
В FP16 inference: Llama 3 8B без квантизации, Mistral 7B, Qwen 7B, Phi-3 14B с квантизацией. В FP8: Llama 3 8B с большим batch, Qwen 7B с большим batch. Llama 13B — на границе, помещается с INT8 или AWQ. Llama 70B и выше — не помещается. L4 — для inference маленьких и средних моделей с упором на масштабирование (много карт, много пользователей), а не на пиковую производительность одной.
RTX 4090 24 ГБ заметно мощнее L4 по FP16 (165 vs 121 TFLOPS) и FP32 (82,6 vs 30,3 TFLOPS) — она дешевле. Минусы 4090 для дата-центра: TDP 450 Вт (нужно мощное питание и охлаждение), 3-слотный размер, нет ECC, нет vGPU, нет официальной поддержки 24/7 в data-center, лицензионные ограничения NVIDIA на использование GeForce в коммерческих ЦОД. L4 — спокойная карта для production: ECC, 72 Вт, vGPU, лицензированный data-center driver, NVIDIA AI Enterprise.
L4 — массовая карта Ada Lovelace под edge-сценарии, по ней нет экспортных квот в дефиците. Поштучно и по 4-8 картам отгружаем из Москвы за 3-7 рабочих дней — держим складские остатки под типовой 1U-сервер. Партии 20+ карт для масштабного inference-фронта — 2-3 недели через хаб в ОАЭ. Если нужен готовый сервер с 4-8 L4 (например, Supermicro SYS-110P-WTR с PCIe-расширением) — цикл 3-4 недели.
L4 как PCIe-карта data-center класса проводится у юрлица как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС, ЭДО Диадок или СБИС. Комплект для ФНС: договор поставки, спецификация по серийникам, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ. Оплата с расчётного счёта в РФ. На партии 20+ карт можем согласовать рассрочку по поставкам.
NVIDIA-гарантия 12 месяцев по стандарту, опция расширения до 24-36 месяцев через NVIDIA Enterprise Care. По L4 проще всего — карта дешёвая, держим в Москве небольшой подменный фонд, замена 3-7 дней. Для инсталляций с десятками карт рекомендуем закладывать N+2 резерв в стойке: при 72 Вт TDP и single-slot форматe это бюджетно. RMA через NVIDIA канал занимает 14-21 день, если нет подмены.
Типичные сценарии

Под что берут NVIDIA L4

Edge AI

Видеоаналитика на промплощадке

72 Вт без доп. питания и single-slot — L4 встаёт в любой 1U-сервер на объекте. Под CV-конвейеры на складе, заводе, в ритейле — детекция, OCR, биометрия.

Inference 7-8B

LLM-фронт на десятки RPS

24 ГБ GDDR6 держат Llama 3 8B в FP16 без квантизации. Масштабируется горизонтально — 8 L4 в одном сервере дают распределённый inference-кластер на 1U.

Video AI

Транскодинг и стриминг

AV1 encoder в L4 нативно даёт 130 потоков SD-качества или десятки FHD. Используется в CDN, OTT-платформах, IPTV-провайдерах под экономный транскод.