Ada Lovelace · 24 ГБ GDDR6 · 72 Вт single-slot

Купить NVIDIA L4 24 ГБ GDDR6
— single-slot, 72 Вт для edge inference

72 Вт без доп. питания — ставится в любой 1U-сервер без замены БП и охлаждения. ECC-память, vGPU, лицензированный data-center driver.
FP8 242 TFLOPS, FP16 121 TFLOPS — Ada Lovelace с Transformer Engine. 24 ГБ GDDR6 для inference моделей до 13B.
Single-slot low-profile — компактная карта для массового масштабирования: edge-узлы, video transcoding, multi-tenancy в облаках.

24 ГБGDDR6

72 ВтTDP, без доп.питания

242TFLOPS FP8

1-slot LPв любой 1U-сервер

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA L4 · single-slot LP

L4 — компактная PCIe-карта архитектуры Ada Lovelace, выпускается с 2023 года. 24 ГБ GDDR6, TDP 72 Вт без дополнительного питания, single-slot low-profile. Создана как наследник Tesla T4. Цифры — из официального NVIDIA L4 datasheet.

single-slot · 72 Вт · plug-and-play

Ada Lovelace · 72 Вт

NVIDIA L4 24 ГБ GDDR6

Память24 ГБ GDDR6

Пропускная способность300 ГБ/с

FP3230,3 TFLOPS

TF32 Tensor60,7 TFLOPS

FP16 / BF16 Tensor121 TFLOPS (242 с sparsity)

FP8 Tensor242 TFLOPS (485 с sparsity)

INT8 Tensor242 TOPS (485 с sparsity)

TDP72 Вт (без доп. питания)

Форм-факторsingle-slot low-profile PCIe Gen4

NVLinkнет

vGPUподдерживается

Memory ECCда

Срок 1-3 недели · plug-and-play в 1U / 2U / edge-серверы

Edge inference

Llama 3 8B FP16, Mistral 7B. Десятки карт в стойке, масштабирование по числу инстансов.

Video transcoding

H.264, HEVC, AV1 декодер 4-го поколения. Стриминг-сервисы и видеоконтент.

vGPU и облака

Партиционирование одной карты на несколько арендаторов. ECC, лицензированный data-center driver.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение compact-карт

L4 vs Tesla T4 vs L40S

L4 — прямой наследник Tesla T4. L40S — старший брат для серьёзных нагрузок

Turing · 2018

Tesla T4

Память16 ГБ GDDR6

Пропускная сп.320 ГБ/с

FP16 Tensor65 TFLOPS

INT8 Tensor130 TOPS

Форм-факторsingle-slot LP

TDP70 Вт

Ценапо запросу

Legacy 2018 года. Прямой предшественник L4. Дешевле в 2-3 раза, но без FP8 и BF16.

Ada Lovelace · 72 Вт ★

NVIDIA L4

Память24 ГБ GDDR6 ECC

Пропускная сп.300 ГБ/с

FP16 Tensor121 TFLOPS

FP8 Tensor242 TFLOPS

Форм-факторsingle-slot LP

TDP72 Вт (без доп. питания)

Ценапо запросу

Replacement для T4 на Ada Lovelace. FP8, BF16, +8 ГБ памяти, тот же форм-фактор. Сменили T4 в 2023.

Ada Lovelace · 350 Вт

NVIDIA L40S

Память48 ГБ GDDR6 ECC

Пропускная сп.864 ГБ/с

FP16 Tensor366 TFLOPS

FP8 Tensor733 TFLOPS

Форм-факторdual-slot

TDP350 Вт

Ценапо запросу

Старший брат L4 для серьёзных задач. В 3 раза больше памяти, в 3 раза больше FP8. RT Cores для рендера.

Подробно про Tesla T4 · L40S 48 ГБ · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про L4

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

Разные сегменты. L4 — компактный single-slot low-profile с TDP 72 Вт без доп. питания, ставится в любой 1U-сервер. 24 ГБ GDDR6. Подходит для масс-инференса (десятки карт в стойке), video transcoding, edge-сценариев. L40S — dual-slot, TDP 350 Вт, 48 ГБ GDDR6 ECC, FP8 в 3 раза мощнее. Универсальная карта для inference моделей до 30B и рендера. Они дополняют друг друга: L4 — для масштабирования по числу инстансов, L40S — для тяжёлых задач.

L4 потребляет до 72 Вт и питается напрямую через PCIe-слот (75 Вт лимит по спецификации). Это значит, что её можно поставить в любой сервер с PCIe-слотом — не нужны 6/8-пиновые разъёмы дополнительного питания и не нужен мощный БП. Это огромный плюс для plug-and-play в существующую инфраструктуру: 1U-серверы, edge-узлы, телекоммуникационные стойки.

В FP16 inference: Llama 3 8B без квантизации, Mistral 7B, Qwen 7B, Phi-3 14B с квантизацией. В FP8: Llama 3 8B с большим batch, Qwen 7B с большим batch. Llama 13B — на границе, помещается с INT8 или AWQ. Llama 70B и выше — не помещается. L4 — для inference маленьких и средних моделей с упором на масштабирование (много карт, много пользователей), а не на пиковую производительность одной.

RTX 4090 24 ГБ заметно мощнее L4 по FP16 (165 vs 121 TFLOPS) и FP32 (82,6 vs 30,3 TFLOPS) — она дешевле. Минусы 4090 для дата-центра: TDP 450 Вт (нужно мощное питание и охлаждение), 3-слотный размер, нет ECC, нет vGPU, нет официальной поддержки 24/7 в data-center, лицензионные ограничения NVIDIA на использование GeForce в коммерческих ЦОД. L4 — спокойная карта для production: ECC, 72 Вт, vGPU, лицензированный data-center driver, NVIDIA AI Enterprise.

L4 — массовая карта Ada Lovelace под edge-сценарии, по ней нет экспортных квот в дефиците. Поштучно и по 4-8 картам отгружаем из Москвы за 3-7 рабочих дней — держим складские остатки под типовой 1U-сервер. Партии 20+ карт для масштабного inference-фронта — 2-3 недели через хаб в ОАЭ. Если нужен готовый сервер с 4-8 L4 (например, Supermicro SYS-110P-WTR с PCIe-расширением) — цикл 3-4 недели.

L4 как PCIe-карта data-center класса проводится у юрлица как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС, ЭДО Диадок или СБИС. Комплект для ФНС: договор поставки, спецификация по серийникам, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ. Оплата с расчётного счёта в РФ. На партии 20+ карт можем согласовать рассрочку по поставкам.

NVIDIA-гарантия 12 месяцев по стандарту, опция расширения до 24-36 месяцев через NVIDIA Enterprise Care. По L4 проще всего — карта дешёвая, держим в Москве небольшой подменный фонд, замена 3-7 дней. Для инсталляций с десятками карт рекомендуем закладывать N+2 резерв в стойке: при 72 Вт TDP и single-slot форматe это бюджетно. RMA через NVIDIA канал занимает 14-21 день, если нет подмены.

Типичные сценарии

Под что берут NVIDIA L4

Edge AI

Видеоаналитика на промплощадке

72 Вт без доп. питания и single-slot — L4 встаёт в любой 1U-сервер на объекте. Под CV-конвейеры на складе, заводе, в ритейле — детекция, OCR, биометрия.

Inference 7-8B

LLM-фронт на десятки RPS

24 ГБ GDDR6 держат Llama 3 8B в FP16 без квантизации. Масштабируется горизонтально — 8 L4 в одном сервере дают распределённый inference-кластер на 1U.

Video AI

Транскодинг и стриминг

AV1 encoder в L4 нативно даёт 130 потоков SD-качества или десятки FHD. Используется в CDN, OTT-платформах, IPTV-провайдерах под экономный транскод.

Купить NVIDIA L4 24 ГБ GDDR6
— single-slot, 72 Вт для edge inference

Получите КП
с ценой и сроком

Технические характеристики
NVIDIA L4 · single-slot LP

NVIDIA L4 24 ГБ GDDR6

Edge inference

Video transcoding

vGPU и облака

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

L4 vs Tesla T4 vs L40S

Tesla T4

NVIDIA L4

NVIDIA L40S

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Получить КП

Частые вопросы про L4

Под что берут NVIDIA L4

Видеоаналитика на промплощадке

LLM-фронт на десятки RPS

Транскодинг и стриминг

Не нашли подходящую модель в каталоге?

Получить КП с ценой и сроком

Пришлём PDF-прайс с конфигурациями GPU-серверов

Купить NVIDIA L4 24 ГБ GDDR6— single-slot, 72 Вт для edge inference

Получите КПс ценой и сроком

Технические характеристикиNVIDIA L4 · single-slot LP

NVIDIA L4 24 ГБ GDDR6

Edge inference

Video transcoding

vGPU и облака

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

L4 vs Tesla T4 vs L40S

Tesla T4

NVIDIA L4

NVIDIA L40S

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурациюи вышлем КПза 1 рабочий день

Получить КП

Частые вопросы про L4

Под что берут NVIDIA L4

Видеоаналитика на промплощадке

LLM-фронт на десятки RPS

Транскодинг и стриминг

Не нашли подходящую модель в каталоге?

Купить NVIDIA L4 24 ГБ GDDR6
— single-slot, 72 Вт для edge inference

Получите КП
с ценой и сроком

Технические характеристики
NVIDIA L4 · single-slot LP

Соберём конфигурацию
и вышлем КП
за 1 рабочий день