Ada Lovelace · 48 ГБ GDDR6 ECC · PCIe dual-slot

Купить NVIDIA L40S 48 ГБ GDDR6 ECC
— Ada Lovelace для inference и рендера

48 ГБ GDDR6 ECC + 864 ГБ/с — Llama 3 13B в FP16, Llama 3 30B в FP8. FP8 Tensor Engine даёт 733 TFLOPS, рендер Omniverse, video transcoding.
FP8 733 TFLOPS, FP16 366 TFLOPS — Ada Lovelace. RT Cores 3-го поколения для трассировки лучей. Без NVLink (только PCIe Gen4 dual-slot).
TDP 350 Вт — ставится в любой совместимый PCIe-сервер. Поддерживает vGPU для multi-tenancy и облачных провайдеров.

48 ГБGDDR6 ECC

864 ГБ/спропускная сп.

733TFLOPS FP8

350 ВтTDP, PCIe Gen4

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA L40S · PCIe dual-slot

L40S — PCIe-карта архитектуры Ada Lovelace для дата-центров, выпускается с 2023 года. 48 ГБ GDDR6 ECC, FP8 Tensor Engine, RT Cores 3-го поколения. Подходит для смешанных нагрузок: inference, рендер, video transcoding, multi-tenancy. Цифры — из официального NVIDIA L40S datasheet.

PCIe dual-slot · 350 Вт · без NVLink

Ada Lovelace · PCIe

NVIDIA L40S 48 ГБ GDDR6 ECC

Память48 ГБ GDDR6 ECC

Пропускная способность864 ГБ/с

FP3291,6 TFLOPS

TF32 Tensor183 TFLOPS

FP16 / BF16 Tensor366 TFLOPS (733 с sparsity)

FP8 Tensor733 TFLOPS (1466 с sparsity)

INT8 Tensor733 TOPS (1466 с sparsity)

TDP350 Вт

Форм-факторdual-slot PCIe Gen4

NVLinkнет (только PCIe)

vGPUподдерживается

RT Cores3-го поколения

Срок 2-4 недели · в каталогах SuperMicro, Dell, ASUS, Gigabyte

Inference LLM до 30B

Llama 3 13B FP16, Llama 3 30B FP8, Qwen 32B FP8. Batch 1-4 — реал-тайм. Дешевле A100 PCIe в 1,5-2 раза.

Рендер и Omniverse

RT Cores 3-го поколения, поддержка Unreal Engine, Blender, V-Ray. Часто закупают рендер-фермы и студии.

Video transcoding и vGPU

До 10 потоков H.264/HEVC одновременно. vGPU для облаков и multi-tenancy.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение PCIe-карт

L40S vs A100 PCIe vs L4

Три PCIe-карты для дата-центров на одной шкале: 24 / 48 / 80 ГБ, разные сценарии

Ada Lovelace · 72 Вт

NVIDIA L4

Память24 ГБ GDDR6

Пропускная сп.300 ГБ/с

FP16 Tensor121 TFLOPS

FP8 Tensor242 TFLOPS

Форм-факторsingle-slot LP

TDP72 Вт (без доп. питания)

Ценапо запросу

Edge inference, video transcoding в масс-сервисах. Влезает в любой 1U-сервер без доп. питания.

Ada Lovelace · 350 Вт ★

NVIDIA L40S

Память48 ГБ GDDR6 ECC

Пропускная сп.864 ГБ/с

FP16 Tensor366 TFLOPS

FP8 Tensor733 TFLOPS

Форм-факторdual-slot PCIe Gen4

TDP350 Вт

Ценапо запросу

Универсальная карта для inference, рендера и multi-tenancy. RT Cores и FP8 в одном корпусе.

Ampere · 250 Вт

NVIDIA A100 PCIe

Память40 / 80 ГБ HBM2e

Пропускная сп.1,94 ТБ/с

FP16 Tensor312 TFLOPS

FP8— (нет, добавлен в Hopper)

Форм-факторdual-slot PCIe Gen4

NVLink600 ГБ/с через bridge

Ценапо запросу

HBM-память для крупных моделей, MIG до 7, NVLink-bridge для кластеров.

Подробно про L4 · A100 80 ГБ HBM2e · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про L40S

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

L40S имеет FP8 Tensor (733 TFLOPS) и Transformer Engine, A100 PCIe — нет. По FP16 L40S (366 TFLOPS) уступает A100 PCIe (312 TFLOPS на бумаге, но в реальности около одинаково). У L40S 48 ГБ GDDR6 vs 80 ГБ HBM2e у A100 — A100 быстрее по памяти (1,94 ТБ/с vs 864 ГБ/с) и помещает больше моделей. L40S — для inference моделей до 30B, рендеринга, video transcoding, RT Cores для лучей. A100 PCIe — для HBM-нагрузок, MIG, NVLink-кластеров. Цена: L40S обычно дешевле A100 80GB PCIe на 30-50%.

L40S позиционируется как универсальная PCIe-карта для дата-центров (inference + рендер + video). HBM нужен под огромную пропускную способность памяти для training больших LLM. Для inference моделей до 30B, рендеринга 3D-сцен и видеоэнкодинга 864 ГБ/с GDDR6 ECC хватает. Это упрощает производство и снижает цену в 2-3 раза vs HBM-карты. Минус — нельзя обучать большие LLM с тяжёлой работой по памяти.

В FP16 inference: Llama 3 8B, Mistral 7B, Qwen 7B без квантизации; Llama 13B с квантизацией. В FP8 (Transformer Engine): Llama 13-30B без квантизации, Qwen 32B. Llama 70B — только с агрессивной INT4-квантизацией или шардингом на 2 карты. Для training моделей 7B+ — медленнее A100 в 1,5 раза, но реально. Для inference c batch size 1-4 — отлично, batch 16+ зависит от модели.

Да, L40S создан с прицелом на смешанные нагрузки. Внутри есть RT Cores 3-го поколения (для трассировки лучей), CUDA Cores для general-purpose, и Tensor Cores 4-го поколения с FP8. Используется в Omniverse, Unreal Engine, рендер-фермах, для video transcoding (10x H.264/HEVC streams). Поддерживает GPU-партиционирование (vGPU) для облачных провайдеров — несколько арендаторов на одной карте.

L40S как PCIe-карта производства — поставляется массово через NVIDIA Authorized Distributors в ОАЭ и Гонконге. По 1-2 картам обычно отгружаем из Москвы за 3-7 рабочих дней (держим складские остатки под частые заказы). Партии 4-8 карт под один сервер — 2-4 недели через ОАЭ. Готовые сервера с L40S (Supermicro AS-2125GS-TNR, Dell PowerEdge XE9680 и аналоги) собираются 3-5 недель в зависимости от конфигурации шасси, NVMe и сети.

L40S ставится на баланс как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет. Договор с ООО «Легион», цена в рублях, отгрузка с НДС. ЭДО Диадок или СБИС, по запросу — Контур.ЭДО. Бухгалтерская обвязка: договор, спецификация по серийникам, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ. Оплата в ₽ на счёт в РФ, постоплата после приёмки на вашем складе.

На L40S стандартная NVIDIA-гарантия 12 месяцев, опция расширения до 24-36 месяцев под корпоративного клиента (через NVIDIA Enterprise Care). Подменный фонд по L40S в Москве у нас минимальный из-за широкой доступности карты — замена 5-10 дней, забираем из складского остатка партнёра. На кейсы с HFT, медициной или видеоаналитикой согласуем on-site инженера в Москве по договорному NBD.

Типичные сценарии

Под что берут NVIDIA L40S

Inference 7-30B

Корпоративный LLM-сервис

FP8 Tensor 733 TFLOPS + 48 ГБ GDDR6 ECC закрывают inference моделей 7-30B без квантизации. 4 L40S в PCIe-сервере дают разумный TCO под корпоративный чат-бот.

Рендер и Omniverse

3D-визуализация и цифровые двойники

RT Cores 3-го поколения + NVIDIA Omniverse — L40S держит сцены для цифровых двойников заводов, архитектурной визуализации, продуктового рендера.

Video AI

Транскодирование и аналитика видео

До 10 параллельных потоков H.264/HEVC и AV1 на одной карте. Используется в OTT-сервисах, видеоконференциях, видеоаналитике трафика и ритейла.

Купить NVIDIA L40S 48 ГБ GDDR6 ECC
— Ada Lovelace для inference и рендера

Получите КП
с ценой и сроком

Технические характеристики
NVIDIA L40S · PCIe dual-slot

NVIDIA L40S 48 ГБ GDDR6 ECC

Inference LLM до 30B

Рендер и Omniverse

Video transcoding и vGPU

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

L40S vs A100 PCIe vs L4

NVIDIA L4

NVIDIA L40S

NVIDIA A100 PCIe

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Получить КП

Частые вопросы про L40S

Под что берут NVIDIA L40S

Корпоративный LLM-сервис

3D-визуализация и цифровые двойники

Транскодирование и аналитика видео

Не нашли подходящую модель в каталоге?

Получить КП с ценой и сроком

Пришлём PDF-прайс с конфигурациями GPU-серверов

Купить NVIDIA L40S 48 ГБ GDDR6 ECC— Ada Lovelace для inference и рендера

Получите КПс ценой и сроком

Технические характеристикиNVIDIA L40S · PCIe dual-slot

NVIDIA L40S 48 ГБ GDDR6 ECC

Inference LLM до 30B

Рендер и Omniverse

Video transcoding и vGPU

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

L40S vs A100 PCIe vs L4

NVIDIA L4

NVIDIA L40S

NVIDIA A100 PCIe

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурациюи вышлем КПза 1 рабочий день

Получить КП

Частые вопросы про L40S

Под что берут NVIDIA L40S

Корпоративный LLM-сервис

3D-визуализация и цифровые двойники

Транскодирование и аналитика видео

Не нашли подходящую модель в каталоге?

Купить NVIDIA L40S 48 ГБ GDDR6 ECC
— Ada Lovelace для inference и рендера

Получите КП
с ценой и сроком

Технические характеристики
NVIDIA L40S · PCIe dual-slot

Соберём конфигурацию
и вышлем КП
за 1 рабочий день