Turing · 2018 · 16 ГБ GDDR6 · 70 Вт

Купить NVIDIA Tesla T4 16 ГБ GDDR6
— single-slot, 70 Вт для edge inference

  • 70 Вт без доп. питания — ставится в любой 1U-сервер. Прямой предшественник L4 — тот же форм-фактор и TDP.
  • FP16 Tensor 65 TFLOPS, INT8 130 TOPS, INT4 260 TOPS — Turing. Подходит для inference маленьких моделей и classical ML.
  • Бюджетный legacy — дешевле L4 в 2-3 раза на вторичке. Логичный выбор, когда нужна замена в существующей T4-инфраструктуре.
16 ГБGDDR6
70 ВтTDP, без доп.питания
130TOPS INT8
1-slot LPв любой 1U-сервер
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
Tesla T4 · single-slot LP

Tesla T4 — компактная PCIe-карта архитектуры Turing, выпускается с 2018 года. 16 ГБ GDDR6, TDP 70 Вт без дополнительного питания. На момент 2026 г. — legacy, заменяемая на L4. Цифры — из официального NVIDIA Tesla T4 datasheet.

single-slot · 70 Вт · legacy 2018
NVIDIA Tesla T4 16GB GDDR6
Turing · 2018

NVIDIA Tesla T4 16 ГБ GDDR6

Память16 ГБ GDDR6
Пропускная способность320 ГБ/с
FP328,1 TFLOPS
FP16 Tensor65 TFLOPS
INT8 Tensor130 TOPS
INT4 Tensor260 TOPS
FP8 / BF16— (нет, добавлены позже)
TDP70 Вт (без доп. питания)
Форм-факторsingle-slot low-profile PCIe Gen3
NVENC / NVDECTuring 7-го поколения
vGPUподдерживается
Год2018
Срок 5-14 рабочих дней · вторичный рынок + складские остатки партнёров

Edge inference

Llama 7B INT8, BERT, RoBERTa, классификаторы. TensorRT-оптимизация. Масс-сервис простых ML-задач.

Video transcoding

NVENC/NVDEC Turing-поколения, до 22 параллельных H.264 streams. Стриминг, видеохостинги.

VDI и vGPU

Виртуальные рабочие столы для офисов и студий. Партиционирование на нескольких арендаторов.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение compact-карт

Tesla T4 vs L4 vs Tesla V100

T4 — массовая бюджетная карта для edge. L4 — её прямой наследник. V100 — другой класс (HBM, training)

Turing · 2018 ★

Tesla T4

Память16 ГБ GDDR6
Пропускная сп.320 ГБ/с
FP16 Tensor65 TFLOPS
INT8 Tensor130 TOPS
Форм-факторsingle-slot LP
TDP70 Вт
Ценапо запросу

Бюджетная legacy для edge inference, video transcoding, VDI. Дешевле L4 в 2-3 раза на вторичке.

Ada Lovelace · 72 Вт

NVIDIA L4

Память24 ГБ GDDR6 ECC
Пропускная сп.300 ГБ/с
FP16 Tensor121 TFLOPS
FP8 Tensor242 TFLOPS
Форм-факторsingle-slot LP
TDP72 Вт
Ценапо запросу

Прямой наследник T4 в 2023. +8 ГБ памяти, FP8, BF16, в 1,8 раза быстрее на FP16.

Volta · 2017 · 300 Вт

Tesla V100

Память16 / 32 ГБ HBM2
Пропускная сп.900 ГБ/с
FP16 Tensor125 TFLOPS
NVLink 2300 ГБ/с
Форм-факторSXM2 / dual-slot PCIe
TDP300 Вт
Ценапо запросу

Другая лига: HBM2 и NVLink для тренировки. Не PCIe-compact-карта, а serious data-center training GPU.

Подробно про L4 · Tesla V100 · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про Tesla T4

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

L4 — наследник T4 на Ada Lovelace, выпускается с 2023 года. По производительности: L4 быстрее T4 в 1,8 раза на FP16 (121 vs 65 TFLOPS), в 1,9 раза на INT8 (242 vs 130 TOPS). У L4 на 8 ГБ больше памяти (24 vs 16 ГБ), есть FP8 и BF16 (у T4 нет). Тот же форм-фактор и TDP. Если новое внедрение — берите L4. T4 — для замены вышедшей из строя карты в существующей инфраструктуре или если бюджет существенно ограничен (T4 дешевле L4 в 2-3 раза на вторичке).
Edge inference маленьких моделей (Llama 7B INT8, Phi-3 mini, BERT, RoBERTa, классификаторы), video transcoding (NVENC/NVDEC Turing-поколения, до 22 параллельных H.264), VDI (виртуальные рабочие столы), масс-сервис простых ML-задач (TensorRT инференс). Не подходит: тренировка LLM, FP8-инференс, рендеринг, тяжёлые модели от 13B.
С ограничениями. В FP16: Llama 7B без квантизации, Phi-3 mini, Mistral 7B с маленьким контекстом. В INT8: Llama 13B с агрессивной квантизацией. На 16 ГБ помещается мало. Latency на T4 в 2-3 раза выше чем на L4 и в 10-15 раз выше чем на A100. Для R&D, прототипирования, MLOps-курсов — годится. Для production-LLM 2026 — нет.
T4 широко распространена в production-серверах с 2018 года, многие задачи переведены на TensorRT-оптимизации именно под Turing. Заменить T4 на L4 — это пересборка пайплайна и капекс. Поэтому многие команды держат T4 в эксплуатации и докупают карты с вторичного рынка для замены вышедших из строя. Также T4 встречается в готовых серверных конфигурациях у Tier-1 партнёров (Dell, HPE, Supermicro).
T4 как массовая карта Turing-поколения часто есть в Москве: по 1-2 штукам отгружаем за 3-7 рабочих дней. Партии 8-20 карт идут с вторичного рынка decom-серверов (Dell PowerEdge R740, HPE DL380 Gen10 и т.п.) — 1-3 недели. Новые в ритейл-упаковке встречаются всё реже, NVIDIA сворачивает производство; если нужна новая — срок 3-5 недель через дистрибьюторов ОАЭ. Готовые серверы с 4-8 T4 (под VDI или CV) собираем 2-4 недели.
T4 проводится у юрлица как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет, на вторичной партии чаще 2-3 года остаточная. Договор поставки с ООО «Легион», цена в ₽, отгрузка с НДС, ЭДО Диадок или СБИС. Бухгалтерская обвязка: договор, спецификация по серийникам, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ. По б/у-партии прикладываем акт с часами наработки и логом стресс-теста.
NVIDIA-гарантия по T4 практически выработана (карта 2018 года, end-of-sale объявлен). На новые партии из последних производственных серий ещё держится 6-12 месяцев. На вторичку даём свою гарантию 3-6 месяцев после стресс-теста 48 часов у партнёра в ОАЭ: gpu-burn, memtest, проверка NVENC-блоков. Подменный фонд по T4 в Москве есть — замена 3-7 дней. Для production-VDI и видеоаналитики рекомендуем N+1 резерв.
Типичные сценарии

Под что берут Tesla T4

VDI

Виртуальные рабочие столы

vGPU с T4 (Citrix, VMware Horizon, NVIDIA RTX vWS) — классика корпоративного VDI. На одной карте до 16 рабочих столов с офисными задачами + лёгкой графикой.

Замена существующих

Поддержка legacy-инфраструктуры

У команды уже собран ML-пайплайн на TensorRT под Turing — миграция на Ada дорогая. Берут T4 на замену вышедших из строя карт, чтобы не переписывать инференс-сервис.

Edge CV

Маленький CV-инференс

70 Вт без доп. питания + 16 ГБ GDDR6 закрывают YOLO-стек, классификацию, OCR на объектах с ограниченной мощностью. Цена в разы ниже L4 при похожем сценарии.