Volta · 2017 · 16 или 32 ГБ HBM2

Купить NVIDIA Tesla V100 16 или 32 ГБ HBM2
— SXM2 и PCIe для R&D и инференса

Бюджетный legacy — дешевле A100 в 3-5 раз, дешевле H100 в 10-15 раз. Окупается под inference моделей до 7-13B и R&D-задачи.
FP16 Tensor 125 TFLOPS, 900 ГБ/с HBM2 — Volta, первое поколение Tensor Cores. NVLink 2 (300 ГБ/с между картами в DGX-1).
2 формы: SXM2 для платформ DGX-1 и HGX V100, PCIe для обычных серверов (TDP 250 Вт). 16 ГБ — чаще в наличии, 32 ГБ — под заказ.

32 ГБHBM2 VRAM

900 ГБ/спропускная сп.

125TFLOPS FP16 (SXM)

300 ГБ/сNVLink 2

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Спецификации

Технические характеристики
NVIDIA Tesla V100 · SXM2 и PCIe

Tesla V100 — карта архитектуры Volta для дата-центров, выпускается с 2017 года. 16 или 32 ГБ HBM2, NVLink 2 (300 ГБ/с), Tensor Cores первого поколения. Выпускается в двух формах: SXM2 для платформ DGX-1 V100 и HGX V100, и PCIe для обычных серверов. Цифры — из официального NVIDIA Tesla V100 datasheet.

2 формы · SXM2 / PCIe · 16 или 32 ГБ

Volta · SXM2 32 ГБ

Tesla V100 SXM2 32 ГБ HBM2

Память32 ГБ HBM2

Пропускная способность900 ГБ/с

FP16 Tensor125 TFLOPS

FP3215,7 TFLOPS

FP647,8 TFLOPS

NVLink 2300 ГБ/с

TDP300 Вт

Форм-факторSXM2 mezzanine

Год2017

Срок 5-15 рабочих дней · для DGX-1 / HGX V100

Volta · PCIe

Tesla V100 PCIe 16 / 32 ГБ HBM2

Память16 или 32 ГБ HBM2

Пропускная способность900 ГБ/с

FP16 Tensor112 TFLOPS

FP3214 TFLOPS

NVLink 2 (bridge)300 ГБ/с (между 2 карт)

TDP250 Вт

Форм-фактор2-слот PCIe Gen3, пассивное охл.

Год2017

Часто в наличии · ставится в любой PCIe Gen3+ сервер

Volta · SXM2 16 ГБ

Tesla V100 SXM2 16 ГБ HBM2

Память16 ГБ HBM2

Пропускная способность900 ГБ/с

FP16 Tensor125 TFLOPS

FP3215,7 TFLOPS

NVLink 2300 ГБ/с

TDP300 Вт

Подходит дляinference до 7B, обучение, R&D

Самый бюджетный вход в data-center сегмент NVIDIA

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение поколений

Tesla V100 vs A100 vs H100

Volta, Ampere, Hopper — три поколения NVIDIA, разделённые 5 годами и кратной разницей в производительности

Volta · 2017 ★

Tesla V100

Память16 / 32 ГБ HBM2

Пропускная сп.900 ГБ/с

FP16 Tensor125 TFLOPS

TF32 / FP8— / — (нет)

NVLink 2300 ГБ/с

Год2017

Ценапо запросу

Бюджетный legacy. Inference моделей до 7B, обучение средних задач, R&D, MLOps-курсы. Дешевле A100 в 3-5 раз.

Ampere · 2020

NVIDIA A100

Память40 / 80 ГБ HBM2e

Пропускная сп.2,04 ТБ/с

FP16 Tensor312 TFLOPS

TF32156 TFLOPS

NVLink 3600 ГБ/с

Год2020

Ценапо запросу

Зрелый рабочий конь ML 2020-2023. Inference до 30B, обучение моделей до 35B в FP16. MIG. В 2,5 раза быстрее V100.

Hopper · 2022

NVIDIA H100

Память80 ГБ HBM3

Пропускная сп.3,35 ТБ/с

FP16 Tensor1979 TFLOPS

FP8 (TE)3958 TFLOPS

NVLink 4900 ГБ/с

Год2022

Ценапо запросу

Hopper с Transformer Engine. В 15 раз быстрее V100 на FP16, в 30+ раз на LLM с FP8. Production-training моделей 70B+.

Подробно про A100 · H100 80 ГБ HBM3 · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Позвонить +7 (965) 310-00-00 Пн–Пт · 10:00–19:00 МСК

Telegram @aapermyakoff Среднее время ответа — 23 минуты

E-mail aleksandr@lcopper.ru КП в PDF в течение 1 рабочего дня

Получить КП

Менеджер свяжется в течение часа в рабочее время.

FAQ

Частые вопросы про Tesla V100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

Tesla V100 — Volta 2017 года, первое поколение Tensor Cores. FP16 125 TFLOPS, до 32 ГБ HBM2, NVLink 2 (300 ГБ/с). A100 (Ampere, 2020) — FP16 312 TFLOPS, до 80 ГБ HBM2e, NVLink 3 (600 ГБ/с), плюс TF32 и MIG. H100 (Hopper, 2022) — FP16 1979 TFLOPS, 80 ГБ HBM3, NVLink 4 (900 ГБ/с), FP8 и Transformer Engine. По соотношению цена/производительность V100 в 2026 году актуален только для R&D, лекций, маленьких inference-моделей. Для production-LLM 30B+ — A100 или H100.

В FP16 inference: Llama 2 7B без квантизации, Llama 3 8B, Mistral 7B, Qwen 7B. С квантизацией INT8: Llama 13B-30B. Llama 70B — не помещается даже с агрессивной квантизацией. На V100 нет BF16 в массовой поддержке, нет FP8 и TF32. Обучение small/medium моделей до 7B — реально, но медленнее A100 в 2,5 раза, чем H100 — в 8-10 раз. Для inference маленьких моделей в R&D-окружении и обучающих курсах подходит.

SXM2 — серверный форм-фактор для платформ DGX-1 V100 и HGX V100. TDP 300 Вт, NVLink 2 300 ГБ/с между GPU. Применяется в кластерах из 4-8 карт. PCIe — обычная 2-слот видеокарта, TDP 250 Вт. NVLink доступен только через bridge между двумя картами. SXM2 быстрее под длительной нагрузкой за счёт TDP-headroom и NVLink-фабрики, но требует совместимой платформы. PCIe ставится в любой совместимый сервер.

Для inference моделей до 7-13B — да, если объём запросов невысокий. Для тренировки LLM 30B+ — нет, экономика не сходится: один H100 SXM5 заменяет 8-10 V100 SXM2 по сырому FP16 и стоит существенно дешевле в эксплуатации (электричество + место). Окупаемость V100 в production-сценарии — только если карта уже куплена и работает. Для свежих установок 2026 года V100 выбирают под R&D, обучение, MLOps-курсы, тестовые стенды.

V100 снят с производства в 2022, рынок только вторичка. PCIe 16/32 ГБ у нас обычно есть в Москве, отгрузка за 3-7 рабочих дней по 1-4 картам. SXM2 16 ГБ — через decom-каналы облачных провайдеров и OEM-разборку HGX V100 / DGX-1, 1-3 недели. SXM2 32 ГБ — редкая позиция, ищем по запросу, иногда до 3-5 недель. Партии 8+ карт собираем под конкретный PO, по V100 это часто означает приёмку из разных лотов.

V100 проводится как объект ОС б/у, ОКОФ 320.26.20.13, амортизация обычно 2-3 года остаточная. Договор поставки с ООО «Легион», цена в ₽, отгрузка с НДС, ЭДО Диадок или СБИС. Бухгалтерская обвязка: договор + спецификация по серийникам + акт б/у с часами наработки и результатами стресс-теста + УПД + ТН + копия ДТ + нотификация ФСБ. Платёж в ₽ на счёт в РФ.

NVIDIA-гарантия на V100 истекла (карта снята с производства в 2022). Мы даём свою гарантию 3-6 месяцев на исправность после стресс-теста 48 часов у партнёра в ОАЭ: gpu-burn, memtest, термоциклирование, контроль ECC-ошибок. Замена при дефекте — из собственного фонда б/у-карт в Москве, 5-10 дней. Для production-инсталляций рекомендуем закладывать N+1 резерв в шасси, восстановление NVIDIA RMA по V100 уже невозможно.

Типичные сценарии

Под что берут Tesla V100

Учебные стенды

ВУЗы и MLOps-курсы

125 TFLOPS FP16 хватает на лекции, лабораторные с PyTorch, обучение моделей до 1-7B. Карты идут на учебные кластеры технических ВУЗов за недорого.

Inference 7B

Маленький LLM-сервис

V100 32 ГБ держит Llama 3 8B или Mistral 7B без квантизации в FP16. Под внутренний чат-бот с десятками RPS — рабочий и дешёвый вариант.

CV-инференс

Видеоаналитика и детекция

YOLO, ResNet, EfficientNet — модели CV-стека отлично работают на Volta. Берут под конвейеры видеоаналитики (распознавание автомобилей, людей, дефектов).