Volta · 2017 · 16 или 32 ГБ HBM2

Купить NVIDIA Tesla V100 16 или 32 ГБ HBM2
— SXM2 и PCIe для R&D и инференса

  • Бюджетный legacy — дешевле A100 в 3-5 раз, дешевле H100 в 10-15 раз. Окупается под inference моделей до 7-13B и R&D-задачи.
  • FP16 Tensor 125 TFLOPS, 900 ГБ/с HBM2 — Volta, первое поколение Tensor Cores. NVLink 2 (300 ГБ/с между картами в DGX-1).
  • 2 формы: SXM2 для платформ DGX-1 и HGX V100, PCIe для обычных серверов (TDP 250 Вт). 16 ГБ — чаще в наличии, 32 ГБ — под заказ.
32 ГБHBM2 VRAM
900 ГБ/спропускная сп.
125TFLOPS FP16 (SXM)
300 ГБ/сNVLink 2
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Спецификации

Технические характеристики
NVIDIA Tesla V100 · SXM2 и PCIe

Tesla V100 — карта архитектуры Volta для дата-центров, выпускается с 2017 года. 16 или 32 ГБ HBM2, NVLink 2 (300 ГБ/с), Tensor Cores первого поколения. Выпускается в двух формах: SXM2 для платформ DGX-1 V100 и HGX V100, и PCIe для обычных серверов. Цифры — из официального NVIDIA Tesla V100 datasheet.

2 формы · SXM2 / PCIe · 16 или 32 ГБ
NVIDIA Tesla V100 SXM2 32GB
Volta · SXM2 32 ГБ

Tesla V100 SXM2 32 ГБ HBM2

Память32 ГБ HBM2
Пропускная способность900 ГБ/с
FP16 Tensor125 TFLOPS
FP3215,7 TFLOPS
FP647,8 TFLOPS
NVLink 2300 ГБ/с
TDP300 Вт
Форм-факторSXM2 mezzanine
Год2017
Срок 5-15 рабочих дней · для DGX-1 / HGX V100
NVIDIA Tesla V100 PCIe 32GB
Volta · PCIe

Tesla V100 PCIe 16 / 32 ГБ HBM2

Память16 или 32 ГБ HBM2
Пропускная способность900 ГБ/с
FP16 Tensor112 TFLOPS
FP3214 TFLOPS
NVLink 2 (bridge)300 ГБ/с (между 2 карт)
TDP250 Вт
Форм-фактор2-слот PCIe Gen3, пассивное охл.
Год2017
Часто в наличии · ставится в любой PCIe Gen3+ сервер
NVIDIA Tesla V100 SXM2 16GB
Volta · SXM2 16 ГБ

Tesla V100 SXM2 16 ГБ HBM2

Память16 ГБ HBM2
Пропускная способность900 ГБ/с
FP16 Tensor125 TFLOPS
FP3215,7 TFLOPS
NVLink 2300 ГБ/с
TDP300 Вт
Подходит дляinference до 7B, обучение, R&D
Самый бюджетный вход в data-center сегмент NVIDIA
Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Сравнение поколений

Tesla V100 vs A100 vs H100

Volta, Ampere, Hopper — три поколения NVIDIA, разделённые 5 годами и кратной разницей в производительности

Volta · 2017 ★

Tesla V100

Память16 / 32 ГБ HBM2
Пропускная сп.900 ГБ/с
FP16 Tensor125 TFLOPS
TF32 / FP8— / — (нет)
NVLink 2300 ГБ/с
Год2017
Ценапо запросу

Бюджетный legacy. Inference моделей до 7B, обучение средних задач, R&D, MLOps-курсы. Дешевле A100 в 3-5 раз.

Ampere · 2020

NVIDIA A100

Память40 / 80 ГБ HBM2e
Пропускная сп.2,04 ТБ/с
FP16 Tensor312 TFLOPS
TF32156 TFLOPS
NVLink 3600 ГБ/с
Год2020
Ценапо запросу

Зрелый рабочий конь ML 2020-2023. Inference до 30B, обучение моделей до 35B в FP16. MIG. В 2,5 раза быстрее V100.

Hopper · 2022

NVIDIA H100

Память80 ГБ HBM3
Пропускная сп.3,35 ТБ/с
FP16 Tensor1979 TFLOPS
FP8 (TE)3958 TFLOPS
NVLink 4900 ГБ/с
Год2022
Ценапо запросу

Hopper с Transformer Engine. В 15 раз быстрее V100 на FP16, в 30+ раз на LLM с FP8. Production-training моделей 70B+.

Подробно про A100 · H100 80 ГБ HBM3 · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про Tesla V100

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

Tesla V100 — Volta 2017 года, первое поколение Tensor Cores. FP16 125 TFLOPS, до 32 ГБ HBM2, NVLink 2 (300 ГБ/с). A100 (Ampere, 2020) — FP16 312 TFLOPS, до 80 ГБ HBM2e, NVLink 3 (600 ГБ/с), плюс TF32 и MIG. H100 (Hopper, 2022) — FP16 1979 TFLOPS, 80 ГБ HBM3, NVLink 4 (900 ГБ/с), FP8 и Transformer Engine. По соотношению цена/производительность V100 в 2026 году актуален только для R&D, лекций, маленьких inference-моделей. Для production-LLM 30B+ — A100 или H100.
В FP16 inference: Llama 2 7B без квантизации, Llama 3 8B, Mistral 7B, Qwen 7B. С квантизацией INT8: Llama 13B-30B. Llama 70B — не помещается даже с агрессивной квантизацией. На V100 нет BF16 в массовой поддержке, нет FP8 и TF32. Обучение small/medium моделей до 7B — реально, но медленнее A100 в 2,5 раза, чем H100 — в 8-10 раз. Для inference маленьких моделей в R&D-окружении и обучающих курсах подходит.
SXM2 — серверный форм-фактор для платформ DGX-1 V100 и HGX V100. TDP 300 Вт, NVLink 2 300 ГБ/с между GPU. Применяется в кластерах из 4-8 карт. PCIe — обычная 2-слот видеокарта, TDP 250 Вт. NVLink доступен только через bridge между двумя картами. SXM2 быстрее под длительной нагрузкой за счёт TDP-headroom и NVLink-фабрики, но требует совместимой платформы. PCIe ставится в любой совместимый сервер.
Для inference моделей до 7-13B — да, если объём запросов невысокий. Для тренировки LLM 30B+ — нет, экономика не сходится: один H100 SXM5 заменяет 8-10 V100 SXM2 по сырому FP16 и стоит существенно дешевле в эксплуатации (электричество + место). Окупаемость V100 в production-сценарии — только если карта уже куплена и работает. Для свежих установок 2026 года V100 выбирают под R&D, обучение, MLOps-курсы, тестовые стенды.
V100 снят с производства в 2022, рынок только вторичка. PCIe 16/32 ГБ у нас обычно есть в Москве, отгрузка за 3-7 рабочих дней по 1-4 картам. SXM2 16 ГБ — через decom-каналы облачных провайдеров и OEM-разборку HGX V100 / DGX-1, 1-3 недели. SXM2 32 ГБ — редкая позиция, ищем по запросу, иногда до 3-5 недель. Партии 8+ карт собираем под конкретный PO, по V100 это часто означает приёмку из разных лотов.
V100 проводится как объект ОС б/у, ОКОФ 320.26.20.13, амортизация обычно 2-3 года остаточная. Договор поставки с ООО «Легион», цена в ₽, отгрузка с НДС, ЭДО Диадок или СБИС. Бухгалтерская обвязка: договор + спецификация по серийникам + акт б/у с часами наработки и результатами стресс-теста + УПД + ТН + копия ДТ + нотификация ФСБ. Платёж в ₽ на счёт в РФ.
NVIDIA-гарантия на V100 истекла (карта снята с производства в 2022). Мы даём свою гарантию 3-6 месяцев на исправность после стресс-теста 48 часов у партнёра в ОАЭ: gpu-burn, memtest, термоциклирование, контроль ECC-ошибок. Замена при дефекте — из собственного фонда б/у-карт в Москве, 5-10 дней. Для production-инсталляций рекомендуем закладывать N+1 резерв в шасси, восстановление NVIDIA RMA по V100 уже невозможно.
Типичные сценарии

Под что берут Tesla V100

Учебные стенды

ВУЗы и MLOps-курсы

125 TFLOPS FP16 хватает на лекции, лабораторные с PyTorch, обучение моделей до 1-7B. Карты идут на учебные кластеры технических ВУЗов за недорого.

Inference 7B

Маленький LLM-сервис

V100 32 ГБ держит Llama 3 8B или Mistral 7B без квантизации в FP16. Под внутренний чат-бот с десятками RPS — рабочий и дешёвый вариант.

CV-инференс

Видеоаналитика и детекция

YOLO, ResNet, EfficientNet — модели CV-стека отлично работают на Volta. Берут под конвейеры видеоаналитики (распознавание автомобилей, людей, дефектов).