Compact AI workstation · GB10 · 128 ГБ unified · 2025

Купить NVIDIA DGX Spark 128 ГБ unified memory
— compact AI workstation для локальной разработки

  • GB10 chip = Grace ARM + Blackwell GPU в одном корпусе. 128 ГБ unified memory — Llama 3 70B FP16 умещается локально. FP4 1 PFLOPS.
  • Desktop форм-фактор, ~1 кВт — питание от обычной розетки, не нужна стойка и кондиционер. Альтернатива Mac Studio для CUDA-разработки.
  • 2× Spark в связку — получается 256 ГБ unified, уровень одного DGX H100 по памяти. Llama 405B FP8 локально.
128 ГБunified memory
1 PFLOPSFP4 peak
~1 кВтdesktop, от розетки
2025новинка NVIDIA
Спецификации и сроки
Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.
Договор с НДС Документы для ФНС Прямая поставка
Поставляем оборудование вендоров
NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX NVIDIA SUPERMICRO DELL HPE GIGABYTE ASUS LENOVO INTEL AMD MELLANOX
Технические характеристики

NVIDIA DGX Spark · compact AI workstation

DGX Spark — компактный настольный AI-компьютер NVIDIA 2025 года. Один чип GB10 (Grace ARM CPU + Blackwell GPU интегрированы), 128 ГБ unified memory, питание около 1 кВт. Подходит для локальной разработки и inference LLM до 70B без стойки и кондиционера.

desktop · 128 ГБ unified · ~1 кВт
NVIDIA DGX Spark
GB10 · 2025

NVIDIA DGX Spark 128 ГБ unified memory

ЧипGB10 (Grace ARM + Blackwell GPU)
Память128 ГБ unified LPDDR5X
FP4 Peak1 PFLOPS (1000 TFLOPS)
Форм-факторdesktop, compact
Питание~1 кВт от обычной розетки
Связка2× DGX Spark = 256 ГБ unified
ОСDGX OS (Linux на ARM)
NVIDIA AI Enterpriseвключено
Гарантия3 года NVIDIA
Срок поставки4-8 недель
Новинка 2025 · квоты ограничены, партии. КП и точный срок индивидуально.

Локальный inference 70B

Llama 3 70B FP16 умещается на 1 Spark. Конфиденциальные данные не уходят в облако.

Альтернатива Mac Studio

Нативный CUDA + FP4 в железе. Совместимость с PyTorch, JAX, TensorRT, Triton, NeMo.

Связка 2× Spark

256 ГБ unified — Llama 405B FP8 локально. Уровень одного DGX H100 по памяти.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Compact AI workstation

DGX Spark vs Mac Studio vs DGX

Что выбрать для локальной AI-разработки и где Spark действительно выигрывает

CUDA-native ★

NVIDIA DGX Spark

ЧипGB10 Grace + Blackwell
Память128 ГБ unified
FP4 Peak1 PFLOPS
ЭкосистемаCUDA, TensorRT, PyTorch
Форм-факторdesktop, ~1 кВт
Связка2 системы = 256 ГБ
Цена$3-5k (по запросу)

Нативный CUDA с FP4, NVIDIA AI Enterprise. Локальный inference и R&D на NVIDIA-стеке.

Apple Silicon

Apple Mac Studio M3 Ultra

ЧипM3 Ultra
Памятьдо 192 ГБ unified
ЭкосистемаMetal, MLX, ANE
CUDA— (нет)
Форм-факторdesktop, ~370 Вт
PyTorchчерез MPS backend
Ценаот 720k₽

Больше памяти, но не CUDA. Многие AI-фреймворки требуют CUDA — Mac работает через эмуляцию или ограничения.

Enterprise · 4U стойка

NVIDIA DGX H200

Чип8× H200 SXM5
Память1128 ГБ HBM3e
FP8 Tensor (сумм.)32 PFLOPS
Форм-фактор4U rack, 10,2 кВт
ТребованияЦОД, охлаждение, питание
Ценапо запросу (enterprise)

Для training foundation models, корпоративные R&D. Совсем другой уровень нагрузки.

Подробно про DGX (enterprise) · HGX (OEM) · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00
Выручка группы за 2024 год
23 млрд ₽
консолидированно по группе
7+Стран присутствия
100%«Белый» ввоз для ФНС
1 раб. деньНа подготовку КП

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU
Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

01

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут
02

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день
03

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня
04

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель
05

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня
Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки
5 недель
Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки
6 недель
Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки
3 недели
R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки
из наличия
Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки
2 недели
Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки
4 недели
Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки
2 недели
Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки
8 недель
Заявка

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.

Получить КП

Менеджер свяжется в течение часа в рабочее время.

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

FAQ

Частые вопросы про DGX Spark

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

DGX Spark — это compact AI workstation с настольным форм-фактором. Внутри один чип GB10 (Grace ARM CPU + Blackwell GPU интегрированы), 128 ГБ unified memory. Питание около 1 кВт от обычной розетки, не нужна стойка и кондиционер. Цена $3-5k. Назначение — локальная разработка, R&D, малые AI-проекты, обучение. DGX (без Spark) — это enterprise-сервер 4U в стойке с 8 SXM GPU, цена $300-600k, для тренировки foundation models. Совершенно разные классы, объединены только брендом DGX.
В FP16 inference: Llama 3 70B без квантизации, Qwen 72B, Mixtral 8×22B. С INT8: Llama 3 70B с большим контекстом 128k+. С FP4 (родной для Blackwell): Llama 3 70B плюс другие модели одновременно, либо Llama 405B FP4 (на грани). С двумя соединёнными Spark (256 ГБ unified) — Llama 405B FP8. Это уровень, ранее доступный только на A100 SXM4 80GB или H100. Главный плюс — unified memory не разделяется между CPU и GPU, нет копирования между регионами.
Mac Studio M3 Ultra 192 ГБ unified memory — больше памяти, чем у DGX Spark. Но Mac работает на ANE/Metal — не CUDA, не родной экосистемой PyTorch/JAX. Многие LLM-фреймворки требуют CUDA-стек, который есть только у NVIDIA. DGX Spark даёт меньше памяти (128 vs 192 ГБ), но это нативный CUDA с FP4 в железе и весь NVIDIA-stack (TensorRT, Triton, NeMo, NIM, Base Command). Для AI-разработки на CUDA-фреймворках Spark выигрывает. Для смешанной работы (видеомонтаж + AI на ANE) Mac остаётся выбором.
Локальный inference LLM до 70B без подключения к облаку (конфиденциальность данных, low latency). R&D и эксперименты с моделями: дообучение, prompt engineering, тестирование архитектур. Локальный продакшен для small teams и одиночных разработчиков. Демо-стенды у клиентов. Обучение и MLOps-курсы в университетах. Embedded AI-стенды в офисах и студиях. Не подходит: тренировка с нуля моделей 30B+ (нужен HGX/DGX), массовый inference с высоким QPS.
Да, NVIDIA поддерживает связку 2× DGX Spark через высокоскоростную сеть. В результате получается 256 ГБ unified memory и 2 PFLOPS FP4 — это уже уровень одного DGX H100 по памяти и FP4. Подходит для inference Llama 405B FP8 или нескольких 70B моделей одновременно. Для большего масштабирования — нужны HGX/DGX-кластеры через InfiniBand.
DGX Spark — новый продукт NVIDIA 2025, квоты ограничены, основной канал — дистрибьюторы NVIDIA в США, Европе, Японии. К нам приходит через хаб в ОАЭ, поштучно цикл 4-8 недель с момента PO. Партии 4-8 устройств для корпоративной AI-лаборатории — 5-10 недель в зависимости от квоты. По 1 устройству везём, минимального заказа нет, потому что это compact workstation — везти проще, чем стойку DGX. По нынешним заказам приоритет тем, кто берёт сразу 2 устройства в связке (256 ГБ unified) под конкретный проект.
DGX Spark проводится как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет (compact workstation, не серверная стойка). Договор поставки с ООО «Легион», цена в ₽, отгрузка с НДС, ЭДО Диадок или СБИС. Бухгалтерская обвязка: договор, спецификация по серийнику устройства, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ (Spark идёт с криптомодулем), паспорт устройства. Оплата в ₽ на счёт в РФ — один счёт под каждое устройство или партию.
NVIDIA даёт стандартную 3-летнюю гарантию на всё устройство — это покрывает чип GB10 (Grace + Blackwell в одном кристалле), 128 ГБ unified memory, NVMe, корпус, БП. Поскольку GB10 — цельный SoC, замена идёт целиком устройством по RMA, ремонт на месте не предусмотрен. Подменный фонд по Spark в Москве пока не держим (продукт новый, дефицит) — замена через NVIDIA RMA, 21-30 дней. Под корпоративного заказчика можем согласовать buffer-unit в договоре, чтобы простой не останавливал работу.
Типичные сценарии

Под что берут NVIDIA DGX Spark

Локальный inference

LLM на столе без облака

128 ГБ unified держит Llama 3 70B в FP16 или FP4. Под разработчика, который не хочет гонять данные в облако — весь стек локально, питание 1 кВт от розетки.

Демо-стенд

AI-демо у заказчика

Компактный форм-фактор, везёшь под мышкой. Под демо корпоративным клиентам, PoC на площадке заказчика без интернета — LLM работает локально, данные не уходят наружу.

R&D и обучение

Прототип в лаборатории

Учебные ВУЗы, MLOps-курсы, R&D-команды. Полный NVIDIA-стек (CUDA, TensorRT, Triton, NeMo) на столе — проверять архитектуры моделей и FP4-инференс без аренды H100.