Compact AI workstation · GB10 · 128 ГБ unified · 2025

Купить NVIDIA DGX Spark 128 ГБ unified memory
— compact AI workstation для локальной разработки

GB10 chip = Grace ARM + Blackwell GPU в одном корпусе. 128 ГБ unified memory — Llama 3 70B FP16 умещается локально. FP4 1 PFLOPS.
Desktop форм-фактор, ~1 кВт — питание от обычной розетки, не нужна стойка и кондиционер. Альтернатива Mac Studio для CUDA-разработки.
2× Spark в связку — получается 256 ГБ unified, уровень одного DGX H100 по памяти. Llama 405B FP8 локально.

128 ГБunified memory

1 PFLOPSFP4 peak

~1 кВтdesktop, от розетки

2025новинка NVIDIA

Спецификации и сроки

Договор с НДС · 1 рабочий день на КП · Постоплата

Получите КП
с ценой и сроком

Ответ за 1 час

Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.

Имя Телефон E-mail компании Что вас интересует

Нажимая кнопку, вы соглашаетесь с политикой обработки персональных данных.

Спасибо. Заявка принята. Менеджер свяжется с вами в течение часа в рабочее время. Если задача срочная — продублируйте в Telegram.

Договор с НДС Документы для ФНС Прямая поставка

Технические характеристики

NVIDIA DGX Spark · compact AI workstation

DGX Spark — компактный настольный AI-компьютер NVIDIA 2025 года. Один чип GB10 (Grace ARM CPU + Blackwell GPU интегрированы), 128 ГБ unified memory, питание около 1 кВт. Подходит для локальной разработки и inference LLM до 70B без стойки и кондиционера.

desktop · 128 ГБ unified · ~1 кВт

GB10 · 2025

NVIDIA DGX Spark 128 ГБ unified memory

ЧипGB10 (Grace ARM + Blackwell GPU)

Память128 ГБ unified LPDDR5X

FP4 Peak1 PFLOPS (1000 TFLOPS)

Форм-факторdesktop, compact

Питание~1 кВт от обычной розетки

Связка2× DGX Spark = 256 ГБ unified

ОСDGX OS (Linux на ARM)

NVIDIA AI Enterpriseвключено

Гарантия3 года NVIDIA

Срок поставки4-8 недель

Новинка 2025 · квоты ограничены, партии. КП и точный срок индивидуально.

Локальный inference 70B

Llama 3 70B FP16 умещается на 1 Spark. Конфиденциальные данные не уходят в облако.

Альтернатива Mac Studio

Нативный CUDA + FP4 в железе. Совместимость с PyTorch, JAX, TensorRT, Triton, NeMo.

Связка 2× Spark

256 ГБ unified — Llama 405B FP8 локально. Уровень одного DGX H100 по памяти.

Почему мы

6 причин выбрать LEGION GPU

Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.

Свой капитал группы

Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.

Прямые квоты у дистрибьюторов

Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.

Белый ввоз. Документы для ФНС

Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.

Своя международная инфраструктура

Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.

Оплата по факту

Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.

Скорость обработки

КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.

Compact AI workstation

DGX Spark vs Mac Studio vs DGX

Что выбрать для локальной AI-разработки и где Spark действительно выигрывает

CUDA-native ★

NVIDIA DGX Spark

ЧипGB10 Grace + Blackwell

Память128 ГБ unified

FP4 Peak1 PFLOPS

ЭкосистемаCUDA, TensorRT, PyTorch

Форм-факторdesktop, ~1 кВт

Связка2 системы = 256 ГБ

Цена$3-5k (по запросу)

Нативный CUDA с FP4, NVIDIA AI Enterprise. Локальный inference и R&D на NVIDIA-стеке.

Apple Silicon

Apple Mac Studio M3 Ultra

ЧипM3 Ultra

Памятьдо 192 ГБ unified

ЭкосистемаMetal, MLX, ANE

CUDA— (нет)

Форм-факторdesktop, ~370 Вт

PyTorchчерез MPS backend

Ценаот 720k₽

Больше памяти, но не CUDA. Многие AI-фреймворки требуют CUDA — Mac работает через эмуляцию или ограничения.

Enterprise · 4U стойка

NVIDIA DGX H200

Чип8× H200 SXM5

Память1128 ГБ HBM3e

FP8 Tensor (сумм.)32 PFLOPS

Форм-фактор4U rack, 10,2 кВт

ТребованияЦОД, охлаждение, питание

Ценапо запросу (enterprise)

Для training foundation models, корпоративные R&D. Совсем другой уровень нагрузки.

Подробно про DGX (enterprise) · HGX (OEM) · все модели

О группе

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.

GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.

+7 (965) 310-00-00

Выручка группы за 2024 год

23 млрд ₽

консолидированно по группе

7+Стран присутствия

100%«Белый» ввоз для ФНС

1 раб. деньНа подготовку КП

“

Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.

Подход команды LEGION GPU

Юр. лицоООО «Легион»

ИНН6670510713

КПП770401001

ОГРН1226600052733

Адрес119034, Москва, 2-й Обыденский пер., 1А, пом. 3/1

Процесс

5 шагов от заявки до запуска

Вся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.

Брифинг

Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.

~ 30 минут

КП

Согласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.

1 раб. день

Договор и оплата

Заключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.

1–3 раб. дня

Логистика и таможня

Из наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.

3 дня / 3–8 недель

Передача

Отдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.

1–2 раб. дня

Типовые сделки

Сценарии поставок, с которыми работаем

Типы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).

AI-стартап · обучение модели

Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.

Срок поставки

5 недель

Дата-центр · GPU-сервис

Платформа HGX H200 для расширения коммерческого облачного сервиса.

Срок поставки

6 недель

Промышленность · компьютерное зрение

NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.

Срок поставки

3 недели

R&D-команда · прототипирование

NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.

Срок поставки

из наличия

Интегратор · рабочая станция

RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.

Срок поставки

2 недели

Финтех · risk modeling

Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.

Срок поставки

4 недели

Видеостудия · генерация контента

Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.

Срок поставки

2 недели

Облачный провайдер · масштабирование

Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.

Срок поставки

8 недель

FAQ

Частые вопросы про DGX Spark

Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.

DGX Spark — это compact AI workstation с настольным форм-фактором. Внутри один чип GB10 (Grace ARM CPU + Blackwell GPU интегрированы), 128 ГБ unified memory. Питание около 1 кВт от обычной розетки, не нужна стойка и кондиционер. Цена $3-5k. Назначение — локальная разработка, R&D, малые AI-проекты, обучение. DGX (без Spark) — это enterprise-сервер 4U в стойке с 8 SXM GPU, цена $300-600k, для тренировки foundation models. Совершенно разные классы, объединены только брендом DGX.

В FP16 inference: Llama 3 70B без квантизации, Qwen 72B, Mixtral 8×22B. С INT8: Llama 3 70B с большим контекстом 128k+. С FP4 (родной для Blackwell): Llama 3 70B плюс другие модели одновременно, либо Llama 405B FP4 (на грани). С двумя соединёнными Spark (256 ГБ unified) — Llama 405B FP8. Это уровень, ранее доступный только на A100 SXM4 80GB или H100. Главный плюс — unified memory не разделяется между CPU и GPU, нет копирования между регионами.

Mac Studio M3 Ultra 192 ГБ unified memory — больше памяти, чем у DGX Spark. Но Mac работает на ANE/Metal — не CUDA, не родной экосистемой PyTorch/JAX. Многие LLM-фреймворки требуют CUDA-стек, который есть только у NVIDIA. DGX Spark даёт меньше памяти (128 vs 192 ГБ), но это нативный CUDA с FP4 в железе и весь NVIDIA-stack (TensorRT, Triton, NeMo, NIM, Base Command). Для AI-разработки на CUDA-фреймворках Spark выигрывает. Для смешанной работы (видеомонтаж + AI на ANE) Mac остаётся выбором.

Локальный inference LLM до 70B без подключения к облаку (конфиденциальность данных, low latency). R&D и эксперименты с моделями: дообучение, prompt engineering, тестирование архитектур. Локальный продакшен для small teams и одиночных разработчиков. Демо-стенды у клиентов. Обучение и MLOps-курсы в университетах. Embedded AI-стенды в офисах и студиях. Не подходит: тренировка с нуля моделей 30B+ (нужен HGX/DGX), массовый inference с высоким QPS.

Да, NVIDIA поддерживает связку 2× DGX Spark через высокоскоростную сеть. В результате получается 256 ГБ unified memory и 2 PFLOPS FP4 — это уже уровень одного DGX H100 по памяти и FP4. Подходит для inference Llama 405B FP8 или нескольких 70B моделей одновременно. Для большего масштабирования — нужны HGX/DGX-кластеры через InfiniBand.

DGX Spark — новый продукт NVIDIA 2025, квоты ограничены, основной канал — дистрибьюторы NVIDIA в США, Европе, Японии. К нам приходит через хаб в ОАЭ, поштучно цикл 4-8 недель с момента PO. Партии 4-8 устройств для корпоративной AI-лаборатории — 5-10 недель в зависимости от квоты. По 1 устройству везём, минимального заказа нет, потому что это compact workstation — везти проще, чем стойку DGX. По нынешним заказам приоритет тем, кто берёт сразу 2 устройства в связке (256 ГБ unified) под конкретный проект.

DGX Spark проводится как объект ОС, ОКОФ 320.26.20.13, амортизация 3-5 лет (compact workstation, не серверная стойка). Договор поставки с ООО «Легион», цена в ₽, отгрузка с НДС, ЭДО Диадок или СБИС. Бухгалтерская обвязка: договор, спецификация по серийнику устройства, УПД, ТН, копия ДТ с отметкой выпуска, нотификация ФСБ (Spark идёт с криптомодулем), паспорт устройства. Оплата в ₽ на счёт в РФ — один счёт под каждое устройство или партию.

NVIDIA даёт стандартную 3-летнюю гарантию на всё устройство — это покрывает чип GB10 (Grace + Blackwell в одном кристалле), 128 ГБ unified memory, NVMe, корпус, БП. Поскольку GB10 — цельный SoC, замена идёт целиком устройством по RMA, ремонт на месте не предусмотрен. Подменный фонд по Spark в Москве пока не держим (продукт новый, дефицит) — замена через NVIDIA RMA, 21-30 дней. Под корпоративного заказчика можем согласовать buffer-unit в договоре, чтобы простой не останавливал работу.

Типичные сценарии

Под что берут NVIDIA DGX Spark

Локальный inference

LLM на столе без облака

128 ГБ unified держит Llama 3 70B в FP16 или FP4. Под разработчика, который не хочет гонять данные в облако — весь стек локально, питание 1 кВт от розетки.

Демо-стенд

AI-демо у заказчика

Компактный форм-фактор, везёшь под мышкой. Под демо корпоративным клиентам, PoC на площадке заказчика без интернета — LLM работает локально, данные не уходят наружу.

R&D и обучение

Прототип в лаборатории

Учебные ВУЗы, MLOps-курсы, R&D-команды. Полный NVIDIA-стек (CUDA, TensorRT, Triton, NeMo) на столе — проверять архитектуры моделей и FP4-инференс без аренды H100.

Купить NVIDIA DGX Spark 128 ГБ unified memory
— compact AI workstation для локальной разработки

Получите КП
с ценой и сроком

NVIDIA DGX Spark · compact AI workstation

NVIDIA DGX Spark 128 ГБ unified memory

Локальный inference 70B

Альтернатива Mac Studio

Связка 2× Spark

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

DGX Spark vs Mac Studio vs DGX

NVIDIA DGX Spark

Apple Mac Studio M3 Ultra

NVIDIA DGX H200

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурацию
и вышлем КП
за 1 рабочий день

Получить КП

Частые вопросы про DGX Spark

Под что берут NVIDIA DGX Spark

LLM на столе без облака

AI-демо у заказчика

Прототип в лаборатории

Не нашли подходящую модель в каталоге?

Получить КП с ценой и сроком

Пришлём PDF-прайс с конфигурациями GPU-серверов

Купить NVIDIA DGX Spark 128 ГБ unified memory— compact AI workstation для локальной разработки

Получите КПс ценой и сроком

NVIDIA DGX Spark · compact AI workstation

NVIDIA DGX Spark 128 ГБ unified memory

Локальный inference 70B

Альтернатива Mac Studio

Связка 2× Spark

6 причин выбрать LEGION GPU

Свой капитал группы

Прямые квоты у дистрибьюторов

Белый ввоз. Документы для ФНС

Своя международная инфраструктура

Оплата по факту

Скорость обработки

DGX Spark vs Mac Studio vs DGX

NVIDIA DGX Spark

Apple Mac Studio M3 Ultra

NVIDIA DGX H200

Торгово-финансовая группа с собственным капиталом и инфраструктурой импорта

5 шагов от заявки до запуска

Брифинг

КП

Договор и оплата

Логистика и таможня

Передача

Сценарии поставок, с которыми работаем

Соберём конфигурациюи вышлем КПза 1 рабочий день

Получить КП

Частые вопросы про DGX Spark

Под что берут NVIDIA DGX Spark

LLM на столе без облака

AI-демо у заказчика

Прототип в лаборатории

Не нашли подходящую модель в каталоге?

Купить NVIDIA DGX Spark 128 ГБ unified memory
— compact AI workstation для локальной разработки

Получите КП
с ценой и сроком

Соберём конфигурацию
и вышлем КП
за 1 рабочий день