Менеджер свяжется в течение часа, согласует конфигурацию и вышлет коммерческое предложение в PDF.
DGX Spark — компактный настольный AI-компьютер NVIDIA 2025 года. Один чип GB10 (Grace ARM CPU + Blackwell GPU интегрированы), 128 ГБ unified memory, питание около 1 кВт. Подходит для локальной разработки и inference LLM до 70B без стойки и кондиционера.
Llama 3 70B FP16 умещается на 1 Spark. Конфиденциальные данные не уходят в облако.
Нативный CUDA + FP4 в железе. Совместимость с PyTorch, JAX, TensorRT, Triton, NeMo.
256 ГБ unified — Llama 405B FP8 локально. Уровень одного DGX H100 по памяти.
Мы не ищем деньги под вашу сделку, не собираем цепочку посредников и не возим оборудование «серым» каналом. Под одной крышей — оборотный капитал группы, прямые квоты и своя логистика.
Финансируем сделку из собственных оборотных средств. Решение по сделке — за 1–3 рабочих дня, без банка и без залога.
Закупаем у партнёров Tier 1 в ОАЭ и Гонконге. Цена и срок поставки лучше рынка за счёт минимума посредников.
Договор поставки в РФ с НДС, ЭДО, нотификация ФСБ. Полный пакет: счёт, счёт-фактура, УПД, ТТН, документы происхождения.
Собственные юрлица в ОАЭ и Гонконге с валютными счетами. Платёж и поставка проходят через нашу группу, без сторонних подрядчиков.
Оплачиваем поставщика из своих средств — берём предоплату на себя. Вы платите после прихода товара в РФ.
КП за 1 рабочий день. Ответ менеджера — в течение часа. Платёж поставщику — в день обращения, при готовом контракте.
Что выбрать для локальной AI-разработки и где Spark действительно выигрывает
Нативный CUDA с FP4, NVIDIA AI Enterprise. Локальный inference и R&D на NVIDIA-стеке.
Больше памяти, но не CUDA. Многие AI-фреймворки требуют CUDA — Mac работает через эмуляцию или ограничения.
Для training foundation models, корпоративные R&D. Совсем другой уровень нагрузки.
LEGION GPU — направление группы компаний с консолидированной выручкой 23 млрд ₽ за 2024 год и собственными юрлицами в ОАЭ и Гонконге. Группа закрывает полный цикл международной торговли: от поиска поставщика и валютного платежа до таможенного оформления в России.
GPU-направление ведёт отдельная команда инженеров и закупщиков. Поставляем оборудование под крупные AI-проекты, дата-центры, биржи, исследовательские лаборатории и промышленные кластеры. Работаем только с юридическими лицами, по договору с НДС, с полным пакетом закрывающих документов.
Поставляем не отдельные комплектующие, а готовый узел AI-инфраструктуры — согласованную конфигурацию, документы и доставку, одной сделкой и одним договором.
Подход команды LEGION GPUВся сделка идёт через одного менеджера. Один договор. Один пакет документов в конце.
Узнаём задачу, объём, желаемые сроки. Подбираем конфигурацию, если ещё не собрана.
~ 30 минутСогласуем спецификацию, проверим квоты у партнёров, зафиксируем цену в ₽ с НДС.
1 раб. деньЗаключаем договор в РФ. Параллельно одна из иностранных компаний оплачивает инвойс.
1–3 раб. дняИз наличия — 3 дня из Гонконга. Под заказ — 3–8 недель, сопровождаем груз на каждом плече: ОАЭ / Гонконг → склад в РФ.
3 дня / 3–8 недельОтдаём оборудование и полный пакет документов. По запросу — монтаж в стойке.
1–2 раб. дняТипы заказов, с которыми к нам обращаются чаще всего. Названия компаний — под соглашением о конфиденциальности (NDA).
Поставка узла на NVIDIA H100 SXM для дообучения собственной языковой модели.
Платформа HGX H200 для расширения коммерческого облачного сервиса.
NVIDIA L40S для распределённого инференса задач компьютерного зрения на производстве.
NVIDIA A100 PCIe для исследовательских задач и пилотных AI-сервисов внутри компании.
RTX PRO 6000 Blackwell для проектной разработки и инференса локальных моделей.
Кластер на NVIDIA H100 PCIe для расчёта моделей кредитного риска и скоринга в банке.
Несколько RTX PRO 6000 Blackwell для рендера и AI-видеогенерации в продакшене.
Партия NVIDIA B200 в составе HGX-платформы для расширения публичного GPU-облака.
Оставьте контакты — инженер LEGION GPU свяжется в течение часа. Если задача срочная — напишите в Telegram, ответим в первую очередь.
Менеджер свяжется в течение часа в рабочее время.
Если вашего вопроса нет в списке — просто оставьте заявку, ответим лично.
128 ГБ unified держит Llama 3 70B в FP16 или FP4. Под разработчика, который не хочет гонять данные в облако — весь стек локально, питание 1 кВт от розетки.
Компактный форм-фактор, везёшь под мышкой. Под демо корпоративным клиентам, PoC на площадке заказчика без интернета — LLM работает локально, данные не уходят наружу.
Учебные ВУЗы, MLOps-курсы, R&D-команды. Полный NVIDIA-стек (CUDA, TensorRT, Triton, NeMo) на столе — проверять архитектуры моделей и FP4-инференс без аренды H100.