NVIDIA DGX Spark Yapay Zeka Süper Bilgisayarını Tanıyalım..
Yapay zekanın hızlı gelişimiyle birlikte, güçlü işlem gücü, yapay zeka araştırmalarını ve uygulamalarını yönlendiren temel unsur haline gelmiştir. Büyük dil modellerini eğitmek, bilimsel simülasyonlar yürütmek veya endüstriyel yapay zeka çözümleri geliştirmek olsun, araştırmacılar ve geliştiriciler acilen verimli, esnek ve kolay erişilebilir işlem kaynaklarına ihtiyaç duymaktadır. “Dünyanın en küçük yapay zeka süper bilgisayarı” olan NVIDIA DGX Spark, kompakt bir form faktöründe şaşırtıcı bir performans sunarak yapay zeka araştırma ve geliştirme ile uygulamalarının temel itici gücü haline geliyor. Bu makale, DGX Spark’ın temel özelliklerini kapsamlı bir şekilde inceleyecek ve NVIDIA DGX Spark’ın değerini ve önemini derinlemesine değerlendirecektir.
NVIDIA DGX Spark Nedir?
NVIDIA DGX Spark, NVIDIA’nın en yeni masaüstü yapay zeka süper bilgisayarı olup, özellikle yapay zeka iş yüklerini oluşturmak ve çalıştırmak için tasarlanmış yeni bir bilgisayar sınıfının parçasıdır.
NVIDIA DGX Spark, yapay zekâ oluşturmak ve çalıştırmak için özel olarak tasarlanmış yeni nesil bir bilgi işlem platformudur. Yapay zekâ iş yüklerinin ihtiyaçlarını karşılamak için 1 PetaFLOP’a kadar performans sağlayabilen NVIDIA GB10 Grace Blackwell Süperçipini kullanır. 128 GB’lık tutarlı, birleşik sistem belleği ile geliştiriciler, büyük modeller üzerinde yerel olarak deneyler yapabilir, ince ayarlar gerçekleştirebilir ve çıkarımlar yapabilirler. DeepSeek, Meta ve Google gibi ekiplerin en yeni yapay zeka modellerini, 200 milyar parametreye kadar olan boyutlarda destekler. Ayrıca, NVIDIA ConnectX ağ bağlantısı, iki DGX Spark sunucusu arasında doğrudan bağlantı sağlayarak 405 milyar parametreli modelin verimli bir şekilde çıkarımını mümkün kılar. Başka bir deyişle, DGX Spark basit bir “üst düzey grafik kartlı bilgisayar” değil, yapay zeka eğitimi, çıkarımı ve prototiplemesi için özel olarak tasarlanmış bir süper bilgisayardır.
NVIDIA DGX Spark Teknik Özelliklerinin Değerlendirilmesi
Dışarıdan bakıldığında, DGX Spark’ın kompakt tasarımı, onun bir süper bilgisayar olduğunu neredeyse unutturuyor. Ancak, bu kadar kompakt bir pakette şaşırtıcı bir işlem gücü açığa çıkarmasını sağlayan şey, gelişmiş iç donanımıdır. Aşağıda, bu devrim niteliğindeki ürünün teknik detaylarını tam olarak analiz edeceğiz.
Üstün Yapay Zeka Hesaplama Performansı
DGX Spark, NVIDIA’nın en yeni nesil GB10 Grace Blackwell süper çipiyle çalışmaktadır.
İşlemci: 10 adet yüksek performanslı Cortex-X925 çekirdeği ve 10 adet enerji tasarruflu Cortex-A725 çekirdeği de dahil olmak üzere 20 ARM çekirdekli mimariye sahip bir işlemci kullanır.
GPU: NVIDIA Blackwell mimarisine dayanan bu işlemci, beşinci nesil Tensor Çekirdekleri ve dördüncü nesil RT Çekirdekleri içerir, FP4 (4 bit kayan nokta) hassas hesaplamayı destekler ve saniyede 1.000 TOPS’a (tera işlem) kadar yapay zeka performansı sunar.
NVLink-C2C ara bağlantısı: CPU ve GPU arasında yüksek bant genişliğine ve düşük gecikme süresine sahip bir bellek tutarlılık modeli sağlar; bant genişliği PCIe Gen 5’in beş katıdır.
Fiziksel Tasarım ve Enerji Verimliliği
DGX Spark, olağanüstü fiziksel tasarım ve enerji verimliliği sergiliyor: Kompakt Tasarım: 150 mm × 150 mm × 50,5 mm ölçülerinde, yaklaşık 1,1 litre hacim kaplayan ve 1,2 kg ağırlığında olan bu cihaz, gerçek bir masaüstü sınıfı cihazdır. Enerji Verimliliği: Yalnızca 170W güç tüketir ve USB Type-C Güç Dağıtımını destekler. İşletim Sistemi: NVIDIA DGX OS’yi Ubuntu 22.04 tabanlı olarak çalıştırır ve TensorFlow, PyTorch ve JAX gibi optimize edilmiş çerçevelerin yanı sıra CUDA, cuDNN ve TensorRT gibi araçları da içeren NVIDIA yapay zeka yazılım yığınını entegre eder.
Sistem Belleği ve Depolama
Birleşik Sistem Belleği: 128 GB LPDDR5x bellek, 256 bit bellek veri yolu ve 273 GB/s bant genişliği. Bu birleşik bellek mimarisi, CPU ve GPU’nun ortak bir bellek havuzunu paylaşmasına olanak tanır. Bant genişliği, PCIe Gen 5’e göre yaklaşık 5 kat daha yüksektir; bu da 200 milyara kadar parametreye sahip yapay zeka modellerini (DeepSeek, Meta veya Google’ın çıkarım modelleri gibi) yüklemeyi ve çalıştırmayı kolaylaştırır ve FP4 niceleme formatında verimli çıkarım elde edilmesini sağlar.
Depolama: 1 veya 4 TB NVME.M2’yi kendi kendini şifreleme özelliğiyle destekleyerek yüksek hızlı veri erişimi sağlar.
Genişletilebilirlik: Çeşitli depolama ihtiyaçlarını karşılamak için M.2 yuvası aracılığıyla PCIe NVMe depolama genişletmesini destekler.
Ağ ve Bağlantı
Ağ Bağlantısı: İki DGX Spark, 200G QSFP56 DAC üzerinden bağlanarak 405 milyar parametreye kadar yapay zeka modeli eğitimi ve çıkarımını destekleyebilir ve dağıtılmış hesaplamanın uygulama senaryolarını daha da genişletebilir. NADDOD 200G QSFP56 DAC kablosu, NVIDIA DGX Spark (CX7 200G ile) üzerinde tamamen doğrulanmış olup, 15E-255 kadar düşük bir BER değeri elde ederek mükemmel sinyal bütünlüğü ve üstün ara bağlantı güvenilirliği göstermiştir.
Kablosuz Bağlantı: WiFi 7 ve Bluetooth 5.3’ü destekleyerek yüksek hızlı, istikrarlı ve esnek kablosuz bağlantı sağlar.
Bağlantı Noktaları: 4 adet USB Type-C ve 1 adet HDMI 2.1a video çıkış portu ile donatılmış olup, çeşitli çevre birimleri ve görüntüleme cihazlarının bağlanma ihtiyaçlarını kolayca karşılar.
NVIDIA DGX Spark’ın Performans Avantajları
NVIDIA DGX Spark’ın temel avantajlarından biri, yapay zeka geliştirme yaşam döngüsünün tamamını kapsaması ve model prototiplemesinden nihai dağıtıma kadar güçlü destek sağlayarak ekiplerin projelerini verimli bir şekilde ilerletmelerine yardımcı olmasıdır.
Prototipleme
DGX Spark ile makine öğrenimi mühendisleri, yeni modelleri veya uygulamaları yerel olarak hızlı bir şekilde oluşturabilir, test edebilir ve doğrulayabilirler. NVIDIA’nın özelleştirilmiş DGX işletim sistemini (Ubuntu Linux tabanlı) önceden yüklenmiş NVIDIA yapay zeka yazılım yığını (PyTorch, TensorFlow, vb.) ve NVIDIA yapay zeka modelleri, kütüphaneleri ve mikro hizmetleriyle çalıştıran kullanıcılar, ek ortam yapılandırmasına gerek kalmadan yapay zeka proje geliştirmeye başlayabilir.
Büyük Modellerin İnce Ayarı
DGX Spark, büyük önceden eğitilmiş modelleri belirli veri kümeleri için optimize eden ekipler için ideal bir ortam sağlar. 128 GB’lık birleşik belleği, 70 milyara kadar parametreye sahip modellerin ince ayarını destekleyebilir ve özellikle büyük açık kaynak modellerini (Meta, Google vb.) sektöre özgü senaryolara uyarlamak için uygundur.
Etkin Çıkarım ve Test Etme
Model eğitimi veya ince ayarından sonra, DGX Spark çıkarım sırasında performans testi için de kullanılabilir. 5. nesil Tensor Çekirdeklerinden ve yüksek bellek bant genişliğinden yararlanarak, 200 milyara kadar parametreye sahip modeller için düşük gecikmeli çıkarımı destekler.
Üretime Sorunsuz Ölçeklenebilirlik
DGX Spark üzerinde geliştirme ve doğrulama işlemlerinin ardından, daha büyük ölçekli eğitim ortamlarına veya üretim dağıtımına geçiş neredeyse sorunsuz gerçekleşir. Birleşik bir yazılım ortamı ve kapsayıcılaştırılmış iş akışına dayalı olarak, geliştirme sonuçları neredeyse hiç kod değişikliği yapılmadan doğrudan NVIDIA DGX Station, DGX SuperPOD veya DGX Cloud platformlarına dağıtılabilir
NVIDIA DGX Spark Test ve Doğrulama
LLM Çıkarım Performans Testi
Bu değerlendirme, büyük dil modellerinin (LLM’ler) ön doldurma ve kod çözme performansını test etmek için öncelikle Ollama ve SGLang motorlarını kullanmaktadır. Tüm testler varsayılan olarak 1’lik bir toplu işlem boyutuyla gerçekleştirilir.
Ollama motoru performans testi (parti boyutu 1):
| Model Adı | Model Boyutu | Nicelleştirme | Önceden doldurma (tps) | Çözme (tps) |
| gpt-oss | 20B | mxfp4 | 2.053,98 | 49.69 |
| gpt-oss | 120B | mxfp4 | 94.67 | 11.66 |
| lama-3.1 | 8B | q4_K_M | 23.169,59 | 36.38 |
| lama-3.1 | 8B | q8_0 | 19.826,27 | 25.05 |
| lama-3.1 | 70B | q4_K_M | 411.41 | 4.35 |
| gemma-3 | 12B | q4_K_M | 1.513,60 | 22.11 |
| gemma-3 | 27B | q4_K_M | 680.68 | 10.47 |
| deepseek-r1 | 14B | q4_K_M | 2.500,24 | 20.28 |
| Qwen-3 | 32B | q4_K_M | 100.42 | 6.23 |
SGLang Motoru Performans Testi (Toplu İşlem Boyutu 1, FP8 Nicelleştirme):
| Model Adı | Model Boyutu | Önceden doldurma (tps) | Çözme (tps) |
| lama-3.1 | 8B | 7.991,11 | 20.52 |
| lama-3.1 | 70B | 803.54 | 2.66 |
| gemma-3 | 12B | 1.295,83 | 6.84 |
| gemma-3 | 27B | 717.36 | 3.83 |
| deepseek-r1 | 14B | 2.177,04 | 12.02 |
| Qwen-3 | 32B | 1.145,66 | 06.08 |
Parti Büyüklüğü Ölçeklendirme Testi (SGLang, llama-3.1 8B Numune)
| Model Adı | Model Boyutu | Nicelleştirme | Parti Büyüklüğü | Önceden doldurma (tps) | Çözme (tps) |
| lama-3.1 | 8b | fp8 | 1 | 7.991,11 | 20.52 |
| lama-3.1 | 8b | fp8 | 2 | 7.377,34 | 42.30 |
| lama-3.1 | 8b | fp8 | 4 | 7.902,03 | 77.31 |
| lama-3.1 | 8b | fp8 | 8 | 7.744,30 | 143.92 |
| lama-3.1 | 8b | fp8 | 16 | 7.486,30 | 244.74 |
| lama-3.1 | 8b | fp8 | 32 | 7.949,83 | 368.09 |
Diğer Sistemlerle Karşılaştırma
- RTX Pro 6000 Blackwell Edition: Aynı parametrelere sahip modeller için (örneğin, Llama-3.1 8B Q4_K_M), önemli ölçüde daha iyi performans gösterir (Ön doldurma 38.863’e karşı 23.169; Kod çözme 201’e karşı 36), ancak daha büyüktür ve daha fazla güç tüketir.
- GeForce RTX 5090/5080: DGX Spark, büyük modellerde (örneğin, 70B) avantajlıdır. RTX 5090, kod çözmede 200 tps’ye kadar ulaşabilir; bu da DGX Spark’tan önemli ölçüde daha yüksektir. Bununla birlikte, daha küçük modellerde GeForce RTX 5090/5080’in hafif bir performans avantajı vardır (Prefill %20,30 daha yüksektir).
- Mac Studio M1 Max: DGX Spark ile karşılaştırıldığında, ön doldurma konusunda önemli ölçüde geride kalıyor (457’ye karşı 23.169), ancak bellek bant genişliğinde önemli bir avantaja sahip (819 GB/s’ye karşı 273 GB/s).
Üçüncü Taraf Testi
- Performans Öne Çıkanları: LMSYS Org’un değerlendirmesi, NVIDIA DGX Spark’ın uzun süreli, yüksek yük altındaki çıkarım görevlerinde termal kısıtlama olmadan ve düşük fan gürültüsüyle iyi performans gösterdiğini ve bu nedenle uzun süreli çıkarım görevleri için uygun olduğunu ortaya koymaktadır (örneğin, DeepSeek-R1 14B batch 8: 2.074 tps ön doldurma). Register ise difüzyon modelleri potansiyeline odaklanarak Flux.1 Dev görüntü oluşturma testini gerçekleştirdi (BF16 doğruluğu, 4 saatlik ince ayar).
- Yazılım ve Ölçeklenebilirlik: DGX Spark, DGX OS (Ubuntu 24.04’ün özelleştirilmiş bir sürümüne dayalı) üzerinde çalışır ve PyTorch/TensorFlow gibi ana akım yapay zeka çerçevelerini ve NIM mikro hizmetlerini tam olarak destekler. StorageReview, küme kurulumunu büyük ölçüde kolaylaştıran ve 405 milyar parametreye kadar son derece büyük modelleri desteklemek için çift sunucu yapılandırmasına olanak tanıyan NVMe-oF RDMA ağını (200 Gbps) övdü. HotHardware, 6144 CUDA çekirdeği ve 1 PFLOPS FP4 işlem gücü iddiasıyla temel özelliklerini doğruladı.
- Sınırlamalar ve Eksiklikler: Etkileyici performansına rağmen, dış incelemeler DGX Spark’ın bazı sınırlamalarına da işaret etti. Örneğin, Reddit kullanıcıları genel olarak fiyatının (eşdeğer bir M3 Ultra platformuna kıyasla 3999 dolar) çok yüksek olduğu konusunda hemfikir. Ayrıca, ARM mimarisinin geleneksel Windows uygulamaları ve oyunları için destek sağlamadığını da belirtiyorlar. Dahası, bellek bant genişliği sınırlamaları, büyük modellerde yavaş kod çözme hızlarına (10 tps’den az) neden oluyor. Bununla birlikte, yazılım hala erken aşamalarında ve gelecekteki güncellemelerin %20-30 performans optimizasyonu getirmesi bekleniyor.
NVIDIA DGX Spark Kimler İçin Uygundur?
DGX Spark’tan en çok kimler faydalanabilir?
Cevap sadece araştırmacılar veya geliştiricilerle sınırlı değil; hedef kullanıcı grubu sandığınızdan daha geniş.
- Yapay Zeka Derin Öğrenme Araştırmacıları ve Bilim İnsanları:
DGX Spark, karmaşık derin öğrenme modellerini eğitmek, ince ayar yapmak ve bunlarla deneyler yapmak isteyen bireysel araştırmacılar için idealdir. Üniversiteler ve araştırma kurumlarındaki laboratuvarlarda, belirli projelerde veya küçük gruplar içinde yapay zeka araştırma ve geliştirme çalışmaları için kullanılabilir. Bu kullanıcılar için DGX Spark, yerel kontrolü ve veri güvenliğini korurken güçlü bir işlem gücü sağlar. - Yapay Zeka Geliştiricileri ve Mühendisleri:
Yapay zeka uygulama geliştirme, ön dağıtım model doğrulama ve algoritma optimizasyonu ile ilgilenen mühendisler DGX Spark’ı son derece değerli bulacaklardır. Geliştirme döngülerini hızlandırmak için yerel, yüksek performanslı bir iş istasyonuna ihtiyaç duyan bireyler veya küçük ekipler, güçlü işlem gücünden ve kapsamlı yazılım ekosisteminden yararlanabilirler. - Yapay Zeka Girişimleri ve Küçük İşletmeler:
DGX Spark, pahalı GPU kümelerinin yerini alan, yüksek performanslı ve düşük erişim engelli bir yapay zeka platformu sunar. Sınırlı bütçeye sahip ancak yapay zeka işlem gücüne ihtiyaç duyan işletmeler için idealdir. - Üniversiteler ve Meslek Okulları:
DGX Spark, yapay zeka ile ilgili bölümler (bilgisayar bilimi, yapay zeka ve otomasyon gibi) için değerli bir öğretim ve deney platformudur. Öğrencilerin yapay zeka modeli eğitimi ve geliştirme alanındaki pratik becerilerini geliştirmek için kullanılabilir ve yükseköğretim laboratuvarları için yüksek performanslı bir uygulamalı platform sağlar. Sektöre Özgü Araştırma Ekipleri: Enerji, sağlık, finans ve üretim gibi alanlardaki araştırmacılar, DGX Spark’ı model eğitimi, tahmine dayalı modelleme ve yapay zeka uygulama keşfi için kullanabilirler.
ÖZET
Kompakt tasarımı, güçlü yapay zeka performansı ve optimize edilmiş yazılım ekosistemiyle NVIDIA DGX Spark, yerelleştirilmiş yapay zeka geliştirme için yenilikçi bir çözüm sunuyor. GB10 Grace Blackwell süper çipi ve birleşik bellek mimarisi, büyük dil modellerini işleme konusunda üstün performans göstererek yapay zeka araştırmaları, veri bilimi ve kurumsal uygulamalar için ideal hale geliyor. Yapay zeka teknolojisinin sürekli ilerlemesi ve uygulama alanlarının genişlemesiyle birlikte, DGX Spark’ın yapay zeka benimsenmesi ve inovasyonunda önemli bir güç haline gelmesi bekleniyor.
Aynı zamanda GTM Teknoloji, ağ ve genişletme için çeşitli ürünler sunarak DGX Spark kullanıcılarına güçlü destek sağlamaktadır.