NVIDIA Nemotron 3 Super: Agentic AI İçin Tasarlanmış Açık Kaynak Devi

NVIDIA, GTC 2026 konferansında yapay zeka dünyasını sarsan bir duyuru yaptı. Nemotron 3 Super, önceki nesle göre 5 kat daha yüksek throughput ve 2 kat daha fazla doğruluk sunarak agentic AI alanında yeni bir standart koydu. 120 milyar parametreli bu açık model, çıkarım sırasında yalnızca 12 milyar parametre etkinleştirerek verimlilik ile güç arasındaki dengeyi yeniden tanımlıyor.

Bu model neden bu kadar dikkat çekiyor? İşte NVIDIA Nemotron 3 Super hakkında bilmeniz gereken her şey: mimariden benchmark sonuçlarına, kurumsal kullanım alanlarından pratik erişim rehberine kadar kapsamlı bir analiz.

İçindekiler

NVIDIA Nemotron 3 Super Nedir?
Hibrit Mimari: Mamba-Transformer ve LatentMoE
Benchmark Sonuçları ve Performans Karşılaştırması
1 Milyon Token Bağlam Penceresi: Neden Önemli?
Kurumsal Kullanım Alanları
Nemotron 3 Super'a Nasıl Erişilir?
Nemotron 3 Ailesi: Nano, Super ve Ultra
Sonuç
Sıkça Sorulan Sorular

NVIDIA Nemotron 3 Super Nedir?

NVIDIA Nemotron 3 Super, NVIDIA'nın agentic AI uygulamaları için geliştirdiği açık kaynaklı büyük dil modelidir. NVIDIA bu modeli 11 Mart 2026'da GTC konferansında tanıttı ve kurumsal yapay zeka iş akışlarında devrim yaratmayı hedefliyor.

Modelin temel özelliklerini şöyle özetleyebiliriz:

Toplam parametre sayısı: 120 milyar
Aktif parametre sayısı: Çıkarım sırasında yalnızca 12 milyar
Eğitim verisi: NVIDIA, modeli 25 trilyon token üzerinde eğitti
Bağlam penceresi: 1 milyon token
Desteklenen diller: İngilizce, Fransızca, Almanca, İtalyanca, Japonca, İspanyolca ve Çince
Lisans: NVIDIA Nemotron Open Model License (ticari kullanıma açık)

Nemotron 3 Super, NVIDIA'nın Nemotron 3 ailesinin orta segmentinde konumlanır. Nano modeli hafif görevlere odaklanırken, Super modeli çoklu ajan sistemleri gibi karmaşık iş yüklerini hedefler. Eğitim verisi Şubat 2026'ya kadar güncel bilgi içerir ve bu özellik modeli sektördeki en güncel açık modellerden biri yapar.

Hibrit Mimari: Mamba-Transformer ve LatentMoE

Nemotron 3 Super'ın en dikkat çekici yönü, üç farklı mimari yaklaşımı tek bir modelde birleştirmesidir. Bu hibrit tasarım sayesinde model hem hızlı hem doğru çalışır.

Mamba-2 Katmanları

Geleneksel Transformer modelleri, uzun dizilerde dikkat mekanizması (attention) yüzünden kuadratik hesaplama maliyetiyle karşılaşır. Mamba-2 katmanları ise state-space model (SSM) yaklaşımıyla bu sorunu lineer zaman karmaşıklığına indirir. Böylece model, 1 milyon tokena kadar olan dizileri verimli şekilde işleyebilir.

Transformer Attention Katmanları

Mamba katmanları tek başına her görevi çözemez. Bilgi erişimi ve karmaşık akıl yürütme gibi durumlarda Transformer'ın dikkat mekanizması hâlâ vazgeçilmez bir rol oynar. Nemotron 3 Super, bu iki yaklaşımı hibrit bir yapıda birleştirerek her ikisinin güçlü yönlerinden yararlanır.

LatentMoE: Daha Fazla Uzman, Aynı Maliyet

Latent Mixture of Experts (LatentMoE), Nemotron 3 Super'ın en önemli mimari yeniliğidir. Geleneksel MoE mimarileri tokenleri doğrudan uzman ağlara yönlendirir. LatentMoE ise tokenleri önce daha küçük bir latent boyuta projekte eder, ardından yönlendirme yapar. Bu tasarım sayesinde model, aynı hesaplama bütçesiyle 4 kat daha fazla uzman barındırabilir.

Bu yaklaşım byte başına doğruluğu önemli ölçüde artırır. NVIDIA'nın açıklamasına göre LatentMoE, standart MoE mimarisine kıyasla daha güçlü genelleme kapasitesi sağlar.

Multi-Token Prediction ve NVFP4

Model ayrıca Multi-Token Prediction (MTP) katmanları içerir. MTP, her adımda birden fazla token tahmin ederek metin üretim hızını artırır ve çıktı kalitesini iyileştirir.

NVIDIA, eğitim sürecinde kendi geliştirdiği NVFP4 (4-bit kayan nokta) formatını kullandı. Bu format, Blackwell GPU mimarisinde bellek gereksinimlerini büyük ölçüde azaltırken doğruluk kaybını en aza indirir. NVIDIA'ya göre ekip, NVFP4 eğitimini ilk gradyandan itibaren uyguladı ve bu sektörde bir ilk oldu.

Benchmark Sonuçları ve Performans Karşılaştırması

Nemotron 3 Super, çeşitli benchmark testlerinde sınıfının en güçlü açık modeli olarak öne çıkar. Ancak bazı alanlarda kapalı modellerin gerisinde kalır.

Güçlü Olduğu Alanlar

Benchmark	Skor	Not
PinchBench	%85.6	Sınıfının en iyi açık modeli
DeepResearch Bench	1. sıra	Çok adımlı araştırma yeteneği
RULER (256K bağlam)	%96.3	Uzun bağlam performansı
RULER (1M bağlam)	%91.75	1M tokende dahi güçlü
AIME 2025	Sınıf lideri	Matematik ve mantık
SWE-Bench Verified	Sınıf lideri	Yazılım mühendisliği

nemotron-benchmark

Throughput Karşılaştırması

Nemotron 3 Super'ın en belirgin avantajı hız ve verimliliktir:

Önceki nesil Nemotron Super'a göre 5 kat daha yüksek throughput
GPT-OSS-120B'ye göre 2.2 kat daha yüksek throughput
Qwen3.5-122B'ye göre 7.5 kat daha yüksek throughput
Çıkarım hızı: saniyede yaklaşık 450 token

Modelin hibrit mimarisi ve NVFP4 eğitim formatı bu performans farkını mümkün kılar. Yüksek hacimli kurumsal iş yüklerinde bu verimlilik farkı kritik öneme sahiptir.

Dikkat Edilmesi Gereken Noktalar

Nemotron 3 Super her alanda en iyi model değildir. Artificial Analysis Intelligence Index'te 36 puan alarak GPT-5 serisi (57 puan) ve Claude Opus 4.6 (53 puan) gibi kapalı modellerin gerisinde kalır. Arena-Hard V2 ve GPQA gibi bazı benchmark'larda da görece zayıf performans gösterir.

Ancak burada önemli bir ayrım var: Nemotron 3 Super bir açık model olarak bu sonuçlara ulaşır. Aynı boyut sınıfındaki diğer açık modellerle kıyaslandığında performansı oldukça etkileyicidir.

1 Milyon Token Bağlam Penceresi: Neden Önemli?

Nemotron 3 Super'ın 1 milyon token bağlam penceresi, modelin en stratejik avantajlarından birini oluşturur. Bu özellik yalnızca "uzun metin okuma" ile sınırlı değildir.

Agentic AI'da "Goal Drift" Problemi

Otonom yapay zeka ajanları, çok adımlı görevleri yürütürken ciddi bir sorunla karşılaşır: goal drift (hedef sapması). Ajan, uzun bir görev zincirinde ilk hedefini unutabilir veya bağlamını kaybedebilir. Kısa bağlam pencereli modellerde bu sorun görev başarısızlığına yol açar.

1 milyon token bağlam penceresi sayesinde ajan, tüm iş akışı durumunu bellekte tutar. Böylece görev boyunca tutarlılığını korur ve hedef sapması riski büyük ölçüde düşer.

Pratik Senaryolar

Yazılım geliştirme: Bir yazılım geliştirme ajanı, büyük bir kod tabanının tamamını bağlam penceresine yükleyebilir. Belge bölümleme gereksinimi ortadan kalkar ve ajan uçtan uca kod üretebilir.

Finansal analiz: Analist ajanı, binlerce sayfalık finansal raporu tek seferde yükleyerek belgeler arasında çapraz referans yapabilir ve daha tutarlı analizler üretebilir.

Siber güvenlik: Güvenlik orkestrasyonunda ajan, devasa log dosyalarını ve olay kayıtlarını bütünsel olarak değerlendirebilir ve tehditleri daha hızlı tespit edebilir.

RULER benchmark sonuçları bu yeteneğin güvenilirliğini doğrular: 256K tokende %96.3, 512K tokende %95.67, 1M tokende %91.75 doğruluk oranıyla model, uzun bağlamda dahi yüksek performansını sürdürür.

Kurumsal Kullanım Alanları

NVIDIA, Nemotron 3 Super'ı özellikle çoklu ajan (multi-agent) sistemleri için optimize etti. Hangi sektörler ve kullanım alanları bu modelden en çok fayda sağlar?

Çoklu Ajan Sistemleri

Kurumsal ortamlarda birden fazla yapay zeka ajanının koordineli çalışması gereken senaryolar giderek yaygınlaşıyor. Nemotron 3 Super, düşük gecikme süresi ve yüksek doğruluklu araç çağırma (tool calling) yetenekleriyle bu alanda öne çıkar.

Bir IT destek hattı örneğinde farklı ajanlar bilet sınıflandırma, sorun teşhis ve çözüm önerisi gibi görevleri paralel yürütebilir. NVIDIA, bu tür senaryolarda Nemotron 3 Super'ın önemli verimlilik kazanımları sağladığını belirtiyor.

Sektörel Benimseyenler

Nemotron 3 Super'ı erken benimseyen kurumsal isimler dikkat çekici bir tablo oluşturuyor:

Amdocs: Telekom sektöründe müşteri hizmetleri otomasyonu
Palantir: Siber güvenlik ve istihbarat analitiği
Cadence: Yarı iletken tasarım iş akışları
Dassault Systèmes: Üretim ve mühendislik simülasyonları
Siemens: Endüstriyel otomasyon süreçleri

Dağıtım Seçenekleri

Kurumsal müşteriler esnek dağıtım seçeneklerinden yararlanabilir:

Bulut: Google Cloud Vertex AI, Oracle Cloud, Amazon Bedrock (yakında), Microsoft Azure (yakında)
On-Premise: Dell AI Factory ve HPE Agents Hub üzerinden şirket içi kurulum
Hibrit: NVIDIA NIM konteyner altyapısıyla hem bulut hem yerel dağıtım

Model tamamen açık olduğu için veri gizliliği ve güvenlik gereksinimleri olan kurumlar, modeli kendi altyapılarında tam kontrol altında çalıştırabilir.

Nemotron 3 Super'a Nasıl Erişilir?

Nemotron 3 Super'a birden fazla kanal üzerinden erişebilirsiniz. İhtiyacınıza göre en uygun yöntemi seçin.

API Erişimi

En hızlı başlangıç yöntemi API erişimidir:

NVIDIA build.nvidia.com: Doğrudan NVIDIA'nın kendi platformu üzerinden deneyebilirsiniz
DeepInfra: 1 milyon input token başına $0.10, 1 milyon output token başına $0.50 fiyatlandırmayla hizmet verir
OpenRouter: Ücretsiz tier dahil çeşitli seçenekler sunar
Perplexity: Pro aboneliğiyle kullanabilirsiniz

Model Ağırlıklarını İndirme

Hugging Face üzerinden farklı hassasiyet formatlarında indirebilirsiniz:

BF16: Tam hassasiyet, araştırma ve fine-tuning için ideal
FP8: Azaltılmış bellek kullanımı, prodüksiyon dağıtımı için uygun
NVFP4: En düşük bellek kullanımı, Blackwell GPU'larda optimize performans

Yerel Çalıştırma

Yerel çalıştırma için en az 64 GB RAM, VRAM veya birleşik bellek gerekir. NVIDIA, üç farklı çıkarım motoru için hazır cookbook'lar sunuyor:

vLLM: Yüksek throughput, sürekli batching ve streaming desteği
SGLang: Hafif ve hızlı, çoklu ajan tool-calling iş yükleri için optimize
TensorRT-LLM: Prodüksiyon seviyesinde düşük gecikme, LatentMoE çekirdek desteği

Agentic AI kavramı ve çoklu ajan mimarileri hakkında daha fazla bilgi için yapay zeka ajanları rehberimize göz atabilirsiniz.

Fine-Tuning

NVIDIA, modeli özel ihtiyaçlarınıza uyarlamak için LoRA/SFT ve GRPO/DAPO tabanlı özelleştirme cookbook'ları yayınladı. Unsloth platformu ise yerel fine-tuning için adım adım rehber sunuyor.

Nemotron 3 Ailesi: Nano, Super ve Ultra

Nemotron 3, tek bir model değil; farklı kullanım senaryoları için optimize edilmiş bir model ailesidir.

Özellik	Nemotron 3 Nano	Nemotron 3 Super	Nemotron 3 Ultra
Toplam Parametre	30 milyar	120 milyar	500 milyar
Aktif Parametre	3 milyar	12 milyar	50 milyar
Hedef Kullanım	Hafif görevler	Çoklu ajan sistemleri	Derin akıl yürütme
Durum	Kullanılabilir	Kullanılabilir	Yakında

Hangi Senaryoda Hangi Model?

Nemotron 3 Nano: İçerik özetleme, yazılım hata ayıklama, bilgi erişimi ve yapay zeka asistan iş akışları gibi düşük gecikme gerektiren görevlerde parlıyor. Önceki nesle göre 4 kat daha yüksek throughput sunuyor ve muhakeme token üretimini %60'a kadar azaltıyor.

Nemotron 3 Super: Birden fazla ajanın karmaşık görevleri koordineli yürüttüğü senaryolara odaklanıyor. IT ticket otomasyonu, finansal analiz ve siber güvenlik orkestrasyonu gibi iş yükleri Super modelinin güçlü olduğu alanlardır.

Nemotron 3 Ultra: NVIDIA bu modeli derin araştırma, stratejik planlama ve ileri düzey akıl yürütme gerektiren uygulamalar için geliştiriyor. 2026'nın ilk yarısında erişime açılması bekleniyor.

Bu kademeli yapı, kurumsal müşterilerin iş yükü karmaşıklığına göre doğru modeli seçmesine olanak tanır. Basit bir merge request'i Nano hallederken, tüm kod tabanını analiz eden karmaşık bir geliştirme görevi Super'a yönlendirilebilir.

Sonuç

NVIDIA Nemotron 3 Super, açık kaynak yapay zeka modellerinde yeni bir kilometre taşı oluşturuyor. Hibrit Mamba-Transformer mimarisi, LatentMoE inovasyonu ve 1 milyon token bağlam penceresi, modeli agentic AI uygulamaları için güçlü bir aday konumuna getiriyor.

Öne çıkan dört temel nokta:

Verimlilik ve güç dengesi: 120B parametre, yalnızca 12B aktif — bu da düşük maliyet ve yüksek performans demek
Sınıfının en iyisi throughput: Rakiplerine göre 2.2x ile 7.5x arasında daha yüksek throughput sunuyor
Kurumsal hazırlık: Amdocs, Palantir ve Siemens gibi dev şirketler modeli benimsedi
Tam açıklık: Ağırlıklar, veri setleri ve eğitim tarifleri tamamen açık ve ticari kullanıma uygun

Nemotron 3 Super'ı denemek için build.nvidia.com üzerinden hemen başlayabilirsiniz. Agentic AI uygulamalarının geleceği, bu tür verimli ve güçlü açık modellerin yaygınlaşmasıyla şekillenecektir.

Sıkça Sorulan Sorular

NVIDIA Nemotron 3 Super nedir ve ne işe yarar?

NVIDIA, Nemotron 3 Super'ı 120 milyar parametreli açık kaynak bir dil modeli olarak geliştirdi. Model, hibrit Mamba-Transformer MoE mimarisi sayesinde agentic AI uygulamalarında yüksek doğruluk ve verimlilik sunuyor. Özellikle çoklu ajan sistemleri, kurumsal iş akışı otomasyonu ve uzun bağlam gerektiren görevlerde güçlü performans sergiliyor.

LatentMoE mimarisi geleneksel MoE'den nasıl farklıdır?

Geleneksel MoE mimarileri tokenleri doğrudan uzman ağlara yönlendirir. LatentMoE ise tokenleri önce daha küçük bir latent boyuta projekte eder, ardından yönlendirme yapar. Bu tasarım aynı hesaplama bütçesiyle 4 kat daha fazla uzman barındırır ve byte başına doğruluğu önemli ölçüde artırır.

Nemotron 3 Super ücretsiz mi kullanılabilir?

Evet. Hugging Face üzerinden model ağırlıklarını ücretsiz indirebilir ve NVIDIA Nemotron Open Model License kapsamında ticari projelerinizde kullanabilirsiniz. API erişimi için build.nvidia.com ve OpenRouter ücretsiz seçenekler sunar. DeepInfra gibi sağlayıcılar ise uygun fiyatlı ücretli erişim sağlar.

Nemotron 3 Super'ı yerel olarak çalıştırmak için ne gerekir?

En az 64 GB RAM, VRAM veya birleşik bellek gerekir. vLLM, SGLang veya TensorRT-LLM gibi inference motorlarıyla çalıştırabilirsiniz. FP8 ve NVFP4 formatları bellek gereksinimini büyük ölçüde azaltır. NVIDIA, her üç motor için hazır kurulum rehberleri sunuyor.

Nemotron 3 Super hangi dilleri destekler?

Model İngilizce, Fransızca, Almanca, İtalyanca, Japonca, İspanyolca ve Çince olmak üzere 7 dili destekler. Türkçe şu an resmi olarak desteklenen diller arasında yer almıyor; ancak modelin geniş eğitim verisi sayesinde Türkçe içeriklerle de çalışabilirsiniz.

NVIDIA Nemotron 3 Super: Agentic AI İçin Tasarlanmış Açık Kaynak Devi

İçindekiler

NVIDIA Nemotron 3 Super Nedir?
Hibrit Mimari: Mamba-Transformer ve LatentMoE
Benchmark Sonuçları ve Performans Karşılaştırması
1 Milyon Token Bağlam Penceresi: Neden Önemli?
Kurumsal Kullanım Alanları
Nemotron 3 Super'a Nasıl Erişilir?
Nemotron 3 Ailesi: Nano, Super ve Ultra
Sonuç
Sıkça Sorulan Sorular

NVIDIA Nemotron 3 Super Nedir?

Modelin temel özelliklerini şöyle özetleyebiliriz:

Toplam parametre sayısı: 120 milyar
Aktif parametre sayısı: Çıkarım sırasında yalnızca 12 milyar
Eğitim verisi: NVIDIA, modeli 25 trilyon token üzerinde eğitti
Bağlam penceresi: 1 milyon token
Desteklenen diller: İngilizce, Fransızca, Almanca, İtalyanca, Japonca, İspanyolca ve Çince
Lisans: NVIDIA Nemotron Open Model License (ticari kullanıma açık)

Hibrit Mimari: Mamba-Transformer ve LatentMoE

Nemotron 3 Super'ın en dikkat çekici yönü, üç farklı mimari yaklaşımı tek bir modelde birleştirmesidir. Bu hibrit tasarım sayesinde model hem hızlı hem doğru çalışır.

Mamba-2 Katmanları

Transformer Attention Katmanları

LatentMoE: Daha Fazla Uzman, Aynı Maliyet

Bu yaklaşım byte başına doğruluğu önemli ölçüde artırır. NVIDIA'nın açıklamasına göre LatentMoE, standart MoE mimarisine kıyasla daha güçlü genelleme kapasitesi sağlar.

Multi-Token Prediction ve NVFP4

Model ayrıca Multi-Token Prediction (MTP) katmanları içerir. MTP, her adımda birden fazla token tahmin ederek metin üretim hızını artırır ve çıktı kalitesini iyileştirir.

Benchmark Sonuçları ve Performans Karşılaştırması

Nemotron 3 Super, çeşitli benchmark testlerinde sınıfının en güçlü açık modeli olarak öne çıkar. Ancak bazı alanlarda kapalı modellerin gerisinde kalır.

Güçlü Olduğu Alanlar

Benchmark	Skor	Not
PinchBench	%85.6	Sınıfının en iyi açık modeli
DeepResearch Bench	1. sıra	Çok adımlı araştırma yeteneği
RULER (256K bağlam)	%96.3	Uzun bağlam performansı
RULER (1M bağlam)	%91.75	1M tokende dahi güçlü
AIME 2025	Sınıf lideri	Matematik ve mantık
SWE-Bench Verified	Sınıf lideri	Yazılım mühendisliği

nemotron-benchmark

Throughput Karşılaştırması

Nemotron 3 Super'ın en belirgin avantajı hız ve verimliliktir:

Önceki nesil Nemotron Super'a göre 5 kat daha yüksek throughput
GPT-OSS-120B'ye göre 2.2 kat daha yüksek throughput
Qwen3.5-122B'ye göre 7.5 kat daha yüksek throughput
Çıkarım hızı: saniyede yaklaşık 450 token

Modelin hibrit mimarisi ve NVFP4 eğitim formatı bu performans farkını mümkün kılar. Yüksek hacimli kurumsal iş yüklerinde bu verimlilik farkı kritik öneme sahiptir.

Dikkat Edilmesi Gereken Noktalar

1 Milyon Token Bağlam Penceresi: Neden Önemli?

Nemotron 3 Super'ın 1 milyon token bağlam penceresi, modelin en stratejik avantajlarından birini oluşturur. Bu özellik yalnızca "uzun metin okuma" ile sınırlı değildir.

Agentic AI'da "Goal Drift" Problemi

1 milyon token bağlam penceresi sayesinde ajan, tüm iş akışı durumunu bellekte tutar. Böylece görev boyunca tutarlılığını korur ve hedef sapması riski büyük ölçüde düşer.

Pratik Senaryolar

Finansal analiz: Analist ajanı, binlerce sayfalık finansal raporu tek seferde yükleyerek belgeler arasında çapraz referans yapabilir ve daha tutarlı analizler üretebilir.

Siber güvenlik: Güvenlik orkestrasyonunda ajan, devasa log dosyalarını ve olay kayıtlarını bütünsel olarak değerlendirebilir ve tehditleri daha hızlı tespit edebilir.

Kurumsal Kullanım Alanları

NVIDIA, Nemotron 3 Super'ı özellikle çoklu ajan (multi-agent) sistemleri için optimize etti. Hangi sektörler ve kullanım alanları bu modelden en çok fayda sağlar?

Çoklu Ajan Sistemleri

Sektörel Benimseyenler

Nemotron 3 Super'ı erken benimseyen kurumsal isimler dikkat çekici bir tablo oluşturuyor:

Amdocs: Telekom sektöründe müşteri hizmetleri otomasyonu
Palantir: Siber güvenlik ve istihbarat analitiği
Cadence: Yarı iletken tasarım iş akışları
Dassault Systèmes: Üretim ve mühendislik simülasyonları
Siemens: Endüstriyel otomasyon süreçleri

Dağıtım Seçenekleri

Kurumsal müşteriler esnek dağıtım seçeneklerinden yararlanabilir:

Bulut: Google Cloud Vertex AI, Oracle Cloud, Amazon Bedrock (yakında), Microsoft Azure (yakında)
On-Premise: Dell AI Factory ve HPE Agents Hub üzerinden şirket içi kurulum
Hibrit: NVIDIA NIM konteyner altyapısıyla hem bulut hem yerel dağıtım

Model tamamen açık olduğu için veri gizliliği ve güvenlik gereksinimleri olan kurumlar, modeli kendi altyapılarında tam kontrol altında çalıştırabilir.

Nemotron 3 Super'a Nasıl Erişilir?

Nemotron 3 Super'a birden fazla kanal üzerinden erişebilirsiniz. İhtiyacınıza göre en uygun yöntemi seçin.

API Erişimi

En hızlı başlangıç yöntemi API erişimidir:

NVIDIA build.nvidia.com: Doğrudan NVIDIA'nın kendi platformu üzerinden deneyebilirsiniz
DeepInfra: 1 milyon input token başına $0.10, 1 milyon output token başına $0.50 fiyatlandırmayla hizmet verir
OpenRouter: Ücretsiz tier dahil çeşitli seçenekler sunar
Perplexity: Pro aboneliğiyle kullanabilirsiniz

Model Ağırlıklarını İndirme

Hugging Face üzerinden farklı hassasiyet formatlarında indirebilirsiniz:

BF16: Tam hassasiyet, araştırma ve fine-tuning için ideal
FP8: Azaltılmış bellek kullanımı, prodüksiyon dağıtımı için uygun
NVFP4: En düşük bellek kullanımı, Blackwell GPU'larda optimize performans

Yerel Çalıştırma

Yerel çalıştırma için en az 64 GB RAM, VRAM veya birleşik bellek gerekir. NVIDIA, üç farklı çıkarım motoru için hazır cookbook'lar sunuyor:

vLLM: Yüksek throughput, sürekli batching ve streaming desteği
SGLang: Hafif ve hızlı, çoklu ajan tool-calling iş yükleri için optimize
TensorRT-LLM: Prodüksiyon seviyesinde düşük gecikme, LatentMoE çekirdek desteği

Agentic AI kavramı ve çoklu ajan mimarileri hakkında daha fazla bilgi için yapay zeka ajanları rehberimize göz atabilirsiniz.

Fine-Tuning

Nemotron 3 Ailesi: Nano, Super ve Ultra

Nemotron 3, tek bir model değil; farklı kullanım senaryoları için optimize edilmiş bir model ailesidir.

Özellik	Nemotron 3 Nano	Nemotron 3 Super	Nemotron 3 Ultra
Toplam Parametre	30 milyar	120 milyar	500 milyar
Aktif Parametre	3 milyar	12 milyar	50 milyar
Hedef Kullanım	Hafif görevler	Çoklu ajan sistemleri	Derin akıl yürütme
Durum	Kullanılabilir	Kullanılabilir	Yakında

Hangi Senaryoda Hangi Model?

Sonuç

Öne çıkan dört temel nokta:

Verimlilik ve güç dengesi: 120B parametre, yalnızca 12B aktif — bu da düşük maliyet ve yüksek performans demek
Sınıfının en iyisi throughput: Rakiplerine göre 2.2x ile 7.5x arasında daha yüksek throughput sunuyor
Kurumsal hazırlık: Amdocs, Palantir ve Siemens gibi dev şirketler modeli benimsedi
Tam açıklık: Ağırlıklar, veri setleri ve eğitim tarifleri tamamen açık ve ticari kullanıma uygun

NVIDIA Nemotron 3 Super: Agentic AI İçin Tasarlanmış Açık Kaynak Devi

İçindekiler

NVIDIA Nemotron 3 Super Nedir?

Hibrit Mimari: Mamba-Transformer ve LatentMoE

Mamba-2 Katmanları

Transformer Attention Katmanları

LatentMoE: Daha Fazla Uzman, Aynı Maliyet

Multi-Token Prediction ve NVFP4

Benchmark Sonuçları ve Performans Karşılaştırması

Güçlü Olduğu Alanlar

Throughput Karşılaştırması

Dikkat Edilmesi Gereken Noktalar

1 Milyon Token Bağlam Penceresi: Neden Önemli?

Agentic AI'da "Goal Drift" Problemi

Pratik Senaryolar

Kurumsal Kullanım Alanları

Çoklu Ajan Sistemleri

Sektörel Benimseyenler

Dağıtım Seçenekleri

Nemotron 3 Super'a Nasıl Erişilir?

API Erişimi

Model Ağırlıklarını İndirme

Yerel Çalıştırma

Fine-Tuning

Nemotron 3 Ailesi: Nano, Super ve Ultra

Hangi Senaryoda Hangi Model?

Sonuç

Sıkça Sorulan Sorular

NVIDIA Nemotron 3 Super nedir ve ne işe yarar?

LatentMoE mimarisi geleneksel MoE'den nasıl farklıdır?

Nemotron 3 Super ücretsiz mi kullanılabilir?

Nemotron 3 Super'ı yerel olarak çalıştırmak için ne gerekir?

Nemotron 3 Super hangi dilleri destekler?

Salih Korkmaz

NVIDIA Nemotron 3 Super: Agentic AI İçin Tasarlanmış Açık Kaynak Devi

İçindekiler

NVIDIA Nemotron 3 Super Nedir?

Hibrit Mimari: Mamba-Transformer ve LatentMoE

Mamba-2 Katmanları

Transformer Attention Katmanları

LatentMoE: Daha Fazla Uzman, Aynı Maliyet

Multi-Token Prediction ve NVFP4

Benchmark Sonuçları ve Performans Karşılaştırması

Güçlü Olduğu Alanlar

Throughput Karşılaştırması

Dikkat Edilmesi Gereken Noktalar

1 Milyon Token Bağlam Penceresi: Neden Önemli?

Agentic AI'da "Goal Drift" Problemi

Pratik Senaryolar

Kurumsal Kullanım Alanları

Çoklu Ajan Sistemleri

Sektörel Benimseyenler

Dağıtım Seçenekleri

Nemotron 3 Super'a Nasıl Erişilir?

API Erişimi

Model Ağırlıklarını İndirme

Yerel Çalıştırma

Fine-Tuning

Nemotron 3 Ailesi: Nano, Super ve Ultra

Hangi Senaryoda Hangi Model?

Sonuç

Sıkça Sorulan Sorular

NVIDIA Nemotron 3 Super nedir ve ne işe yarar?

LatentMoE mimarisi geleneksel MoE'den nasıl farklıdır?

Nemotron 3 Super ücretsiz mi kullanılabilir?

Nemotron 3 Super'ı yerel olarak çalıştırmak için ne gerekir?

Nemotron 3 Super hangi dilleri destekler?

Salih Korkmaz