NVIDIA Diam-Diam Buka Akses Gratis ke Puluhan Model AI

8 Juni 2026 · 3 min read · Aries Piskha

Platform NVIDIA Build menyediakan akses ke puluhan model frontier secara gratis via API — termasuk MiniMax M2.7, GLM 5.1, Kimi 2.5, DeepSeek 3.2, dan GPT-OSS-120B. Tidak butuh kartu kredit, tidak ada timer trial. Yang ada hanya rate limit, dan itu perlu kamu ketahui sebelum mulai.

Ini bukan promo musiman. NVIDIA NIM (NVIDIA Inference Microservices) sudah aktif sejak beberapa bulan lalu, dan sampai sekarang masih bisa dipakai gratis. Tapi ada beberapa hal yang versi-versi artikel sebelumnya tentang ini tidak ceritakan dengan jujur — termasuk berapa model yang benar-benar gratis, dan apa batasannya.

Berapa model yang gratis?

Angka yang sering beredar adalah "80+" atau bahkan "100+ model gratis". Itu tidak tepat. Total katalog NVIDIA Build memang 100+ model, tapi yang tersedia di free tier saat ini ada sekitar 46 model dari 12 publisher.

Model gratis

~46

Total katalog

100+

Publisher

Rate limit

40 RPM

Sisanya membutuhkan NVIDIA AI Enterprise license atau berbayar per token. Bedanya penting, terutama kalau kamu lagi plan workflow di atas asumsi "semua gratis".

Model apa saja yang tersedia gratis?

Beberapa nama yang bisa langsung dipakai dari free tier:

MiniMax M2.7 — MiniMax
GLM 5.1 — Zhipu AI
Kimi 2.5 — Moonshot AI
DeepSeek 3.2 — DeepSeek
GPT-OSS-120B — Open
Llama 4 Maverick — Meta

Ini bukan model lite atau versi pangkas. Sebagian besar adalah model production-grade yang sama yang bisa kamu akses lewat provider berbayar lain.

Setup-nya

Daftar dan ambil API key di build.nvidia.com/models — filter "Free Endpoint" untuk lihat yang gratis
Set base_url dan api_key seperti di bawah
Pilih model ID dari halaman model, langsung pakai

# OpenAI SDK compatible — plug langsung ke Hermes, Cursor, OpenCode
base_url = "https://integrate.api.nvidia.com/v1"
api_key  = "$NVIDIA_API_KEY"
model    = "minimaxai/minimax-m2.7"

Karena endpoint-nya kompatibel dengan format OpenAI, ini bisa langsung dipasang ke tool yang sudah ada tanpa wrapper khusus atau migrasi kode.

Yang perlu kamu tahu sebelum langsung pakai

⚠ Dua hal yang sering tidak disebutkan

Rate limit free tier ada di sekitar 40 request per menit. Cukup untuk coding interaktif dan eksperimen, tapi akan jadi bottleneck untuk automated pipeline atau batch processing. Kalau kena error 429, tambahkan delay antar request.

Model availability tidak stabil. Model bisa di-deprecate atau dihapus dengan pemberitahuan beberapa hari saja. Kalau kamu build di atas ini, pastikan workflow kamu fleksibel untuk ganti model ID tanpa banyak perubahan kode.

Satu lagi soal data privacy: beberapa model yang tersedia — terutama dari vendor China seperti MiniMax, DeepSeek, dan Kimi — perlu dipertimbangkan kalau kamu handle kode proprietary atau informasi sensitif. Prompt yang dikirim melewati infrastruktur pihak ketiga dengan yurisdiksi hukum yang berbeda. Untuk eksperimen dan prototyping yang tidak melibatkan data sensitif, tidak masalah. Untuk production dengan data customer, ini perlu jadi bagian dari risk assessment kamu.

Kenapa NVIDIA melakukan ini?

NVIDIA bukan perusahaan filantropi. Strateginya cukup jelas: mereka mau developer terbiasa membangun di atas infrastruktur mereka. Semakin banyak orang yang pakai NVIDIA Build sebagai default endpoint, semakin kuat posisi mereka sebagai layer infrastruktur AI — di atas chip, bukan hanya di dalam chip.

Tapi dari sisi developer? Motivasi mereka tidak terlalu relevan. Yang relevan adalah: akses nyata ke model production-grade, tanpa kartu kredit, dengan batasan yang jelas dan jujur.

Ini bukan satu-satunya opsi

Landscape free tier model sekarang lebih ramai dari sebelumnya. Groq punya free tier dengan latency rendah. Together AI dan Fireworks AI punya free credits untuk eksperimen. Hugging Face Spaces menjalankan banyak model gratis. OpenRouter punya routing ke free model dari berbagai provider.

Polanya berulang: perusahaan infrastruktur berlomba dapat developer mindshare sebelum pasar konsolidasi. Ini yang membuat sekarang — bukan nanti — waktu yang tepat untuk eksperimen sebelum semua free tier dikencangkan.

Lalu mulai dari mana?

Kalau kamu belum pernah nyoba: ambil API key, filter "Free Endpoint" di katalog, dan coba dua atau tiga model yang belum pernah kamu sentuh. Lihat mana yang paling relevan untuk use case kamu — bukan berdasarkan nama yang paling sering disebut di Twitter, tapi berdasarkan apa yang benar-benar bekerja untuk task spesifik kamu.

Ini soal tahu pilihan apa yang ada — supaya kamu yang memilih, bukan kebiasaan.

Ditulis berdasarkan data publik dari NVIDIA Build, Medium/Coding Nexus, AI Tools Mentor — Juni 2026