Türkçe yapay zekada yeni bir kilometre taşı: Kumru LLM
Yazılım şirketi VNGRS, Türkçe için sıfırdan eğitilen ilk büyük dil modeli olan Kumru LLM'i duyurdu. 7.4 milyar parametreye sahip model, düşük donanım gereksinimleri ve yüksek verimliliği ile dikkat çekti.
Son Güncelleme: 11.10.2025 - 09:57
- 7.4 milyar parametre ile sıfırdan Türkçe için geliştirilen Kumru, yerel bir temel model olarak konumlandırıldı.
- Düşük donanım gereksinimi sayesinde model, 16 GB VRAM'e sahip tüketici ekran kartlarında çalışarak maliyet avantajı sağladı.
- Yapılan testlerde Kumru, Türkçe dil görevlerinde kendisinden çok daha büyük yabancı dil modellerini geride bıraktı.
- Modelin Kumru-2B adıyla daha küçük ve açık kaynaklı bir versiyonu Hugging Face üzerinde, demo sürümü ise kendi web sitesinde kullanıma sunuldu.
VNGRS, Türkçe odaklı yapay zeka alanında yeni bir dönem başlattı
Yazılım firması VNGRS, Türkçe için sıfırdan geliştirdiği ilk büyük dil modeli Kumru LLM'i kamuoyuna tanıttı. Tamamen yerel bir temel model olarak tasarlanan Kumru, 7.4 milyar parametreye sahip.
Modelin temel kullanım alanları belge işleme, metin özetleme ve kurumsal soru-cevap sistemleri olarak belirlendi. Şirket, talebe göre farklı sektörlere yönelik özel modeller de eğiteceğini açıkladı.
Kumru LLM, Türkçe için eğitilmiş olmasına rağmen İngilizce dilini ve kodlama yeteneklerini de bünyesinde barındırdı. Bu özellik, modelin çok yönlü kullanımını mümkün kıldı.
Modelin eğitimi 45 gün sürdü ve mimarisi verimlilik üzerine kuruldu
Modelin ön eğitim süreci 45 gün içinde tamamlandı ve bu süreçte 500 GB boyutunda temizlenmiş Türkçe veri kullanıldı. Eğitim için H100 ve H200 gibi gelişmiş GPU'lardan yararlanıldı.
Eğitimin ardından model üzerinde, 1 milyon örnek içeren bir veri setiyle ince ayar (fine-tuning) işlemi gerçekleştirildi. Modelin bilgi birikiminin Mart 2024 itibarıyla kesildiği belirtildi.
Kumru'nun teknik mimarisi açık kaynak kodlu Mistral-v0.3 tabanını esas aldı. Ayrıca LLaMA-3 teknik belgesindeki tasarım kararları, modelin geliştirilmesinde referans noktası oldu.
8.192 tokenlik bağlam uzunluğu, modelin tek seferde yaklaşık 20 A4 sayfası metni işleyebilmesine olanak tanıdı. Bu kapasite, uzun belgelerin analizi için önemli bir avantaj teşkil etti.
Düşük sistem gereksinimi ile maliyet avantajı sağladı
Verimlilik odaklı tasarımı, Kumru'nun RTX 3090 gibi 16 GB VRAM'li tüketici ekran kartlarında dahi çalışmasını sağladı. Bu durum, modeli kurum içi kullanım için erişilebilir hale getirdi.
VNGRS'ye göre Kumru'nun kurum içi kurulum maliyeti yaklaşık 2.000 dolar seviyesinde kaldı. Bu rakam, benzer kapasitedeki yabancı bir model için gereken 30.000 dolarlık tek bir GPU maliyetiyle kıyaslandığında önemli bir fark oluşturdu.
Türkçe dil görevlerinde büyük rakiplerini geride bıraktı
Yapılan performans testleri, Kumru'nun LLaMA-3.3–70B ve Gemma-3–27B gibi çok daha büyük modellere karşı Türkçe görevlerde üstünlük kurduğunu gösterdi. Model özellikle dilbilgisi düzeltme ve özetleme yetenekleriyle öne çıktı.
Bu başarının arkasındaki nedenlerden biri, Türkçe'nin yapısal özelliklerini daha iyi kavraması oldu. Modelin tokenizasyon sistemi de özel olarak Türkçe için yeniden tasarlandı.
Geliştirilen yeni ön işlemci sayesinde metinler, yüzde 38 ile yüzde 98 arasında daha az token kullanılarak işlendi. Bu verimlilik, işlem hızını artırırken maliyetleri de düşürdü.
Açık kaynaklı ve demo sürümü kullanıma sunuldu
Geliştiriciler ve araştırmacılar için Kumru-2B adında 2 milyar parametrelik daha küçük bir versiyon da yayımlandı. Yalnızca 4.8 GB bellek gerektiren bu sürüm, mobil cihazlarda bile çalışabiliyor.
Kumru-2B modeline Hugging Face platformu üzerinden erişim sağlandı. Herkesin deneyebileceği herkese açık demo sürümü ise kumru.ai web adresi üzerinden hizmete açıldı.
Kaynak:
GDH Haber
İLGİLİ HABERLER
Elon Musk'ın yapay zekası Grok Musk'ı "Dünya tarihinin en büyük insanı" ilan etti
Yapay zeka bazı mesleklerin yerini alamıyor: İnsan emeği şart
ChatGPT'nin üreticisi OpenAI intihar davasında kendini savundu
Napster'ın 3 milyar dolarlık gizemli fonlaması iptal oldu
İnsan emeğiyle yazılan kitaplar lüks bir tüketim mi olacak?
Apple'ın en üst yöneticilerinden yapay zeka şefi görevi bıraktı
DİĞER HABERLER
Apple'ın en üst yöneticilerinden yapay zeka şefi görevi bıraktı
fizy 2025 zaman tüneli yayında: Yılın en çok dinlenenleri belli oldu!
Take Off İstanbul 2025: Bölgenin teknoloji ve girişim zirvesi için geri sayım başladı
Tesla Model Y standart fiyatı ne kadar? Tesla model Y Standart menzili kaç KM, bagajı kaç LT?
Internal server error nedir? Error code 500 Internal server error neden olur?
İOS 26.1 ne zaman gelecek, çıktı mı? Apple ile İOS 26.1 yenilikleri ve özellikleri nelerdir?
Adobe Photoshop'a güçlü bir rakip: Affinity by Canva kullanıma sunuldu
Epic Games'in bu hafta vereceği ücretsiz oyunlar belli oldu
Meta AI, Türkçe dil desteğiyle Türkiye'de kullanıma sunuldu
Türkiye’de yapay zeka kullanım oranları açıklandı: Zirve ChatGPT'nin



