Türkçe yapay zekada yeni bir kilometre taşı: Kumru LLM
Yazılım şirketi VNGRS, Türkçe için sıfırdan eğitilen ilk büyük dil modeli olan Kumru LLM'i duyurdu. 7.4 milyar parametreye sahip model, düşük donanım gereksinimleri ve yüksek verimliliği ile dikkat çekti.
0:00
--:--
Son Güncelleme: 11.10.2025 - 09:57
- 7.4 milyar parametre ile sıfırdan Türkçe için geliştirilen Kumru, yerel bir temel model olarak konumlandırıldı.
- Düşük donanım gereksinimi sayesinde model, 16 GB VRAM'e sahip tüketici ekran kartlarında çalışarak maliyet avantajı sağladı.
- Yapılan testlerde Kumru, Türkçe dil görevlerinde kendisinden çok daha büyük yabancı dil modellerini geride bıraktı.
- Modelin Kumru-2B adıyla daha küçük ve açık kaynaklı bir versiyonu Hugging Face üzerinde, demo sürümü ise kendi web sitesinde kullanıma sunuldu.
VNGRS, Türkçe odaklı yapay zeka alanında yeni bir dönem başlattı
Yazılım firması VNGRS, Türkçe için sıfırdan geliştirdiği ilk büyük dil modeli Kumru LLM'i kamuoyuna tanıttı. Tamamen yerel bir temel model olarak tasarlanan Kumru, 7.4 milyar parametreye sahip.
Modelin temel kullanım alanları belge işleme, metin özetleme ve kurumsal soru-cevap sistemleri olarak belirlendi. Şirket, talebe göre farklı sektörlere yönelik özel modeller de eğiteceğini açıkladı.
Kumru LLM, Türkçe için eğitilmiş olmasına rağmen İngilizce dilini ve kodlama yeteneklerini de bünyesinde barındırdı. Bu özellik, modelin çok yönlü kullanımını mümkün kıldı.
Modelin eğitimi 45 gün sürdü ve mimarisi verimlilik üzerine kuruldu
Modelin ön eğitim süreci 45 gün içinde tamamlandı ve bu süreçte 500 GB boyutunda temizlenmiş Türkçe veri kullanıldı. Eğitim için H100 ve H200 gibi gelişmiş GPU'lardan yararlanıldı.
Eğitimin ardından model üzerinde, 1 milyon örnek içeren bir veri setiyle ince ayar (fine-tuning) işlemi gerçekleştirildi. Modelin bilgi birikiminin Mart 2024 itibarıyla kesildiği belirtildi.
Kumru'nun teknik mimarisi açık kaynak kodlu Mistral-v0.3 tabanını esas aldı. Ayrıca LLaMA-3 teknik belgesindeki tasarım kararları, modelin geliştirilmesinde referans noktası oldu.
8.192 tokenlik bağlam uzunluğu, modelin tek seferde yaklaşık 20 A4 sayfası metni işleyebilmesine olanak tanıdı. Bu kapasite, uzun belgelerin analizi için önemli bir avantaj teşkil etti.
Düşük sistem gereksinimi ile maliyet avantajı sağladı
Verimlilik odaklı tasarımı, Kumru'nun RTX 3090 gibi 16 GB VRAM'li tüketici ekran kartlarında dahi çalışmasını sağladı. Bu durum, modeli kurum içi kullanım için erişilebilir hale getirdi.
VNGRS'ye göre Kumru'nun kurum içi kurulum maliyeti yaklaşık 2.000 dolar seviyesinde kaldı. Bu rakam, benzer kapasitedeki yabancı bir model için gereken 30.000 dolarlık tek bir GPU maliyetiyle kıyaslandığında önemli bir fark oluşturdu.
Türkçe dil görevlerinde büyük rakiplerini geride bıraktı
Yapılan performans testleri, Kumru'nun LLaMA-3.3–70B ve Gemma-3–27B gibi çok daha büyük modellere karşı Türkçe görevlerde üstünlük kurduğunu gösterdi. Model özellikle dilbilgisi düzeltme ve özetleme yetenekleriyle öne çıktı.
Bu başarının arkasındaki nedenlerden biri, Türkçe'nin yapısal özelliklerini daha iyi kavraması oldu. Modelin tokenizasyon sistemi de özel olarak Türkçe için yeniden tasarlandı.
Geliştirilen yeni ön işlemci sayesinde metinler, yüzde 38 ile yüzde 98 arasında daha az token kullanılarak işlendi. Bu verimlilik, işlem hızını artırırken maliyetleri de düşürdü.
Açık kaynaklı ve demo sürümü kullanıma sunuldu
Geliştiriciler ve araştırmacılar için Kumru-2B adında 2 milyar parametrelik daha küçük bir versiyon da yayımlandı. Yalnızca 4.8 GB bellek gerektiren bu sürüm, mobil cihazlarda bile çalışabiliyor.
Kumru-2B modeline Hugging Face platformu üzerinden erişim sağlandı. Herkesin deneyebileceği herkese açık demo sürümü ise kumru.ai web adresi üzerinden hizmete açıldı.
Kaynak:
GDH Haber
İLGİLİ HABERLER
Çin, yapay zekâ kontrollü silahları doğadan öğrenen algoritmalarla eğitiyor
Sanatta yapay zeka tartışması: Eserleri yiyerek protesto etti
Fransız şirketlerden hava savunma sistemlerinde yapay zeka kullanımını hızlandırmak için ortaklık girişimi
Trump ileri düzey yapay zeka çiplerine yüzde 25 ek gümrük vergisi getirdi
Grok 11 günde milyonlarca cinsel deepfake üretmiş olabilir
Eski çalışan Google'ı İsrailli şirkete yapay zeka desteği sağlayarak ilkeleri ihlalle suçladı
DİĞER HABERLER
Fransa'da X platformuna dev operasyon: Elon Musk ifadeye çağrıldı
Dijital dünyada çocuk güvenliği: Steam ve yeni oyun yasası iş birliği
Arı beyinlerinden esinlenen yeni çipler mikro robotlara tam otonomi kazandırıyor
Popüler metin editörü Notepad++ siber saldırıya uğradı
Firefox yapay zeka dayatmasına son veriyor
Meta çocuk istismarı davasında jüri karşısında
Çinli üreticiden devrim: Dört tekerleği bağımsız dönebilen ilk SUV tanıtıldı
Google Chrome AI ile aramayı bırakıp araştırmaya başlıyor
NVIDIA Earth-2 ile hava durumu tahmininde yapay zeka devrimi başladı
Elon Musk SpaceX, Tesla ve xAI’yı tek çatı altında toplamayı değerlendiriyor



