Tüm dünya Çin’in yapay zekası DeepSeek’i konuşuyor

Çin merkezli yapay zeka uygulaması DeepSeek az sayıda çip kullanması ve az maliyetle geliştirilmesiyle gündemde.

0:00

--:--

Son Güncelleme: 28.01.2025 - 14:55

Editör

Abone Ol

Tüm dünya Çin’in yapay zekası DeepSeek’i konuşuyor

Çin'in yapay zeka uygulaması DeepSeek.

DeepSeek’in sonuncu versiyonu DeepSeek-R1, OpenAI, Google ve Meta gibi dev yapay zeka araçları üreticilerinin sektördeki hakimiyetine meydan okudu. Peki, Nvidia’ya bir günde 600 milyar dolar zarar verebilen DeepSeek’in başarısının sırrı ne?

DeepSeek nedir?

DeepSeek'in kuruluş serüveni, Kasım 2023'te kodlama görevleri için geliştirilen açık kaynaklı bir model olan DeepSeek Coder'ın lansmanıyla başladı. Bu adımı, diğer büyük dil modelleriyle rekabet etme hedefiyle geliştirilen DeepSeek LLM takip etti.

Mayıs 2024'te piyasaya sürülen DeepSeek-V2, güçlü performansı ve uygun maliyetiyle dikkat çekiyordu. Bu başarı, ByteDance, Tencent, Baidu ve Alibaba gibi önde gelen Çinli teknoloji devlerini de yapay zeka modellerinin fiyatlarını düşürmeye yönlendirdi. Sonuç olarak DeepSeek şu anda dünyada en çok konuşulan yapay zeka uygulaması oldu.

Yapay zeka uygulaması DeepSeek. Fotoğraf: NYT

Kullanıcıdan ücret alınmıyor

DeepSeek'in ilgi çekmeyi başarmasının temel nedenlerinden biri kullanıcılar için ücretsiz olması. OpenAI o1 ve Claude Sonnet gibi diğer güçlü sistemler ücretli abonelik gerektiriyor. Google Gemini de ücretsiz erişime sunuluyor, ancak ücretsiz versiyonları yalnızca eski modellerle sınırlı. Öte yandan, DeepSeek şu an için herhangi bir kısıtlama içermiyor.

Yapay zeka uygulaması DeepSeek. Fotoğraf: AsiaTimes

ABD’ye rağmen üretildi

ABD’nin çip ihracatına yönelik kısıtlamalarına rağmen Çin merkezli DeepSeek, yapay zeka alanında önemli bir başarı elde etti. Şirket, teknolojik gelişiminde stratejik ortaklıklara büyük önem verdi. Bu kapsamda dikkat çeken iş birliklerinden biri, ABD’li çip üreticisi AMD ile gerçekleşti. Forbes’un haberine göre DeepSeek, özellikle DeepSeek-V3 modelinin geliştirilme sürecinde AMD’nin Instinct GPU’larını ve ROCM yazılımını etkin bir şekilde kullandı.

Daha az kaynakla daha fazla güç

DeepSeek’in başarısındaki kilit unsurlardan biri de, az kaynakla etkili sonuçlar elde etme konusundaki inovatif yaklaşımı oldu. ABD’nin çip kısıtlamaları nedeniyle şirket, daha akıllı ve enerji verimli algoritmalar geliştirmek zorunda kaldı. Örneğin, ChatGPT’nin eğitim verilerini işlemek için 10.000 Nvidia GPU’ya ihtiyaç duyulduğu bilinirken, DeepSeek mühendisleri yalnızca 2.000 GPU ile benzer sonuçlara ulaşmayı başardı.

Nvidia hisselerinin yüzde 17 oranında düşmesine sebep oldu

DeepSeek’in yeni modelini sunması Wall Street’te dengeleri altüst etti. Nvidia’nın hisseleri yüzde 17 oranında düşerek Ekim ayından bu yana en düşük seviyeye geriledi. Broadcom ve Micron Technology gibi diğer çip üreticileri de yüzde 10’un üzerinde değer kaybı yaşadı. S&P 500 teknoloji endeksi yüzde 5,6 düşerek son dört yılın en büyük günlük kaybını gördü. Pazartesi günü gerçekleşen bu büyük düşüş, toplamda yaklaşık 1 trilyon dolarlık piyasa değerinin silinmesine yol açtı.

DeepSeek, yapay zeka dünyasında sadece bir model olmanın ötesinde, eğitim süreçlerine getirdiği yeniliklerle geleceği şekillendiren bir teknoloji olarak öne çıkıyor. Gözetimli öğrenmeden pekiştirmeli öğrenmeye geçiş ve yenilikçi mimari çözümleriyle, sektörün gidişatını kökten değiştirme potansiyeline sahip.

Kaynak:

GDH Haber

GDH Digital NSosyal hesabını takip edebilirsiniz.

Takip Et