DeepSeek geçen haftaya kadar neredeyse kimsenin konuşmadığı Çinli bir yapay zeka startup’ıydı. Ancak şirketin piyasaya sürdüğü ileri teknoloji yapay zeka modeli R1, Silikon Vadisi’ni şoka uğrattı. Sebebiyse çok daha az çiple OpenAI ve Google gibi şirketlerin geliştirdiği yapay zeka modellerine eşdeğer bir sonucun ortaya çıkmasıydı.

Şirketin geliştirdiği R1 ve V3 modellerinin her ikisi de Kaliforniya Üniversitesi’ndek araştırmacıların sohbet robotlarını puanladığı Chatbot Arena platformunda ilk 10’a girmeyi başardı. Hatta DeepSeek’in modelleri, ABD merkezli Anthropic’in Claude’u ile milyarder girişimci Elon Musk’ın xAI’ını geçmeyi başardı.

Kompleks problemleri çözebilecek kabiliyetteki bu yeni model öyle çok dikkat çekti ki şu anda DeepSeek, ABD’de iPhone telefonlarda en çok indirilen uygulamaların başında geliyor.

İKİ BİN ÇİPLE TASARLANMIŞ

DeepSeek teknik raporunda V3 modelini geliştirmek için iki binden fazla Nvidia çipi kullandığını söyledi. Aynı boyuttaki diğer modelleri eğitmek için binlerce çip kullanılması gerekiyor.

Aradaki bu fark nedeniyle ABD’li bazı yapay zeka uzmanları, High Flyer ve DeepSeek’in duyurduğundan öte bilişim gücüne sahip olup olmadığını sorguladı.

YATIRIMCILARI BU KADAR ENDİŞELENDİREN NE?

Yapay zekaya geleneksel bakış en iyi yapay zeka modellerini geliştirmek için pahalı, en ileri teknoloji çiplerin kullanılması gerektiğiydi. Google’ın çatı şirketi Alphabet ile Meta’nın yaptığı aşırı harcamalar bu nedenle makul görülüyordu.

Oysa DeepSeek’in böyle bir finansal gücü yok. Dolayısıyla şirket kendi modellerini daha az gelişmiş çipleri yenilikçi tekniklerle harmanlayarak geliştiriyor. Buna rağmen ABD’li rakipleriyle yarışabilecek güçte model geliştirmeyi başardı.

Aslında uzmanlar DeepSeek’in hala OpenAI ve Google’ın gerisinde olduğunu söylüyor. Ancak aradaki bu uçurum kapatılmayacak gibi değil. Ayrıca DeepSeek’in çok daha az sayıda çiple (ABD’deki rakiplerinin kullandıklarının çok daha az gelişmiş versiyonu olduğunu unutmamak gerekiyor) bunu başardığının altını çizelim.

Ayrıca DeepSeek’in son modeli, ChatGPT’nin aksine ücretsiz.

DEEPSEEK’İN ARKASINDA KİM VAR?

Çinli risk fonu yöneticisi Liang Wenfeng. DeepSeek, Liang’ın sekiz milyar dolarlık risk fonu şirketi High-Flyer’ın yapay zeka araştırma biriminden doğdu.

1985’te doğan Liang, Çin’in güneydoğusundaki Guangdong’a büyüdü. Çin’in prestijli üniversitelerinden biri olan Zhejiang’da eğitim gören Liang, kendini yapay görü alanında geliştirdi.

“Tüccar”dan ziyade “mühendis” olarak görülmeyi tercih ettiğini söyleyen Liang’ın High Flyer şirketi, Çin’de bilgisayarlı ticarete derin öğrenmeyi entegre etmekte öncü oldu.

ABD’NİN KISITLAMALARI ZORLADI

Aslında DeepSeek’in azla yetinmek zorunda kalmasının nedeni ABD’nin Çin’e uyguladığı yaptırımlar. İki ülke arasında uzun zamandır devam eden bir çip savaşı var. Bu savaşta ABD, Çin’in yapay zekayı askeri amaçlarla geliştirdiğini iddia ederek söz konusu ülkeye çip ihracatına ağır kısıtlamalar getirdi.

DeepSeek son modellerinden birini geliştirmenin kendilerine maliyetinin 5,6 milyon dolar olduğunu söylüyor. Bir kıyas yapmak gerekirse Anthropic’in CEO’su Dario Amodei geçen yıl bir yapay zeka modelini geliştirmenin maliyetinin 100 milyon ile bir milyar dolar arasında değiştiğini söylemişti.

PİYASALARI ALTÜST ETTİ

DeepSeek’in bu başarısı, ABD’li teknoloji devlerinin yapay zeka altyapısı için bu kadar büyük harcamalara gerek olup olmadığını sorgulamalarına neden oldu. Öyle ki bu endişe, özellikle çip hisselerinde satış dalgasına yol açtı.

Nasdaq-100 endeksine bağlı vadeli işlemler yaklaşık yüzde üç düşerken çip şirketi Nvidia’nın hisseleri yüzde 10 değer kaybetti.

HİÇ Mİ EKSİSİ YOK?

DeepSeek’in geliştirdiği ve aralık ayında yayınladığı modellerden V3, Çin ve Devlet Başkanı Şi Cinping hakkındaki hassas siyasi sorulara cevap vermiyor. Hatta V3 kullanıcılarına göre bazı durumlarda muhaliflerin perspektifini tamamen dışarıda bırakarak Beijing’in propaganda dilini kullanabiliyor.

Ancak ChatGPT’nin de hassas sorulara apolitik cevaplar verdiğini unutmamak gerekiyor.