Global Soul Limited liyi@gs-smt.com 86-755-27962186
Bu yılın Ocak ayında, yapay zeka girişimi DeepSeek, yeni modeli R1 aracılığıyla iki çığır açtı ve yapay zeka ekonomisini sessizce yeniden tanımladı. Bu model, önceki modelin maliyetinin 1/40'ında en iyi performansı elde ediyor. Aralık 2024 itibarıyla, DeepSeek'in V3 büyük dil modeli, eğitim maliyetlerini %90'dan fazla azalttı.
DeepSeek'in iki çığır açan gelişmesi geniş çapta ilgi gördü: İlk olarak, DeepSeek, yapay zeka modellerinden muhakeme süreçlerini ayrıntılı olarak açıklamalarını istemenin (zincirleme düşünme istemi olarak bilinen bir araştırma yaklaşımı) doğruluğu ve verimliliği artırdığını ortaya koydu. İkinci olarak, DeepSeek, verilerin manuel olarak etiketlenmesinden tamamen bağımsız olarak, kendi veri kümelerini oluşturmak için yapay zeka kullanıyor. DeepSeek'in iddia ettiği kadar ucuz olmadığına dair tartışmalar olsa da, bu atılımlar kesinlikle yeni bir yapay zeka ekonomisi çağı başlattı.
Yapay zekanın maliyet yapısı dramatik bir şekilde değişiyor. Performans artışının her bir doları, girişimler, kurumsal uygulamalar ve altyapı yatırımları üzerinde derin bir etki yarattı. Bu değişim, pazar güçlerini alt üst edebilir, sonuçta çevik girişimlerin kısa vadede teknoloji devlerini yakalamasına yardımcı olurken, kar marjlarını artırıyor.
Teknoloji devleri, yapay zeka altyapısı geliştirmeye şimdiden 100 milyar dolardan fazla yatırım yaptı ve bu artmaya devam ediyor. Şimdi bu devasa yatırımlardan nasıl getiri elde edeceklerini ve daha çevik, daha küçük pazar rakiplerine karşı avantajlarını nasıl koruyacaklarını düşünmeleri gerekiyor. Hızla değişen bir ortamda, hem teknoloji devleri hem de girişimler için açık bir sinyal var: teknolojik ilerlemenin fırsatını hızla değerlendirin veya ortadan kaldırılın.
DeepSeek'in yükselişinden önce, girişimler, her çeyrekte milyarlarca doları devasa veri merkezleri inşa etmeye yatıran ve yapay zeka teknolojisindeki gelişmelerden büyük avantajlar elde eden teknoloji devlerinin altyapı harcamalarıyla rekabet etmekte zorlanıyordu. Bu devler sadece devasa veri kaynaklarına sahip olmakla kalmıyor, aynı zamanda çok sayıda doktoralı yeteneği de topluyor ve algoritmaların ilerlemesi de güçlü teknik güçlerine bağlı. Ek olarak, uzun süredir yerleşik dağıtım ağları, ürünlerini mevcut müşterilere hızla ulaştırmalarını ve geri bildirim döngüleri aracılığıyla teknolojik ilerlemeyi hızlandırmalarını sağlıyor.
Ancak, günümüzde girişimler teknoloji devleriyle rekabet edebilecek kadar büyüdü. Sadece 2025 yılına kadar, model eğitim maliyetleri %95 düşecek ve bu da teknoloji devlerinin altyapı avantajını önemli ölçüde azaltacak. Muhakeme maliyetleri son üç yılda neredeyse bin kat düştü ve gelecekte daha da düşmesi bekleniyor. Algoritmik avantajın süresi 45 ila 100 güne düşürüldü ve azalmaya devam edebilir.
Eğitim maliyetleri artık önemli bir darboğaz olmadığında, çıkarım performansı (yani, yapay zeka modellerinin gerçek zamanlı uygulamalarda ne kadar iyi performans gösterdiği) yeni bir odak noktası haline geliyor. Yeni bir aşamaya giriyoruz: daha küçük, daha ucuz modeller, daha büyük modellere kıyaslanabilir güç sunuyor ve daha düşük performanslı GPU'larda çalışabiliyor, eski GPU'ların ömrünü uzatıyor. Daha akıllı yapay zeka ürünleri çok düşük bir maliyetle sunulabilirse, o zaman girişimlerin nihayet teknoloji devlerinden daha iyi performans gösterme ve karı artırma şansı var.
Verimli iş gücü tahsisi, meydan okuyucunun avantajını daha da güçlendiriyor. Artık rekabetçi bir yapay zeka ekibi oluşturmak için çok sayıda doktora düzeyinde yetenek istihdam etmeye gerek kalmadan, girişimler modelleri teknoloji devlerinden çok daha düşük bir maliyetle geliştirebilir, optimize edebilir ve dağıtabilir. Ve, büyük ölçüde uygulama düzeyine odaklandıkları için, meydan okuyucular, bulut girişimlerinin birim ekonomilerini iyileştirerek 15 yıl önce elde ettiği avantajla aynı şekilde daha yüksek kar marjlarından yararlanabiliyor.
Bu eğilim sadece girişimler için iyi değil. Aynı zamanda Nvidia gibi şirketleri daha büyük bir risk altına sokuyor. DeepSeek'in duyurusunun ardından, Nvidia'nın hisse senedi fiyatı %12 düştü, ancak o zamandan beri toparlandı. Çip üreticileri için riskler artıyor çünkü talep, eğitim odaklı donanımdan daha verimli çıkarım çözümlerine kayıyor. Tüketici sınıfı sinirsel işlem birimlerinin (Npu'lar) yükselişi, bu değişimi hızlandırabilir ve yapay zeka modellerinin akıllı telefonlar ve dizüstü bilgisayarlar gibi cihazlarda yerel olarak çalışmasını sağlayabilir.
Meydan okuyucular için iyi olan, teknoloji devleri için kötüdür. Yapay zeka devleri, DeepSeek'in hakimiyetini neredeyse içgüdüsel olarak ulusal güvenlik sonuçlarına bağlayarak, benzer teknolojiler geliştirmeleri için destek toplamaya çalışıyor ve Stanford Üniversitesi de dahil olmak üzere ABD'li araştırmacıların DeepSeek'in teknolojisini kopyalayabildiği ve hatta aşabildiği gerçeğini görmezden geliyor. Geleceğe baktığımızda, veri altyapısı projelerine büyük meblağlar yatıran şirketler şunu sorabilir: Yapay zeka modeli araştırması ve geliştirmesine yapılan devasa harcamalar boşa mı gitti? Ucuz teknoloji pahalı teknoloji kadar iyi çalışıyorsa, neden bu kadar çok para harcansın?
Tarihi eğilimler, çoğu yapay zeka ilerlemesinin aslında ölçekte aşırı sermaye yatırımlarına dayandığını gösteriyor. Transformer mimarisi, o zamanlar algoritmik olarak optimal olarak kabul edilenden fazlasını aşırı eğitim nedeniyle başarılı oldu. Yeni teknolojik gelişmeler, aynı performansı daha düşük bir maliyetle elde edebileceğimizi kanıtlıyor. DeepSeek gibi verimli çözümler verimliliği önemli ölçüde artırmış olsa da, hiper ölçekli bulut sağlayıcılarının genişlemesi hala daha büyük veri merkezleri gerektiriyor ve şişen çıkarım maliyetlerine katlanmak zorunda.
Ancak, teknoloji devleri boş durmuyor. Google'ın Gemini modeli, Microsoft'un Azure AI Foundry ve Meta'nın açık kaynak LLaMA'sı gibi DeepSeek'in başarıları için bir silahlanma yarışı görüyoruz. Açık kaynak modelleri önemli bir rol oynayabilir. Meta CEO'su Mark Zuckerberg, kişiselleştirilmiş yapay zekanın (yani, bireysel kullanıcıların ihtiyaçlarına, kültürüne ve tercihlerine göre uyarlanmış modeller) önemini vurguladı. Bu vizyon, yapay zeka gelişiminde daha geniş bir eğilimle uyumlu: büyük bir bulut altyapısına ihtiyaç duymadan yüksek performans sağlayabilen daha küçük, daha özel modeller.
Aynı zamanda, açık kaynak ve kapalı kaynak devleri farklı hedeflere sahip ve bu da meydan okuyucunun avantajını daha da artırıyor. Meta gibi şirketler tarafından oluşturulan açık kaynak modelleri rekabet etmeye ve ekosistem genelinde maliyetleri düşürmeye devam ederken, kapalı kaynak modelleri daha iyi teknoloji aracılığıyla daha yüksek ücretler talep etmeye çalışıyor. Girişimler, her kullanım için en iyi fiyat/performans oranını elde etmek ve kar marjlarını artırmak için iki kamp arasındaki rekabetten yararlanabilir.
İşletmenin büyüklüğü ne olursa olsun, mesaj açık: Pazar dinamikleri, işlem gücü ve yetenek gibi kendilerine sunulan belirli avantajlardan hızla yararlanın veya başarısızlıkla yüzleşin. Teknolojik ilerleme döngüsü kısalıyor, yeni performans standartları belirlemek için gereken aylar, hatta yıllardan, DeepSeek'in teknolojik atılımının artık sadece 41 gün sürebileceğini göstermesine kadar. İnovasyon benzeri görülmemiş bir hızla ilerliyor ve hata tolerans alanı hızla daralıyor.