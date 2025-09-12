Çinli e-ticaret ve teknoloji grubu Alibaba, yapay zeka modeli "Qwen3"ün çok daha ucuza eğitilen ve çok daha fazla performans gösteren açık kaynaklı versiyonunu piyasaya sürdüğünü duyurdu.

Alibaba'nın sahibi olduğu South China Morning Post gazetesinin haberine göre, şirketin bulut bilişim birimi Alibaba Cloud tarafından model, "Qwen3-Next" adı verilen mimariyle geliştirildi.

Yayımlanan "Hugging Face" platformundaki notta "Qwen3-Next-80B-A3B" adı verilen modelin, önceki versiyonu "Qwen3-32B"den 10 kat ucuza eğitildiği, buna karşın 10 kat daha güçlü işlem kabiliyetine sahip olduğu belirtildi.

Geliştirici ekibi, "GitHub" platformunda yayımladığı notta da yeni model mimarisinin performansını maksimize etmeye ve işlem maliyetini azaltmaya yönelik bir dizi yeniliğin sunulduğunu kaydetti.

Bu yeniliklerin arasında uzun metin girdilerini daha kolay işlemeyi sağlayan "hybrid attention" (melez dikkat) ve modeli, belirli alandaki girdileri ele alan ve ayrı alt ağlara bölen "high-sparsity mixture-of-experts" (uzmanların yüksek-seyreklikte karışımı) teknikleri yer alıyor.

Tüketici düzeyi donanımlarda etkin çalışabilecek şekilde optimize edilen 80 milyar parametreli model, sınırlı işlemci gücüyle sağladığı yüksek performansla yapay zekanın yaygın kullanımını daha etkin hale getirebilir.

Akıl yürütme modeli de yeni mimariyle güncellendi

Şirket, Qwen-3'ün akıl yürütme modelini de Next mimarisiyle güncelledi.

"Qwen3-Next-80B-A3B-Thinking" adı verilen model, bağımsız testlerde çok sayıda alanda önceki versiyonu "Qwen3-32B-Thinking"in yanı sıra Google'ın "Gemini-2.5-Flash-Thinking"den daha iyi performans gösterdi.

Qwen3'ün akıl yürütme modeli, daha önce yapılan testlerde ABD'li yapay zeka şirketi OpenAI'ın o1 ve Çinli yapay zeka şirketi DeepSeek'in R1 modellerini yakalayan veya aşan performanslar kaydetmişti.

Alibaba, 600 milyondan 235 milyara kadar parametreye sahip 8 gelişmiş yapay zeka modelinden oluşan Qwen3 ailesini nisan ayında piyasaya sürmüştü.

Şirket, bugüne kadarki en büyük modeli olan 1 trilyon parametreli "Qwen3-Max-Preview" modelini de 8 Eylül'de kullanıma açmıştı. Model, California Üniversitesinin yapay zeka değerlendirme platformu "LMArena" "metin çözümleme" alanında 6. sırada yer almıştı.

Bir yapay zeka modelinin parametre sayısındaki artış, modelin veri kapasitesini artırsa da verileri işlemek için gereken bilgisayar gücü ihtiyacı da arttığından maliyetleri de yükseltiyor.

Çin'de yapay zeka sektörü hızla gelişiyor

Bu yıl Çin'den çıkan iki şirketin açık kaynaklı modeller arasında üstünlük sağlaması, ülkede yapay zeka sektöründeki yoğun rekabeti ve hızlı gelişimi gösteriyor.

Çin'de High-Flyer Quant yatırım fonunun desteklediği DeepSeek, diğer yapay zeka şirketlerine kıyasla düşük maliyetle ve az sayıda çip kullanarak geliştirdiği açık kaynaklı yeni modeli R1'i 20 Ocak'ta piyasaya sürmüştü.

Dünya çapında kısa sürede yoğun şekilde kullanılmaya başlanan yapay zeka modeli, uygulama mağazalarında ABD merkezli ChatGPT'yi de geride bırakarak en fazla indirilen yapay zeka uygulaması olmuştu.

DeepSeek'in yapay zeka modelinin ABD'de büyük yatırımlarla geliştirilen muadillerinden çok daha düşük bütçeyle daha iyi performans sergilemesi, teknoloji dünyasında sarsıntıya yol açmış ve teknoloji hisselerinde satış baskısı oluşturmuştu.

Yapay zeka modelinin başarısı, ABD ile Sovyetler Birliği arasında uzay yarışını başlatan gelişme olarak görülen Sovyetler'in 1957'de Sputnik uydusunu fırlatmasına benzetilmişti. ABD ile Çin arasındaki rekabette yapay zeka alanında yarış başlatacak "Sputnik anı" olduğu yorumu yapılmıştı.