
- OpenAI’nin o3 modeli, dokuz AI sohbet robotunun katıldığı beş günlük bir poker turnuvasını kazandı
- En tutarlı oyunu oynayarak kazanılan o3 modeli
- En iyi dil modellerinin çoğu pokeri iyi idare ediyordu ancak blöf, pozisyon ve temel matematik konularında zorluk çekiyordu
Keçede bugüne kadar görülmemiş bir dijital hesaplaşmada, dünyanın en güçlü büyük dil modellerinden dokuzu yüksek bahisli bir poker maçında beş gün geçirdi.
OpenAI’nin o3’ü, Anthropic’in Claude Sonnet 4.5’i, X.ai’nin Grok’u, GoogleGemini 2.5 Pro, Meta’dan Llama 4, DeepSeek R1, Moonshot AI’dan Kimi K2, Mistral AI’dan Magistral ve Z.AI’den GLM 4.6, her biri 100.000 $’lık hazır parayla 10$ ve 20$’lık masalarda binlerce el sınırsız Texas Hold’em oynadı.
OpenAI’nin o3 modeli, bir hafta süren poker oyunundan 36.691 $ daha zengin bir şekilde ayrıldığında, ortada kupa yoktu, sadece övünme hakkı vardı.
Deneysel PokerBattle.ai tamamen yapay zeka tarafından çalıştırıldı ve her oyuncuya aynı ilk komut verildi. Eğer strateji, kazanmayı, kaybetmeyi ya da yedi-ikiliyle iflas etmenin ne kadar aşağılayıcı olduğunu gerçekten anlamayan makineler tarafından alınan binlerce mikro karar dediğiniz şeyse, bu saf stratejiydi.
Bir teknoloji gösterisi için alışılmadık derecede anlamlıydı. En iyi performansı gösteren yapay zekalar sadece blöf yapmak ve bahis oynamakla kalmıyor; uyum sağlıyor, rakiplerini modelliyor ve belirsizlikle nasıl başa çıkacaklarını gerçek zamanlı olarak öğreniyorlardı. Kusursuz poker oynamasalar da, deneyimli oyuncuların muhakeme çağrılarını taklit etmeye etkileyici derecede yaklaştılar.
OpenAI’nin o3’ü hızlı bir şekilde en istikrarlı ele sahip olduğunu gösterdi, en büyük beş pottan üçünü devirdi ve flop öncesi ders kitabı teorisine yakın kaldı. Anthropic’ten Claude ve X.com’dan Grok sırasıyla 33.641 $ ve 28.796 $’lık önemli kârlarla ilk üçü tamamladı.
Bu sırada Lama tüm destesini kaybetti ve erkenden alevlendi. Grubun geri kalanı arada bir yere indi; Google’ın Gemini’si mütevazı bir kâr elde etti ve Moonshot’ın Kimi K2’si 86.030 dolarlık bir kapanışa kadar kanamaya başladı.
Kumar Yapay Zekası
Poker uzun zamandır genel amaçlı yapay zekayı test etmek için en iyi analoglardan biri olmuştur. Mükemmel bilgiye dayanan satranç veya Go’nun aksine poker, oyuncuların belirsizlik altında akıl yürütmesini gerektirir. Bu, iş görüşmelerinden askeri stratejiye kadar her şeyde gerçek dünyadaki karar alma sürecinin bir aynasıdır ve görünüşe göre, sohbet robotu gelişim.
Turnuvadan elde edilen tutarlı bir sonuç, botların genellikle çok agresif olduğuydu. Pas geçmenin daha akıllıca olacağı durumlarda bile en çok tercih edilen aksiyon ağırlıklı stratejiler. Büyük potları kaybetmemek yerine daha çok kazanmaya çalıştılar. Ve blöf yapma konusunda çok kötüydüler, denemedikleri için değil, blöfleri çoğunlukla yanlış okunan ellerden kaynaklandığı için, zekice bir aldatmacadan değil.
Yine de yapay zeka araçları, yüzey seviyesindeki akıllılığın çok ötesine geçen şekillerde daha akıllı hale geliyor. Sadece okuduklarını tekrar etmiyorlar; Baskı altında olasılıksal yargılarda bulunuyorlar ve odayı okumayı öğreniyorlar. Bu aynı zamanda güçlü modellerin bile hâlâ kusurları olduğunu hatırlatıyor. Durumları yanlış okumak, sallantılı sonuçlara varmak ve kendi “pozisyonunu” unutmak sadece bir poker problemi değildir.
Gerçek bir poker odasında asla bir dil modelinin karşısına oturmayabilirsiniz, ancak büyük ihtimalle önemli kararlar vermeye çalışan biriyle etkileşime gireceksiniz. Bu oyun bunun nasıl görünebileceğine dair sadece bir bakıştı.
TechRadar’ı Google Haberler’de takip edin Ve bizi tercih edilen kaynak olarak ekleyin Akışlarınızda uzman haberlerimizi, incelemelerimizi ve görüşlerimizi almak için. Takip Et butonuna tıklamayı unutmayın!
Ve tabii ki siz de yapabilirsiniz TechRadar’ı TikTok’ta takip edin haberler, incelemeler ve video biçimindeki kutu açma işlemleri için bizden düzenli olarak güncellemeler alın WhatsApp fazla.
Her bütçeye uygun en iyi iş dizüstü bilgisayarları
