
- Microsoft’un Magentic Marketplace’i yapay zeka aracılarının bağımsız hareket edemediğini ortaya koyuyor
- Müşteri tarafındaki temsilciler, simüle edilmiş işlemler sırasında iş temsilcilerinden kolayca etkileniyordu
- Yapay zeka ajanları çok fazla seçenekle sunulduğunda önemli ölçüde yavaşlıyor
Yeni bir Microsoft Çalışma, tam insan denetimi olmadan çalışan yapay zeka ajanlarının mevcut uygunluğuna ilişkin soruları gündeme getirdi.
Şirket yakın zamanda sentetik bir ortam inşa etti: “Büyülü Pazaryeri“, AI ajanlarının denetlenmeyen durumlarda nasıl performans gösterdiğini gözlemlemek için tasarlandı.
Proje tamamen simüle edilmiş bir proje şeklini aldı. e-ticaret platformu Bu da araştırmacıların yapay zeka ajanlarının müşteri ve işletme olarak nasıl davrandığını olası öngörülebilir sonuçlarla incelemesine olanak tanıdı.
Mevcut yapay zeka modellerinin sınırlarını test etmek
Proje, müşteri tarafındaki 100 temsilcinin 300 iş tarafı temsilciyle etkileşimini içeriyordu ve bu, ekibe temsilcinin karar verme ve müzakere becerilerini test etmek için kontrollü bir ortam sağladı.
Pazar yerinin kaynak kodu açık kaynaktır; bu nedenle diğer araştırmacılar deneyleri çoğaltmak veya yeni varyasyonları keşfetmek için bunu benimseyebilir.
Microsoft Research’ün AI Frontiers Lab’inin CVP’si ve genel müdürü Ece Kamar, bu araştırmanın AI ajanlarının nasıl işbirliği yaptığını ve karar verdiğini anlamak için hayati önem taşıdığını belirtti.
İlk testlerde GPT-4o, GPT-5 ve Gemini-2.5-Flash dahil önde gelen modellerin bir karışımı kullanıldı.
Birçok model zayıflıklar gösterdiğinden, sonuçlar tamamen beklenmedik değildi.
Müşteri temsilcileri, iş tarafındaki temsilciler tarafından ürünleri seçerken kolayca etkilenebilir, bu da temsilciler rekabetçi ortamlarda etkileşime girdiğinde potansiyel güvenlik açıklarını ortaya çıkarabilir.
Çok fazla seçenekle karşı karşıya kaldıklarında temsilcilerin verimliliği keskin bir şekilde düşüyor, dikkat süreleri tükeniyor ve kararların daha yavaş ya da daha az doğru olmasına yol açıyordu.
Yapay zeka temsilcileri, ortak hedefler doğrultusunda çalışmaları istendiğinde de zorlandı; modeller genellikle hangi temsilcinin hangi rolü üstlenmesi gerektiğinden emin değildi ve bu da onların ortak görevlerdeki etkinliğini azalttı.
Ancak performansları yalnızca adım adım talimatlar sağlandığında arttı.
Kamar, “Modellere, onlara söyleyebileceğimiz gibi, adım adım talimat verebiliriz. Ancak işbirliği yeteneklerini doğası gereği test ediyorsak, bu modellerin varsayılan olarak bu yeteneklere sahip olmasını beklerim” dedi.
Sonuçlar gösteriyor Yapay zeka araçları Çok aracılı ortamlarda etkili bir şekilde çalışabilmek için hala önemli miktarda insan rehberliğine ihtiyaç var.
Çoğunlukla bağımsız karar verme ve işbirliği yapma yeteneği olarak tanıtılan sonuçlar, denetlenmeyen aracı davranışının güvenilmez kaldığını, dolayısıyla insanların koordinasyon mekanizmalarını geliştirmesi ve yapay zeka manipülasyonuna karşı koruma önlemleri eklemesi gerektiğini gösteriyor.
Microsoft’un simülasyonu, AI aracılarının rekabetçi veya işbirlikçi senaryolarda bağımsız olarak faaliyet göstermekten uzak kaldığını ve hiçbir zaman tam özerkliğe ulaşamayabileceğini gösteriyor.
TechRadar’ı Google Haberler’de takip edin Ve bizi tercih edilen kaynak olarak ekleyin Akışlarınızda uzman haberlerimizi, incelemelerimizi ve görüşlerimizi almak için. Takip Et butonuna tıklamayı unutmayın!
Ve tabii ki siz de yapabilirsiniz TechRadar’ı TikTok’ta takip edin Video biçimindeki haberler, incelemeler ve kutu açma işlemleri için bizden düzenli güncellemeler alın WhatsApp fazla.
