Çok modlu labirentte ChatGPT, Gemini ve Claude'u test etme

Her yeni yapay zeka modeli, hayal edebileceğiniz her açıdan şimdiye kadarki en iyi yapay zeka modeli olduğu konusunda ısrar ediyor. Açıkçası bu doğru olamaz, ancak her birinin farklı görev ve rollerde ne kadar iyi performans gösterdiği her zaman açık değildir ve sözde tarafsız niceliksel testler bile ortalama kullanıcı için nasıl hissettiklerini doğru bir şekilde aktarmayabilir.

Belirli bir örnek, çok modlu şifre çözmedir; bir görüntüye bakmak ve içinde ne olduğunu ve ne anlama gelebileceğini çözmek. Bu, insanların anında ve içgüdüsel olarak yaptığı bir şeydir, ancak yapay zeka modelleri bu rolde daha yenidir. Kaotik bir görüntüyü doğru bir şekilde yorumlayacak bir yapay zeka modeli elde etmek, ilk başta düşündüğünüzden daha önemli olabilir. Bir yapay zeka modeli nesneleri tanımlayabiliyorsa, sigorta için eşyaları kataloglamanıza, evdeki tehlikeleri belirlemenize ve hatta bir toplu taşıma haritasının şifresini çözmenize yardımcı olabilir. Ayrıntıları icat etmeden karmaşık, katmanlı görsel bilgileri anlamlandırabilen bir yapay zeka modeli inanılmaz derecede faydalıdır.