
Nasıl derler bilirsiniz, “Bu bir yarışma değil!” Sana yalan söylemelerine izin verme; her şey bir rekabet, özellikle de konu yapay zeka olduğunda. Birden fazla sohbet robotu arasında yapay zeka yeteneklerini test etmediğim bir gün nadiren oluyor ve sonuçlara neredeyse her zaman şaşırıyorum. Bazı platformlar, en azından bazı görevler açısından gerçekten diğerlerinden daha iyidir.
Bu yolculuk Notlarımla başladı iPhone 17 Pro Max. Genellikle röportajları Android akıllı telefona kaydetmeyi severim. Google Pixel 10 Pro Katlama, Harika Kaydedici uygulamasının her ifadeyi ustalıkla yakaladığı ve transkripsiyonda her konuşmacıyı ayırma ve etiketleme konusunda ustaca bir iş çıkardığı yer.
Gemini 3 Pro eldivenlerini takıyor
Son aylarda ben Google Gemini’nin yeteneklerinden etkilendimözellikle de en yeni 3 Pro modelleri ve hemen hemen her türlü hızlı isteği özgüvenle karşılıyor gibi görünüyor.
Artık fikrim olduğuna göre Gemini’nin kaydı dinlemesini nasıl sağlayacağımı bulmam gerekiyordu. Sesi iPhone hoparlörlerimde çalmak ve Gemini’den dinlemesini istemek, örneğin masaüstü mikrofonlarımın iPhone hoparlörlerinden çıkan sesi ne kadar iyi algılayabileceğinden endişelendiğim için sona erdi. Ayrıca ofisteydim ve insanların özel konuşmaya kulak misafiri olmasını istemiyordum (bir hikaye yayınlayana kadar).
Öncelikle ses dosyasını Notes’tan indirebileceğinizi öğrendim. Oynatma sırasında, üç noktanın altında ses dosyasını Airdrop’uma aktarmamı sağlayan bir Paylaş düğmesi var 14 inç MacBook Pro. MPEG-4 (M4A) dosyası olarak gelir.
Geri dön İkizler 3 Probilgi istemi alanında “+” işaretini seçtim, M4A ses dosyasını seçtim ve şu kısa istemi ekledim: “Bunu dinleyin, yazıya dökün ve farklı konuşmacıları tanımladığınızdan emin olun.”
İleri geri yoktu. Germini 3 Pro, “Görüşmeci” olarak tanımlanan konuşmacıların ve konumun adının ve başlığının yer aldığı tam transkripti hızla yayınlamaya başladı. Gemini 3 Pro’nun açıklanamaz bir şekilde tamamen yanlış anladığı tek şeyin bu olduğunu burada belirtmekte fayda var. Konuğum sohbetin sonunda adını söylese de Gemini farklı bir isim seçti. Bunun dışında Gemini, konuşanın ben veya konu olduğunu mükemmel bir şekilde tanımladı. Ve doğruluk gerçekten etkileyiciydi.
Konunun eksiksiz olması adına Gemini 3 Pro’dan konunun tanımlanmasını düzeltmesini ve beni “görüşmeci” olarak listelemesini istedim. Bunu düzelttikten sonra, hikayemin tamamını yönlendirmeye yardımcı olması için transkripti memnuniyetle kullandım.
Bu köşede ChatGPT
Doğal olarak ChatGPT 5.1’in (Plus hesabıyla) aynı görevi yerine getirip getiremeyeceğini merak ediyordum.
ChatGPT istem penceresinde ses dosyasını seçtim ve aynı istemi girdim. ChatGPT bana şunları söyledi: “Kesinlikle sesi yazıya dökebilirim, ancak .m4a dosyasına doğrudan referans verdiğiniz konumdan erişemiyorum veya dosyayı oynatamıyorum.”
Bunu, ChatGPT’nin bana dosyayı yüklemem için zip dosyasına dönüştürmek de dahil olmak üzere farklı yollar önermeye devam ettiği kapsamlı bir ileri geri gidiş izledi. Ne yaparsam yapayım, ChatGPT ses dosyasını istem penceresinde gösteriyordu ama dinleyemiyordu.
Görünüşe göre bu küçük yarışmada Gemini 3 Pro, sinir bozucu bir sorunu kolay bir galibiyete dönüştürerek galip geliyor. Ne kadar işe yaramaz olduğu hakkında ne kadar az şey söylenirse ElmaNotes’un transkripsiyonu ne kadar iyi olursa o kadar iyidir.
Her bütçeye uygun en iyi iş dizüstü bilgisayarları
TechRadar’ı Google Haberler’de takip edin Ve bizi tercih edilen kaynak olarak ekleyin Akışlarınızda uzman haberlerimizi, incelemelerimizi ve görüşlerimizi almak için. Takip Et butonuna tıklamayı unutmayın!
Ve tabii ki siz de yapabilirsiniz TechRadar’ı TikTok’ta takip edin haberler, incelemeler ve video biçimindeki kutu açma işlemleri için bizden düzenli olarak güncellemeler alın WhatsApp fazla.
