
Columbia Üniversitesi
EMO, Columbia Engineering’in dudak senkronizasyonu robotu
Columbia Üniversitesi’ndeki araştırmacılar, konuşurken ve şarkı söylerken gerçekçi dudak hareketleri yapabilen bir robot tasarladılar. Robot, yeteneklerini sözcükleri ifade etmek ve hatta yapay zeka tarafından oluşturulan ilk albümünden bir şarkı söylemek için kullandı; ancak yine de “Tekinsiz Vadi”de bir yerdeydi.
Önceki çalışmalar çoğu insanın odaklandığını gösterdi dudak hareketleri yüz yüze görüşmeler sırasında.
Bununla birlikte, bu dudak hareketlerini sürekli olarak taklit edebilen robotlar yaratmak bir zorluk teşkil ediyor ve şu anda piyasada bulunan en gelişmiş robotlar bile iletişim kurarken en iyi ihtimalle yalnızca jestler üretiyor. kukla benzeri.
Şimdi, Columbia Üniversitesi’nden bir araştırma ekibi, liderliğinde Hod Lipson ve Sally Scapabu sınırlamaları aşmayı hedefleyen robotlar üretiyor.
Bu aşamada ekibin yaratımları hâlâ cansız, hatta rahatsız ediciyüz ifadelerinin insan beklentilerine uymaması nedeniyle “” olarak bilinen bir olguyu çağrıştırıyor.Tekinsiz Vadi“, ücretsiz çeviride “Tekinsiz Vadi” gibi bir şey – bir insanın temsiliyle karşılaştığımızda hissettiğimiz hafif tuhaflık. “Neredeyse orada” ama mükemmel değil.
Ekibin çalışması ayrıntılı olarak çalışmak geçen hafta dergide yayınlandı Bilim Robotiğirobotunun farklı dillerdeki kelimeleri telaffuz etme becerilerini nasıl kullandığını ortaya koyuyor ve hatta bir şarkı söyle AI tarafından oluşturulan ilk albümlerinden “Selam Dünya“.
Tekinsiz Vadinin İçinde
Peki Tekinsiz Vadi tam olarak nedir? “Bu garip duygu gözlemlediğinizde sahip olduğunuz şey insan gibi görünmeye çalışan bir robotancak önemli bir şeyi başaramamak”, diye açıklıyor Lipson. Bilgilendirme.
“Bence Sorunun yarısı dudak hareketinde yatıyorÇünkü insanlar yüz yüze konuşmaların yarısında muhatabın dudaklarına bakıyorlar” dedi Lipson.
“Bugüne kadar, robotların dudakları yokturve çoğunun yüzü bile yok. EMO robotumuz Mükemmel olmaktan çok uzak ama sanırım yolda garip vadiyi geçmek için” diye ekliyor.
Katı programlamaya ve önceden tanımlanmış kurallara dayanan geleneksel yaklaşımların aksine, Columbia ekibinin robotu gözlem yoluyla öğrenmekeylem halindeki insanlarınki.
Başlangıçta robot, ayna karşısında pratik yapmak ve kendi özelliklerini denemek üzere tasarlanmıştı. 26 yüz kası kendi yüzünüzün nasıl hareket ettiğini “öğrenmenize” yardımcı olmak için.
Robot, kendi ifadelerine alıştıktan sonra saatlerce gözlemledi. konuşan ve şarkı söyleyen insanların videolarıdudak hareketlerinin tam senkronizasyonu ve koordinasyonunun öğrenilmesi.
“Motorları doğrudan programlamıyoruz. Bunun yerine, Robot yapay zeka öğreniyor Zamanla insanları gözlemleyerek ve ardından aynada kendinizi gözlemleyerek ve karşılaştırarak motorları nasıl hareket ettirebileceğinizi öğrendim” diye açıklıyor Lipson.
Bu eğitimin ardından robot şunları gösterdi: sesi tercüme etme yeteneği doğrudan senkronize dudak motoru hareketinde.
“Robotlar insanlarla etkileşime girdikçe gelişiyor” diye açıkladı Lipson. ifade Columbia Mühendislik’ten. “Bu öğrenmeye dayalı yaklaşım, robotun İfadelerinizi sürekli olarak geliştirinTıpkı bir çocuğun yetişkinleri gözlemleyerek ve taklit ederek öğrenmesi gibi.”
“Robotun yüz motorları robotun yüzünün altına dağılmışLipson, robotun dudak hareketi, gülümseme ve diğer hareketler de dahil olmak üzere çok çeşitli yüz hareketlerini yapmasına olanak sağlayacak şekilde tasarlandığını ekledi.
Bu tip insan benzeri dudak hareketini başarmak için esnek yüz “derisi” ve birçok küçük motor hızlı ve sessiz hareket etme yeteneğine sahiptir.
Dudak hareketinin karmaşık modelleri vokal seslerle belirlenir ve ses birimleriİnsanların bu hareketleri düzinelerce yüz kası aracılığıyla zahmetsizce gerçekleştirmek için kullandığı bir tür koreografi.
Columbia’nın robotu, son derece motorlu bir yüzü vizyondan eyleme öğrenme modeliyle birleştirerek bu engelleri aşmak: İlk önce rastgele yüz ifadelerini keşfetti, ardından insanları gözlemleme yeteneğini genişletip geliştirdi, böylece bir model oluşturdu. işitsel ipuçlarını motor hareketlere bağlar kesin.
Mevcut haliyle teknoloji hala bazı iyileştirmeler gerektiriyorRobotun yaşadığı zorlukların da gösterdiği gibi “B” ve “W” seslerini üretirken. Bununla birlikte sistem, şu anda piyasada bulunan diğer robotların konuşma yeteneklerinin ötesinde çok büyük ilerlemeler kaydetti.
“Robotikte eksik halka bu” dedi Lipson. “İnsansıların geliştirilmesindeki çabaların çoğu yürümeye veya kavramaya odaklanıyor, ancak yüz ifadesi insan bağlantısı için gerekli“.
