Daha İyi Çalışan Bir Dünya İçin “Duygusal” Makineler

30 Kasım 2015

Peter Tu’nun geliştirdiği teknoloji sayesinde bir uçak, pilotların kokpitte ne zaman dikkatlerinin dağıldığını tespit edebilecek ve daha iyi kararlar vermeleri için onlara yardımcı olabilecek. Benzer bir şekilde, doktorlar hastalarına tanılarını açıklarken vücut dillerini ve iletişimlerini iyileştirme konusunda önemli ipuçları alabilecek.

Bu ve bunlar gibi pek çok konu, algoritmaların gücünden ve sürekli kayıtta olan kameralardan faydalanarak gerçek dünyayı analiz eden bilgisayar görüş çalışmaları sayesinde şu anda geliştirme aşamasında. Bilgisayar mühendisleri ve mühendisler, makinelere çevrelerinin farkına varabilmeleri için insan duyuları vermeyi hedefleyen çalışmalar yürütüyor.

Bu gibi, çıkarsama yeteneğine sahip bilgisayar çalışmaları, GE Küresel Araştırma’nın Bilgisayar Görüş Laboratuvarı dışında az yerde ticarileşmeye bu kadar yakın. Oxford eğitimli kıdemli bilim insanı Peter Tu da bu laboratuvarda çalışıyor.

Beynimizi ve vücudumuzu geliştiren bu gibi teknolojiler, Çığır Açan Buluşlar serisinin 11 Kasım’da National Geographic Channel’da yayınlanan ve ünlü oyuncu ve yapımcı Paul Giamatti’nin yönettiği “Bir İnsandan Fazlası” başlıklı bölümünde de konu edildi. GE ve National Geographic Channel tarafından hazırlanan ve bilimsel gelişme ve inovasyon konularına odaklanan 6 bölümlük Çığır Açan Buluşlar belgesel serisi ülkemizde de her çarşamba saat 22:00’da ekrana geliyor.

Peter Tu, “Yapmaya çalıştığımız şey, insanların bilgisayar modellerini, yani dijital ikizlerini yaratmak” diyor.

Geçtiğimiz birkaç senede bu teknoloji, sağlık çalışanlarının hastalarla temas ettikten sonra ellerini yıkayıp yıkamadığı ya da bir hastanın mimiklerinden acı çekip çekmediğini anlamak gibi basit görevleri yerine getirmekten, çok daha karmaşık ve özelleşmiş faaliyetleri gerçekleştirebilir hale geldi.  Tu, laboratuvardaki bilgisayara bağlı kameraların, yüz ifadeleri, beden dili, bir kişinin bakış yönü ve başka bir kişiye mesafesi gibi pek çok fiziksel özelliği tanıyabilir hale geldiğini söylüyor. Tu’nun ekibi daha sonra programlama yardımıyla bu fiziksel özellikleri, bir kişi veya grubun belirli bir anda nasıl hissettiğine dair genel bir fikre dönüştürüyor.  Gülümseme ya da somurtma gibi ifadelerin hepsi makinelerin “okuyabileceği”; insanlar arasındaki güven ya da düşmanlığın seviyesini, bir operatörün bir makineyi kullanırkenki kafa karışıklığını ya da bir satıcının potansiyel bir müşteriyle geliştirdiği ilişkinin mahiyetini tespit etmek için analiz edilebilecek verilerdir.  Tu, “Bizim yaptığımız şey, insanların duygusal durumunu ve bunun daha geniş sosyal bağlamını ölçümlemek için, etkileşim ve ifade biçimlerini veri olarak kullanan ve bu verilerden çıkarsamalar yapabilen makineler inşa etmek. Yapmaya çalıştığımız şey, insanların bilgisayar modellerini, yani dijital ikizlerini yaratmak ve ‘bir bireyin içsel durumu nedir ve etkileşimleri bunu nasıl ortaya çıkarır’ diye sormak” diyor.  Tu, bilgisayar görme sistemlerinin zamanla sağlık sektöründe doktorları, insanlarla nasıl daha iyi etkileşime geçecekleri konusunda eğitmek için, kalabalık kontrolü, kamu güvenliği, askeri uygulamalar gibi alanlarda ve endüstriyel sektörlerde kullanılabileceğini düşünüyor.

Tu’ya göre GE’nin geliştirdiği bu teknolojinin ilk ticari uygulaması, aşağı yukarı bir yıl içinde sistemin, kamusal alanları dolduran kalabalıkların artan kaygı düzeylerini ölçmeye hazır hale gelmesiyle gerçekleşecek. Tu, çıkarımsal görme teknolojilerinin gelecek iki ya da üç sene içinde ise, “makineli insan” olarak adlandırdığı çalışma alanlarında kullanılıyor olacağını söylüyor. Örneğin, öfke ya da bitkinlik belirtilerini tespit etmek için pilotların ve mühendislerin yüzleri sürekli incelenecek, ya da tıbbı görüntüleme teknisyenleri ve nükleer santral operatörleri gibi komplike sistemleri kullanan kişilerde kafa karışıklığı belirtilerinin belirlenmesi için kullanılacak.

“Aynı anda birden fazla iş yapan ve kötü bir duruma düşme potansiyeli olan bir pilot ya da makine operatörü için olabileceği gibi, durumları bir felakete dönüşmeden önce tespit etmek için bu teknolojinin yeteneklerine odaklanıyoruz” diyor Tu ve ekliyor, “Mesele sadece bir kişinin uykuya dalıp dalmadığını izlemek değil. Eğer kritik görevlerdeki insanların fazlaca iş yükü altında olduğu anı tespit edebilirsek birçok kazanın önüne geçebilir ve birçok hayatı kurtarabiliriz.”

Bilgisayar görme sistemleri aynı zamanda insanların birbirleriyle nasıl etkileşime girdiğini analiz edebilir. Bu teknolojiyle, gruplardaki insanlar arasındaki etkileşimin dinamiklerini anlamak için, beden dili, bakışlar, ses sinyalleri ve yakınlık ölçümleriyle tüm insan ifadeleri tam olarak tanımlanabilecek. Bu, karmaşık grup dinamiklerinin veri analiziyle derinlemesine tahlil edilmesini mümkün kılacak. İnsanlar takımlar içinde nasıl etkilişem kurar? Doktorlar hastalarıyla nasıl daha çabuk ilişki geliştirebilir? Çalışma mantığında gibi sorular yatan sistem, bir kişinin işini nasıl yaptığına dair sürekli ve gerçek zamanlı geri bildirim yapacak ve eğitim süreçlerine yardımcı olacak.

Tu’nun laboratuvarındaki sistem şu anda, hareketli ve zoom özelliği olan sekiz kameraya bağlı masaüstü bilgisayarlar ve renkli görüntülerle derinlik bilgisini aynı anda kaydedebilen üç adet özel kameradan oluşuyor. Bu veriler, bilgisayar görme algoritmalarının insan bedeninin yerleşimi ve hareketlerini sınıflandırması için yeterli.

Tu, çalışmalarının insanlığı, akıl ve duyguların ne demek olduğuna dair felsefik boyutları olan ilginç bir teknolojik maceraya çıkardığını söylüyor. Tu, bir kişinin davranışlarını doğru şekilde analiz ederek ve daha sonra bu bilgiyi kişinin gizli iç durumunu simüle eden bir dijital model yaratmak için kullanarak gelecekte çok daha yetenekli bilgisayar görme sistemleri geliştirileceğini; bu sistemlerin kişilerin henüz gerçekleştirmediği eylemleri tahmin etmesinin mümkün olabileceğini düşünüyor. Bu yeteneğin merkezinde bir insanın başka bir insanla olan her etkileşiminde yaptığı şeyler var.

Tu, ekibiyle birlikte yürüttüğü çalışmaların odağının, bilimkurgu filmlerindeki gibi, insanların mutlu, üzgün ya da kızgın olduğu anlarda onlarla empati kurabilen yapay zekalı robotlar geliştirmek olmadığını söylüyor. Buradaki amaç, daha iyi çalışan bir dünya yaratmaya katkı yapmak. Tu, “Eğer, insan davranışlarının duygulara nasıl ışık tuttuğunu anlamaları için makinelere empati yeteneği verebilirsek, makineler, kullanıcıların çok daha fazla ayırdında olabilirler ve onlara daha iyi bir deneyim yaşatabilirler” diyor.

Yorumlar

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir