Alibaba’nın Akıllı Bilişim Enstitüsü’ndeki araştırmacılar, “EMO” adını verdikleri yeni bir yapay zeka sistemi geliştirdi. Bu sistem, “Emote Portrait Alive”ın kısaltması olan EMO, tek bir portre fotoğrafını canlandırarak kişinin konuştuğu veya şarkı söylediği oldukça gerçekçi videolar oluşturabiliyor.

Bu yeni sistem, araştırmacıların yıllardır üzerinde çalıştığı ses odaklı yüz videosu oluşturma alanında önemli bir ilerleme sağlıyor. EMO, sağlanan ses parçasının nüanslarına uygun akıcı ve etkileyici yüz hareketleri ve kafa pozları oluşturabiliyor.

Bu sistemin temelinde, difüzyon modeli adı verilen ve gerçekçi sentetik görüntüler oluşturmak için kullanılan bir yapay zeka tekniği bulunuyor. Araştırmacılar, modeli 250 saatten fazla konuşma, film, TV şovu ve şarkı performanslarından oluşan bir veri seti üzerinde eğitti. Bu sayede, EMO ses dalga biçimini doğrudan video karelerine dönüştürebiliyor ve böylece doğal konuşma ile ilişkilendirilen ince hareketleri ve kişisel özellikleri yakalayabiliyor.

EMO’nun sağladığı yenilikler arasında gerçekçi konuşma videoları ve etkileyici şarkı performansları bulunuyor. EMO, tek bir fotoğraf ve ses kaydı ile kullanılabiliyor ve kolayca uygulanabiliyor.

Bu teknolojinin potansiyel uygulama alanları arasında eğitim, eğlence, sosyal medya ve pazarlama bulunuyor. Ancak, bu tür teknolojilerin insanların rızası olmadan kullanılması veya yanlış bilgilerin yayılmasına neden olması gibi etik sorunlar da bulunuyor. Araştırmacılar, sentetik videoları tespit edecek yöntemler geliştirmek için çalışmalarını sürdürüyorlar.

EMO’nun ortaya çıkardığı etik sorunlar göz önüne alındığında, bu teknolojinin kullanımıyla ilgili tartışmalar devam ediyor. Ancak, yapay zeka ve video teknolojisinin birleşimiyle ortaya çıkan EMO’nun, birçok alanda kullanılabileceği ve toplumu etkileyeceği düşünülüyor.

Labai

Labai

Labai, Türkiye 'nin ilk yapay zeka haber sitesidir.

http://www.labai.com.tr

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir