Popüler podcast yayıncısı Joe Rogan yakın tarihli bir podcast bölümünde, OpenAI kurucusu Sam Altman’a toplumun sahte yapay zeka (AI) içeriği konusunda endişelenmesi gerekip gerekmediğini sordu: “Neyin gerçek neyin gerçek olmadığını nasıl anlayacağız?”
Bu, bölüm için özellikle uygun bir soruydu, çünkü bir saatlik konuşmanın tamamı yapay zeka tarafından oluşturulmuştu.
Kime sorduğunuza bağlı olarak, AI ya her yaratıcı endüstri için varoluşsal bir tehdit, insan uygarlığını ilerletecek çığır açan bir teknoloji ya da nihayetinde gerçek anlaşmanın soluk bir taklidi olan eğlenceli, aptal bir oyuncak. Her bölümde Rogan ile yeni bir konuk arasındaki hayali konuşmaları anlatan, yapay zeka tarafından oluşturulmuş bir tür hayran kurgusu YouTube podcast’i olan The Joe Rogan AI Experience’ın yaratıcısı, üçüne de inanıyor. Ya da en azından, Hot Pod’un bu ayın başlarında onunla yaptığı yaklaşık bir saat süren bir tartışma sırasında üçünü de gündeme getirdi.
Kimliğini korumak için yalnızca ilk adını kullanmamızı isteyen Hugo, Avustralya’nın Sidney kentindeki bir VFX stüdyosu ve reklam ajansında kreatif direktör olarak çalışıyor. Hugo, YouTube podcast’inin yalnızca eğlence amaçlı olduğunu ve gerçek Rogan’a veya gerçek etten kemikten podcast yayıncılarına gerçek bir tehdit oluşturma amacı taşımadığını söylüyor.
Joe Rogan AI’nın AI klonu, podcast’in ilk bölümünde “Bu tamamen kurgu – sadece eğlence için – bu yüzden küçük TikTok’larınızı yaparak dünyayı asla söylemediğim şeyleri söylediğime inandırmayın” diye uyarıyor. Hugo bu bölümü bir ay önce yayınlandı. İçinde, sahte Rogan ve eşit derecede sahte Altman, ChatGPT komut dosyasıyla yazılmış bir görüşme yapıyor. Ortaya çıkan podcast yeterince ürkütücüydü ki Rogan bunu kendisi de yorum yaptı.
Gerçek olan Rogan bir tweet’te “Bu çok kaygan olacak çocuklar” diye yazdı.
The Joe Rogan AI Experience fikri, Hugo’ya Şubat ayında, ChatGPT etrafındaki sosyal medya tartışmalarının en yoğun yaşandığı sırada geldi. Geçen yıl boyunca AI gelişmelerini düzenli olarak takip ediyordu ve aklına bu fikir geldiğinde “ses klonlama hakkında birkaç YouTube videosu” izlemişti.
“ChatGPT ile eksiksiz bir The Joe Rogan Experience podcast’i oluşturmaya çalışırsam ve ardından bu ses klonlama platformlarından birini kullanmayı başarırsam ne olur?” düşündü.
Google’da biraz arama yaptıktan sonra, Joe Rogan’ın sesinin demo örneklerini içeren bir dizi AI ses yazılımı şirketi buldu. Ne yazık ki, birçoğu o kadar iyi değildi veya halkın kullanımına açık değildi. Sonunda, birkaç haftalık aramanın ardından Hugo, ses parçacıklarına dayalı olarak herhangi bir sesi klonlayabilen bir metin okuma platformu buldu. Bu platformu, Rogan’ın ve podcast’teki Donald Trump ve Andrew Tate’in de dahil olduğu diğer konukların sesi için kullandı.
Yapay zekanın destekçileri, üretmenin insan yapımı işten daha hızlı ve daha ucuz olacağını söylüyor. Ancak ChatGPT’de kullanılabilir bir komut dosyası çalıştırma, bunu bir metin okuma programına atma ve sesi düzenleme işi saatlerce insan işi gerektiriyor.
Hugo bir e-postada “İlk bölüm bir haftamı aldı, ikincisi bir buçuk günümü aldı ve sonuncusu üç haftadan fazla sürdü. Birçok farklı yöne çok bağlı ama asıl önemli olan bölüm hakkındaki kendi eleştirel görüşüm. Benim gözümde yeterince iyi değilse, onu düzeltmek için çok zaman harcarım” dedi.
Hugo, örnek ses toplamak ve yapay zeka tarafından oluşturulan seslerini mükemmelleştirmek için uzun zaman harcadı. Rogan’ın ilk ses klonunu oluşturmak kolay olsa da, Hugo sonraki bölümlerde klonu mükemmelleştirmek için saatler harcadı. O zaman bile, hoparlörlerinin robotik veya yapay zeka benzeri ses çıkardığı anlar oldu. Normal bir insan konuşması gibi görünen bir şey yaratmak için senaryoyu düzenlemek de iş gerektiriyordu.
Hugo, “ChatGPT, birinin konuşma kalıplarını kopyalama konusunda gerçekten o kadar da fantastik değil, gerçekten” dedi.
Rogan gibi biri internette sayısız saatlik ses kaydına sahip olsa da ChatGPT yalnızca yazılı bilgilerle eğitim yapıyor. Hugo’ya göre röportajların transkriptlerini beslemek bile kusursuz değil.
Hugo, “İki insan arasındaki bir sohbeti gerçekten dinlediğinizde, birbirleri hakkında çok konuştuklarını göreceksiniz. Birbirlerine cevap veriyorlar – bazen çok kısa cevaplarla, sürekli ileri geri konuşuyorlar ” dedi.
Joe Rogan’ın yapay zeka tarafından oluşturulmuş bir podcast’ini yapmak, şüphesiz Hugo’nun bunu gerçek Joe Rogan’ın kendi başına yapmasından daha uzun sürüyor. Öyleyse neden en popüler podcast sunucularından birinin yapay zeka tarafından oluşturulmuş bir podcast’ini yapalım?
Hugo, “Joe Rogan podcast’inin asla olmayacak veya henüz gerçekleşmemiş bir versiyonunu yaratmak istedim” dedi. Hangisi doğru? Rogan, Altman veya The AI Experience’da tasvir edilen diğer konuklardan herhangi biriyle henüz röportaj yapmadı. Hugo, şovun ana çekiciliğinin Rogan ve diğer insanlar arasında varsayımsal konuşmalar sahnelemek olduğuna inanıyor. Sonunda Steve Jobs veya Abraham Lincoln gibi ölü konukları tasvir eden bölümler yaratmayı denemek istiyor.
The Joe Rogan AI Experience’ın bölümlerini dinleyerek yaklaşık bir saat geçirdim. Ses klonlamanın kalitesi esrarengiz ve Hugo’nun düzenlemesi uzman düzeyinde olsa da, gerçek içerik arzulanan çok şey bırakıyor. Diyalog, artık yapay zeka tarafından oluşturulan metinle ilişkilendirdiğimiz bir şekilde uzun ve yumuşak.
Hugo, “Şahsen dürüst olmak gerekirse, gerçek podcast’lerin veya gerçek sohbetlerin yerini almaya henüz yakın değiliz, ancak insanların korkusunu anlayabiliyorum. Çünkü çok yakın olduğunu düşünmüyorum. Ancak Joe Rogan’ın podcast’ini çokça izlediyseniz, bu yapay zeka deneyiminin gerçek olmadığını ve pek çok duygudan, doğru tonlamadan yoksun olduğunu hemen hissedebilirsiniz” dedi.
The Joe Rogan AI Experience’ın ilk bölümü yarım milyona yakın görüntüleme elde etti (muhtemelen Rogan’ın tweet atması nedeniyle), ancak sonraki bölümlerde izleyici sayısı düştü. Bu, Drake ve diğer sanatçıların hızla viral hale gelen şarkılarının AI remikslerinin aksine, ancak uzmanlar hala insanların AI rekreasyonlarını gerçek şeye tercih edip etmeyeceği konusunda kararsız.
Podcasting’de AI’nın yükselişi hakkında endişelenmek için başka nedenler de var. Dijital sahtekarlıklar, Rogan’ın veya başka bir sunucunun sakıncalı bir şey söylemesine neden olabilir. Hugo, yapay zeka araçlarının VFX endüstrisindeki belirli işlerin yerini nasıl alabileceğini şimdiden gördüğünü söylüyor.
Ancak bu, canlı olarak sunulan programların sonunu getirdikleri anlamına gelmiyor. Bir noktada, Comedy Bang ile bir Vulture röportajını gündeme getirdim! Bang! sunucu Scott Aukerman, podcast’lerin öne çıktığını çünkü günümüzde eğlencenin büyük bir kısmının önceden belirlenmiş olduğunu belirtiyor. Podcast’ler, insanların güldüğünü ve “şu anda neşeli olduğunu” duyabildiğiniz için nadir.
Hugo, yapay zekanın bu kendiliğindenliğin yerini alabileceğine inanmıyor ve şöyle diyor:
“Gece bir arkadaşınla birlikteyken konuşurken, bir saat sonra kendini başladığın yerden tamamen farklı bir yerde buluyorsun? Ve yapay zekanın bunu gerçekten yapamayacağını anlıyorsunuz. İnsan beyninin çalışma şekli çok tahmin edilemez.”
Kaynak: Amrita Khalid / Hotpod News