Bizimle iletişime geçin

Araştırma

Dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptım?

Yapay zeka ve makine öğrenimiyle podcast geliştirme üzerine araştırma ve çalışmaların sayısı artıyor. Eric Borgos da bu meraklı podcast araştırmacılarından birisi. Borgos, bu yazısında dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptığını ayrıntılarıyla anlatıyor.

Yayınlanma tarihi

on

Birkaç hafta önce, “Joe Rogan interviews Steve Jobs” adlı AI (yapay zeka) tarafından oluşturulan bir podcast, dinlerken yarattığı gerçekçilik hissiyle viral oldu. Etkileyici bir başarıydı, ama gerçekten de halihazırda çalışmakta olduğum çeşitli teknolojilerin (GPT-3 ve ses klonlama gibi) gelişmiş bir kombinasyonuydu; bu yüzden kendi versiyonumu yapmaya karar verdim.

Ünlü kişilere dayalı yapay zeka modelleri oluşturmanın bazı potansiyel sorunları var. Yasal olarak ünlülerin adlarının, fotoğraflarının, suretlerinin ve seslerinin izinsiz kullanımını yasaklayan bir “tanıtım hakkı” var. Bunu bir parodi olarak veya eğitim amaçlı yapıyorsanız bunu aşabilirsiniz, ancak bu benim durumum için geçerli değildi.

Bunun yerine, şunu buldum:

BoredHumans.com AI Podcast’i

Katılan ünlü yok. Podbot.ai‘den ilham aldı; ancak benim sürümüm daha otomatik. Çünkü podcast bölüm başlığı kendi başına geliyor. Diğer benzer AI podcast’leri arasında Lexman ve Roborah bulunuyor.

Bu proje için programlamanın ilk adımı, AI’nın daha sonra podcast’in başlığı olarak kullanılacak bir konu hakkında “düşünmesini” sağlamaktı. Bir ML modelini blog gönderi başlıkları üzerine eğitmenin podcast’lerden daha iyi olacağına karar verdim. Bu yüzden iyi olanları yazmayı öğrenmesi için 100.000 blog gönderi başlığını açık kaynaklı aitextgen‘e koydum; ama bu korkunç oldu (neden olduğundan emin değilim). Bunun yerine GPT-J kullanan NLPCloud.com Metin Oluşturma API‘sine geçtim (GPT-3’e benzer). İnce ayara gerek yoktu; bunun yerine en iyi neyin işe yaradığını görmek için çeşitli istemleri denemeye güvendim. Denediğim bazı iyi şeyler şunlardı:

“Bir blog yazısı yazdım. Adı:”, “Blog yazımın adı:”, “Adında bir yazı yazdım:”, “Blog yazım için bir isim düşündüm. Bu:”, “İlk 3 blog gönderisi adı:” ve “İlk 3 makale adı:”.

Hepsi otomatikleştirilmiş olsa da, rahatsız edici veya r-dereceli (r-rated) podcast’leri çıkarmak istemedim. Bu yüzden kullanılmadan önce her bir başlığa manuel olarak baktım ve uygunsuz olanları sildim. Ayrıca, kullanmak istemediğim kelimeleri içeren başlıkları otomatik olarak silmek için bir “kötü kelimeler” filtresi ekledim, ancak ben onları yönetmedikçe bazıları yine de geçti.

Ardından, önceden oluşturduğum 8 ana sunucudan oluşan bir kitaplıktan bölüm için bir AI ana sunucusu seçecek şekilde programladım. Her ana sunucunun adı ve soyadı, açık kaynaklı nameCreator (AI değil) kullanılarak oluşturuldu ve ana sunucunun görüntüsü “AI-Generated Faces” web sitemden rastgele seçildi. Daha sonra her ana bilgisayar, resemble.ai‘den bir AI sesiyle rastgele eşleştirildi (bunun kullanımı maliyetli, ancak Coqui ve Tortoise gibi açık kaynaklı alternatifler var).

Podcast’in metin içeriğini almak için başlığı NLPCloud’un Blog Post Generator API‘siyle destekledim. AI podcast içeriği için özel olarak herhangi bir program veya API bulamadım; bu yüzden şimdilik blog yazısı olması gereken şeyi kullanıyorum. Programlamam, ortaya çıkan metni otomatik olarak SSML ile çoğaltıyor; belirli kısımlarını daha yüksek sesle (başlık ve her bölümün adı gibi) yapıyor ve ana sunucunun sesini daha insancıl hale getirmek için her paragrafın arasına duraklamalar ekliyor. Resemble.ai API‘sinden Text-To-Speech daha sonra bu metni bir sese dönüştürüyor.

Resmi bir podcast gibi görünmesi için her bölüme Storyblocks.com‘dan indirdiğim kısa MP3 dosyaları kitaplığından rastgele seçilmiş giriş ve çıkış müziği verdim. Her ikisi de açık kaynak olan FFmpeg ve MoviePy, her ikisi de açık kaynak, daha sonra sesi otomatik olarak karıştırmak için kullanıldı.

Bölümler için kapak resmi, ona bir cümle (“istem”) verdiğiniz ve konseptinizi makine öğrenimini kullanarak bir görüntüye dönüştürdüğünüz yeni bir metinden görüntüye program olan Stable Difusion (açık kaynak) kullanılarak oluşturuldu. Her podcast bölümü için başlık bilgi istemiydi.

Podcast’i sunucumda barındırabilirdim, ancak bunun yerine ücretsiz hesap seviyelerini kullanarak BuzzSprout’a yükledim ve podcast oynatıcılarını BoredHumans.com AI Podcast sayfama yerleştirdim. Bunu kısmen daha resmi görünmesi için yaptım, ama aynı zamanda podcast’i Apple, Spotify, Amazon ve podcast’lerin duyulduğu diğer yerlere gönderebilmem için yaptım.

Şu anda yalnızca 1 bölümüm tamamlandı, ancak planım 100 bölüm daha oluşturmak ve haftada 1 bölümü otomatik olarak yüklemek için BuzzSprout API’sini kullanmak için kod yazmak. Podcast’ler RSS beslemeleri kullanılarak dağıtılır, yani yeni bir bölüm yüklediğimde tüm büyük podcast uygulamalarında otomatik olarak görünecek.

Ayrıca sesli podcast’imi Synthesia kullanarak bir video podcast’e dönüştürmeyi düşünüyorum, aşağıya bakın:

AI Video Barındırıcıları

Ancak bununla ilgili potansiyel bir sorun var. Şartlar ve koşullar sayfasında, yapmak istediklerimi yasaklayan iki kısıtlama var:

Kısıtlama 1: Stok Avatar’ın her türlü görüş beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçerikte”, herhangi bir kişisel tercih veya deneyimin Stok Avatar’ın tercihleri ​​veya deneyimleriymiş gibi ifade edilmesi de buna dahil.

Kısıtlama #2: Stok Avatar’ın din, siyaset, ırk, cinsiyet, cinsellik veya belirli demografik özelliklere duyarlı olduğu bilinen diğer benzer konularla ilgili herhangi bir gerçek beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçeriklerde.”

Çözüm benim için başka bir benzer hizmeti kullanmak veya kendi metinden videoya yazılımımı oluşturmak olurdu; bu yüzden üzerinde çalışacağım bir sonraki şey bu.

Kaynak: Eric Borgos / Medium

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Araştırma

İçerik üreticilerinin %80’inden fazlası artık iş akışlarında yapay zeka kullanıyor

Wondercraft’ın yeni bir araştırmasına göre, içerik üreticilerin %80’inden fazlası iş akışlarında yapay zeka kullanıyor. Ankete göre yapay zekanın temel faydası zamandan tasarruf etmek.

Yayınlanma tarihi

=>

Yapay Zeka Ses Stüdyosu Wondercraft, içerik oluşturucuların video, ses, tasarım ve metin alanlarında yapay zekayı nasıl kullandıklarına dair küresel bir çalışma olan İçerik Oluşturmada Yapay Zeka 2025 Raporu’nu yayınladı.  VEEDLuma, ve ElevenLabs’in desteğiyle gerçekleştirilen araştırma, yapay zekanın artık birçok sektör ve iş fonksiyonunda yaratıcı iş akışlarının ne kadar ayrılmaz bir parçası olduğunu ortaya koyuyor. Ankete katılanların %80’inden fazlası iş süreçlerinin bir aşamasında yapay zeka kullandıklarını teyit ederken, yaklaşık %40’ı fikir aşamasından teslimata kadar yapay zekaya güveniyor.

Wondercraft Kurucu Ortağı Oskar Serrander, “Yapay zeka, içerik üreticilerinin tükenmeden veya kaliteden ödün vermeden üretken kalmalarına yardımcı olan bir kısayol olmaktan çıkıp bir stüdyo ortağı haline geliyor. Yapay zekanın içerik üretiminde bir yenilik olmaktan çıkıp modern iş akışlarını bir arada tutan bağ dokusu haline geldiği eşiği geçtik. Asıl soru, ekiplerin artık yapay zeka kullanıp kullanmadığı değil, yapay zekanın ne kadar iyi benimsendiği ve kendi seslerine, değerlerine ve pazarlarında rekabet edebilmek için ulaşmak istedikleri hıza ne kadar uyduğur” diyor.

Rapor, Kuzey Amerika, Avrupa ve ötesinde pazarlama, eğitim, İK, yaratıcı ajanslar ve girişimcilik alanlarındaki rolleri kapsayan 500’den fazla içerik oluşturucudan elde edilen verilere dayanıyor. Sonuçlar ayrıca, yapay zeka odaklı yaratıcılığın bir sonraki bölümünü şekillendiren temel davranışsal değişimleri, araç tercihlerini ve benimseme modellerini de ortaya koyuyor.

Yapay zeka gelişmeye devam ederken Wondercraft, içerik oluşturmanın geleceğinin insanların yerini almaktan ziyade onları desteklemekle ilgili olduğuna inanıyor. Serrander, “Yarının en başarılı araçları yaratıcılığın yerini almıyor, ona iskele kuruyor” dedi.

Yapay Zekanın Benimsenmesinde Cinsiyet Eşitliği

Wondercraft raporu, kadınların yaratıcı iş akışlarında yapay zekayı tamamen benimseme olasılığının erkeklere göre biraz daha yüksek olduğunu ortaya koyuyor. Erkek katılımcılar daha fazla araç deneme eğilimindeyken, kadınların özellikle ton, tutarlılık ve etkinin en önemli olduğu rollerde güvendikleri platformlara bağlı kalma olasılığı daha yüksek.

Bu durum özellikle, kadınların liderliğindeki ekiplerin kurum içi iletişim ve eğitim içeriğini verimli ve sorumlu bir şekilde ölçeklendirmek için yapay zekayı kullandığı İK, L&D ve eğitim alanlarında belirgin.

“Yapay zekanın bir sonraki aşaması sadece daha akıllı modeller değil. Bu gerçekten daha akıllı iş akışlarıyla ilgili – hızlı, işbirliğine dayalı ve günlük yaşamınızda yaratıcı yolculuğun keyfini çıkarmanızı sağlayan UX/UI,” diyor Serrander. “Araçlar kullanıcıları sadece flaşla kazanmayacak. Günlük işlere uyum sağlayarak ve ekiplerin ellerindekiyle daha fazlasını yapmalarına yardımcı olarak kazanacaklar.”

Bulgular, yapay zekanın uzun vadede benimsenmesinin sadece özelliklere değil, güvenilirlik, netlik ve kullanıcı güvenine de bağlı olduğunu gösteriyor – özellikle de insan öncelikli mesleklerde.

Kuşak Paradoksu: Yaşlı İçerik Üreticiler Neden Daha Hızlı Benimsiyor?

Beklentilerin aksine, 25 yaş üstü içerik oluşturucular, özellikle de 35-54 yaş arası olanlar, yapay zeka araçlarını genç meslektaşlarına göre daha tutarlı bir şekilde benimsiyor. 25 yaş altı içerik oluşturucuların yalnızca %42’si içerik iş akışlarında yapay zeka kullandığını bildiriyor. Bu oran yaş ortalamasının oldukça altında.

Bu durum, genç kullanıcıların ilk harekete geçenler olarak görüldüğü tipik teknoloji benimseme modellerine ters düşüyor. Ancak rapor, daha yaşlı profesyoneller hız, ölçek ve yaratıcı çıktıyı sürdürmeye odaklanırken, genç içerik oluşturucuların hala seslerini keşfediyor veya bütçe kısıtlamaları dahilinde çalışıyor olabileceğini öne sürüyor.

“İronik ama ‘yapay zeka yerlileri’ olarak dijitalde yaşayan ve nefes alan en genç içerik oluşturucular henüz yapay zekayı tamamen benimsemiyor. Bu da bize benimsemenin sadece yaş veya araçlarla ilgili olmadığını, zihniyet, güven ve yaratıcı hırsın şekliyle ilgili olduğunu gösteriyor.” Oskar Serrander, Kurucu Ortak, Wondercraft

Veriler, yapay zekanın benimsenmesinde sadece yaşın değil, olgunluğun da etkili olduğuna işaret ediyor. Daha yüksek risklere, daha sıkı programlara veya daha karmaşık iş akışlarına sahip olanlar, yapay zekayı sadece denemenin değil, ivmeyi sürdürmenin bir yolu olarak benimsiyor.

İş Akışına Entegre Yapay Zekanın Yükselişi

Yapay zeka artık sadece beyin fırtınası veya içerik fikirleri için kullanılmıyor. Wondercraft’ın araştırması, içerik oluşturucuların yaklaşık %40’ının artık taslak hazırlamadan üretim ve dağıtıma kadar tüm iş akışlarında yapay zeka kullandığını ortaya koydu. Dış kitleler için içerik üreten içerik oluşturucular arasında bu sayı daha da yükseliyor.

Yapay zekanın önde gelen faydası? Katılımcıların %24’ü zaman tasarrufu sağladığını belirtiyor. Bunu, yapay zekanın içeriği formatlar arasında dönüştürme (%19) ve yeni yaratıcı yönelimleri tetiklemeye yardımcı olma (%19) becerisi izliyor.

İlginç bir şekilde, içerik oluşturucular kendilerini tek bir platformla sınırlamıyor. Ortalama olarak, Wondercraft ve ElevenLabs gibi ses öncelikli platformlar, VEED gibi video düzenleyiciler ve Canva veya Midjourney gibi üretken görüntü araçları dahil olmak üzere üç veya daha fazla araç kullanıyorlar. En başarılı iş akışları artık çok modlu; senaryo yazımı, ses üretimi ve görsel varlıkları harmanlayarak kanallar arası içeriği hızlı bir şekilde sunuyor.

Ses ve Yapay Zekanın Genişleyen Rolü

Video baskın içerik türü olmaya devam ederken, özellikle İK, L&D ve eğitim gibi yüksek etkili ancak genellikle kaynakları sınırlı sektörlerde ses yükselişte. Kurum içine dönük bu ekipler arasında, katılımcıların %100’ü yapay zekayı bir şekilde kullandıklarını ve her üç katılımcıdan birinin de tüm içerik süreçlerinde kullandığını bildirdi.

Wondercraft Kurucu Ortağı Dimi Nikolau, “Wondercraft gibi yapay zeka destekli araçlar, ses üretiminin önündeki engelleri azaltarak pazarlama ekiplerinin, iç iletişimin, İK’nın ve diğer departmanların kuruluşları için yüksek ROI’li podcast’ler yayınlamasına olanak tanıyor” dedi.

Bu profesyoneller, politika PDF’lerini anlatımlı kılavuzlara dönüştürmek, bölgeler arasında işe alım içeriğini yerelleştirmek ve yoğun materyalleri daha erişilebilir formatlara dönüştürmek için yapay zekayı kullanıyor. Kalite, tutarlılık ve marka uyumu en önemli öncelikler olmaya devam ediyor ve sezgisel, işbirliğine dayalı ve ton farkındalığı olan araçlara duyulan ihtiyacı vurguluyor.

İçerik Oluşturmada Yapay Zeka 2025 raporunun tamamını buradan indirebilirsiniz.

Okumaya devam et

Araştırma

Yapay zeka: İçerik ve reklamcılıkta isteğe bağlı değil

Yapay zeka destekli ses stüdyosu Wondercraft, içerik oluşturucuların, pazarlamacıların, eğitimcilerin ve ekiplerin yapay zekayı nasıl kullandıklarını anlamayı amaçlayan bir rapor olan AI in Content Creation 2025’i yayınladı.

Yayınlanma tarihi

=>

Yapay zeka destekli ses stüdyosu Wondercraft, içerik oluşturucuların, pazarlamacıların, eğitimcilerin ve ekiplerin yapay zekayı nasıl kullandıklarını anlamayı amaçlayan bir rapor olan AI in Content Creation 2025’i yayınladı. Bilgiler VEED, Luma ve ElevanLabs’ın desteğiyle gerçekleştirilen 2025 anketine dayanıyor. Dünya Ekonomik Forumu, McKinsey, Gartner, Deloitte, LinkedIn ve Pew Araştırma Merkezi’nin araştırmaları da dahil olmak üzere bir dizi başka rapora da atıfta bulunuluyor.

İsteğe Bağlı Değil

Buradaki temel önerme, yapay zekanın içerik oluşturmada bir tercih değil, temel bir unsur haline geldiği. Anahtar bulgu: Katılımcıların %80’inden fazlası yaratıcı sürecin bazı yönlerinde yapay zeka kullanıyor. Zamandan tasarruf etmek, yapay zeka kullanımı için önde gelen motivasyon. ABD’de benimsenme oranı biraz daha yüksek olmakla birlikte bu eğilim küresel.

“Pek çok içerik üreticisi için yapay zeka yalnızca işlerini daha hızlı halletmelerini sağlayan bir araç değil. Fikirleri keşfetme, içerikleri farklı formatlara uyarlama ve daha kişiselleştirilmiş, ölçeklenebilir deneyimler oluşturma yöntemlerinin bir parçası. Bu da yapay zekanın yalnızca bir üretkenlik aracı olmaktan çıkıp yaratıcı bir yardımcı pilot haline geldiği görüşünü destekliyor.”

Bu raporda ses, YZ yaratıcılığının yalnızca yüzde dokuzunu oluştururken, video %52 ile başı çekiyor. Ancak sesten videoya projelerin yükselişi, yapay zekayı giderek daha fazla ses alanına taşıyor. YZ, çoklu medya türlerindeki yaratıcılıkta “bağlayıcı doku” olarak tanımlanıyor.

Reklamcılıkta Yapay Zeka

Wondercraft anketi, reklam yaratıcılarının ve ajans ekiplerinin içerik üretmek, test etmek ve hızlı bir şekilde uyarlamak için yapay zekaya güvendiğini ortaya koyuyor; katılımcıların %85’i bu bulguyu doğruladı. üç ana kullanım belgelenmiştir:

  • Reklamlar için senaryolu seslendirmeler
  • Yerelleştirilmiş sosyal medya içeriği
  • Daha uzun web seminerleri ve röportajlardan elde edilen kısa biçimli videolar.

Bu ekipler, kampanya başına üç ila beş yapay zeka aracı kullanan “çok modlu” uzmanlar olarak tanımlanıyor.

Daha geniş bir bağlamda McKinsey, kuruluşların %78’inin en az bir iş fonksiyonunda yapay zeka kullandığını tespit etti.

Yapay Zeka Kullanım Dağılımı

Wondercraft, anket katılımcılarına göre yapay zekanın uygulandığı medya türlerinin bir dökümünü sunuyor. Aşağıda gösterildiği gibi, medya türleri arasında oldukça eşit bir dağılım var:

Kapsamlı rapora BURADAN ulaşabilirsiniz…

Kaynak: RainNews

Okumaya devam et

Araştırma

Yeni podcast araştırmasında video kazanıyor

Sounds Profitable’ın yeni yayınlanan çalışması The Advertising Landscape’de Signal Hill Insights tarafından yürütülen bir anket podcast tüketiminde videonun yükselişini gösteren son araştırma oldu.

Yayınlanma tarihi

=>

Sounds Profitable’ın yeni yayınlanan çalışması The Advertising Landscape’de Signal Hill Insights tarafından yürütülen bir anketi temsil eden 34 bilgi dolu slayt buluyoruz. Beş binden fazla 18 yaş üstü Amerikalının katıldığı online araştırma, Amerika’da podcasting ve reklamcılık üzerine yapılan en büyük kamu çalışması olma iddiasını taşıyor. (Buradan indirebilirsiniz.)

Anket katılımcılarının tamamı en az bir tür reklam destekli medya tüketicisi.

Video Kazanıyor

Bugünlerde video aracılığıyla önemli ölçüde dinleme yapılmadığını ortaya koymayan bir ses/podcast anketi yayınlanmıyor. Aşağıdaki grafikte, ankete katılanların %12’si için videonun özel tüketim kanalı olduğunu görüyoruz. (NOT: bu veriler adı geçen tek bir podcast ile ilgili).

Videonun eşit, çoğunlukla ve münhasıran kullanıldığını gösteren pasta dilimlerini birleştirdiğimizde, katılımcıların üçte ikisinin (%67) podcast’lerini bir dereceye kadar video ile aldığını görüyoruz:

Beş özet nokta buradaki öğrenmelerin belkemiğini oluşturuyor ve ilginç bir şekilde detaylandırılmışlar:

  • 18 yaş üstü her on Amerikalıdan üçünden fazlası aylık reklam destekli podcast tüketicisi. Podcast dinleyicilerinin önemli bir yüzdesi reklamlarla karşılaşmadıklarını düşünüyorlar; podcast deneyimi Premium ve Reklam Destekli’nin bilinçli bir seçim olmaması açısından sıra dışı.
  • Aylık tüketicilerin günlüğe yakın ve “PRIME” tüketicilere dönüşümü ortalamanın altında. Podcast’ler önemli bir tercih olmaya devam etse de, bunun günlük bir tempoya dönüşmesi gerekmiyor.
  • Podcasting, 18-34 yaş grubu için sözlü sese açılan bir kapı olabilir. Müzik akışının öne çıkması ve ticari AM/FM radyonun 18-34’ler arasında düşüşünün devam etmesiyle podcasting, sözlü sesin geleceği için önemli bir meşale taşıyor.
  • Podcasting çok yönlü bir mecra. Giderek daha fazla insanın podcast’e geri döndüğünü öğreniyoruz. En sevdikleri programların sesli ve görüntülü versiyonları arasında gidip gelebiliyorlar; bu çok yönlülüğü ön plana çıkarmamız gerekiyor.
  • Podcast tüketicileri dikkatlerini veriyor. Bir sonraki raporumuz medya kanallarındaki dikkat ölçümlerini daha derinlemesine inceleyecek olsa da, reklam destekli podcast kitlesinin markalardan gelen mesajlara dikkat ettiği açık.

Kaynak: RainNews

Okumaya devam et

En son