Mikrofon kullanmadan yapay zekayla podcast üretmek artık mümkün
Mikrofona gerek kalmadan, yalnızca yapay zeka kullanarak bir podcast kaydedebilir misiniz? Artık mümkün. Paul McNally, üç sunucunun haberler hakkında sohbet ettiği, tamamen yapay zeka tarafından oluşturulan bir podcast hazırladı. Bu yazıda bunun nasıl yapılacağını açıklıyor.
Eksiksiz bir podcast bölümü oluşturmak için yapay zekayı kullanabilirsiniz, üstelik mikrofon gerekmiyor.
Tamamen yapay zeka araçlarıyla bir podcast bölümünü nasıl oluşturabileceğinizi açıklıyoruz. Her şeyin değişmesine hazır olun.
Bu yılın başlarında Atina’daydım. Oraya vardığımda neden orada olduğumdan tam olarak emin değildim. Görünüşte iki yıl önce gerçekleşen bir suikastı haberleştirmem gerekiyordu, ancak kısa süre sonra bu hikayenin haberleştirilmemesinin bir nedeni olduğu söylendi. Güvenliğim için bir haberi yapmamamın açıkça söylendiği ve bu tavsiyeye gerçekten uyduğum tek zamandı.
Sonraki birkaç ay boyunca şehirde dolaştım, harika gazetecilerle takıldım ve deli gibi beyaz peynir yedim. Ama aynı zamanda yapay zekanın yaklaşan dünyası karşısında sarsılmıştım ve medyanın nereye gittiği konusunda biraz paniğe kapılmıştım. Airbnb’me kapandım ve dünyanın yeni en iyi arkadaşı ChatGPT ile konuşmaya başladım.
Bu Nisan 2023’te oldu. O zamandan beri yapay zeka ve medya da dahil olmak üzere her sektör için ne anlama geleceği hakkında çok şey yazıldı ve söylendi. Ancak benim bir insan sesi kaydetmeye bile gerek kalmadan sıfırdan bir podcast bölümü üretebilecek bir uygulama geliştirme hayalim vardı. Bu podcast’in bir versiyonunu Atina için, bir diğerini Johannesburg için, bir diğerini Londra için hayal ettim… robotlar tarafından üretilen ve sentetik olarak seslendirilen günün haberleri.
O ay ChatGPT ile herkesten daha fazla konuştum. Kod yazmak için Google’ın Colab programını kullandım (Python’da) ve tekrarlayan, zaman zaman sinir bozucu ve genellikle heyecan verici bir zaman geçirdim.
Bu sizin hayatınız haline geldiğinde… insanlarla suikastlar hakkında sohbet etmek yerine…
Johannesburg’dan günlük haberleri üç eğitimli hayali ses arasında bir tartışma formatında anlatan 10 dakikalık bir podcast bölümünün tamamını ortaya çıkaracak bir çalışma senaryosu oluşturmayı başardım.
Sunuculardan birinin her zaman haberlerde bir sonraki adımın ne olacağını tahmin etmesi fikrine sahiptim; bu nedenle iki ana sunucu bir hikayenin ayrıntılarını anlattıktan sonra hikayenin nereye gideceğine dair tahminleri için üçüncü sunucuya aktaracaklardı. Bunun nedeni ChatGPT’nin hayali anlatılar yaratma konusunda gerçekleri aktarmaktan daha güçlü olmasıydı.
Program Google News ile konuşuyor, günün en önemli haberlerini buluyor ve malzeme için önde gelen siteleri tarıyordu. ChatGPT doğrudan wesbite metninden bir senaryo üretemiyordu, bu yüzden önce haber makalelerini gerçekler listesine dönüştürmesini ve ardından gerçeklerden bir senaryo oluşturmasını istemem gerekti. Buradaki zorluk, her sunucunun farklı bir sentetik sesle eşleştirilmesini sağlamaktı. Bu yüzden senaryoyu farklı diyalog satırlarına ayırmam ve ardından her satırı uygun sentetik ses emülatörüne göndermem gerekiyordu. Daha sonra tüm satırları düzinelerce küçük MP3 olarak geri çekiyor, hepsini bir araya getiriyor ve tam bir MP3 olarak çıkarıyorsunuz.
Birkaç pürüz vardı; sentetik seslerin maliyeti (karakter başına ücretlendiriliyordu) çok yüksekti. Günde 100 podcast bölümünden oluşan distopik bir fabrika hayal etmiştim; kimse yayınlanmadan önce içeriği dinlemiyordu bile. Bu mümkün olmayacaktı. Diğer bir sorun da her bir bölümün üretilme hızının birkaç tıklama ve ardından bitecek kadar hızlı olmamasıydı. Tutarlı bir senaryo elde etmek için istemleri bazen birden fazla kez ChatGPT’ye geri göndermeniz gerekiyordu. Bölüm başına 2 dakika bütçe ayırmıştım, ancak 10 dakikaya yaklaştı (on dakikalık senaryolu içerik için yine de etkileyici). Üçüncü engel ise podcast bölümünün affedilmez derecede sıkıcı olmasıydı… Podcast hazırlayan biri için bu sonuncusu neredeyse bir rahatlama oldu. Bununla birlikte, üç sunucu arasındaki “sohbet” rahatsız edici derecede gerçekçiydi ve ses inanılmaz derecede gerçek geliyordu. Büyük bir potansiyel olduğunu biliyordum ama bu her şeyi çözecek bir çözüm değildi.
Sonunda Atina’dan ayrıldım. Cape Town’a (liseye ve üniversiteye gittiğim yer) bir uçak bileti aldım ve buraya yerleştim. Beş ay oldu ve o zamandan beri yapay zeka patladı. Yapay Zekayı Geliştirmeye başladım ve bu bülteni temel alarak bu mektupta açıklanan yapay zeka aracıyla geliştirilen bir podcast bölümünü şimdiden dinleyebilirsiniz. Kendi otomatik podcast bölümünüzü üretebilmeniz için bu uygulamayı yakında halka açacağız.
www.bing.com/images/create ile üretildi ve “iki Afrikalı gazetecinin etrafta zıplayıp yapay zekayla bir podcast bölümü oluşturması, foto gerçekçi yakın çekim ve dağınıklık” istemiyle üretildi
🎙️ #AIPodcast ilk bölümüyle yayında! İlk bölümde konuğumuz #YapayZeka Uzmanı Elif Yılmaz. Yapay Zeka Destekli Sanat ve Yaratıcılık üzerine sohbeti kaçırmayın.
DİKKAT: Konusundan, dialoglarına ve hatta konuk adına tamamen YapayZeka üretimi. Seslendirme bile YapayZeka’ya ait. Ne böyle bir kişi var, ne de bu sesler birisine ait!
Spotify, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre yapay zeka desteğiyle doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Yeni özellik kapsamında Spotify, “Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserleri hakkında bilgi ver” gibi istemlere dayanarak sesli içerik oluşturacak.
Spotify, platformuna daha fazla yapay zeka özelliği eklerken, yakında kullanıcıların kendi podcast’lerini oluşturmalarına olanak tanıyacağını duyurdu.
Spotify, Perşembe günü düzenlediği yatırımcı gününde, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Bu özellik, kullanıcıların Spotify’a bir istek yazması ve Spotify’ın da bu isteğe göre ses dosyaları oluşturması prensibine dayanan mevcut “İstekli Çalma Listeleri” bölümüne benzer bir mekanizma izliyecek.
Spotify şu örneği verdi:
“Günlük bir özet, merak ettiğiniz bir konu hakkında derinlemesine bir inceleme veya aklınızdaki her şeyin haftalık bir özetini oluşturabilirsiniz. ‘Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserlerinden bahset’ veya ‘Ekonomiyi beş dakikada anlamama yardımcı ol’ gibi isteklerde bulunun ve Spotify, size özel bir sesli özet oluştururken, daha fazlasını keşfedebileceğiniz ilgili bölümlere, programlara ve içerik oluşturuculara da bağlantı verecektir.”
Kullanıcılar daha sonra bu podcast’leri günlük veya haftalık olarak tekrar edecek şekilde planlayabilir, bir ses seçebilir ve ek metin, PDF veya bağlantılar aracılığıyla daha fazla bağlam ekleyebilirler. Bölümler yalnızca her bireyin kendi kütüphanesi aracılığıyla erişilebilir durumda.
Kişisel podcast’ler, önümüzdeki aydan itibaren ABD’deki uygun premium kullanıcılara sunulacak ve belirli sayıda aylık kredi içerecek, ayrıca daha fazla kredi satın alma seçeneği de sunulacak. Spotify ayrıca Perşembe günü, kullanıcıların dinledikleri podcast’ler hakkında Spotify’a sorular sormasına ve yanıt almasına olanak tanıyan yeni bir özellik yayınlayacağını duyurdu.
Spotify’ın eş CEO’su Gustav Söderström, yatırımcı sunumunda şunları söyledi:
“Deneyimin sadece bir katalogdan seçilmediği, her bir kullanıcımız tarafından gerçek zamanlı olarak, zevklerine, bağlamlarına ve niyetlerine göre şekillendirildiği bir Nesil Çağına giriyoruz… Bugün, hem kamuya açık hem de özel içerik için (veya başka bir deyişle) üretken çağ için bir medya oynatıcı yok. Spotify’ın bunu başaracağına inanıyoruz.”
Ayrıca Spotify, podcast içerik üreticilerinin Spotify’daki en ilgili hayranlarından doğrudan düzenli gelir elde etmelerini sağlayan bir yol olarak içerik üretici sponsorluklarını da tanıttı. Şirket ayrıca, podcast ses dosyaları oluşturmak ve kullanıcının takvimine, gelen kutusuna ve notlarına bağlanmak için kullanılabilen bağımsız bir masaüstü uygulaması olan Studio by Spotify Labs‘ı da tanıttı.
Bu özelliklere ek olarak Spotify, biletler satışa çıkmadan önce Spotify Premium sahibi sadık hayranları için iki konser biletini ayıracağını ve premium abonelerin şarkıların yapay zeka tarafından oluşturulmuş cover ve remixlerini yapmasına izin vereceğini duyurdu.
Spotify’ın Megaphone ve Spotify for Creators hizmetleri, Apple Podcasts’te yayınlanan podcast’ler için video desteğini sunacak. Apple bu yılın başlarında HLS video desteğini duyurduğunda, bu iki şirket HLS video desteğini açıklamayan tek büyük podcast barındırma platformuydu. Henüz bir fiyatlandırma açıklanmadı. Ancak bu, Spotify’da videoların işleyişini değiştirmiyor: Şirket, videoların Spotify uygulamasında oynatılabilmesi için hâlâ doğrudan yüklenmesini şart koşuyor.
Şirket ayrıca Spotify Video Distribution (podcast barındırma hizmetinizin sizin adınıza videoları doğrudan Spotify’a yüklemesini sağlayan hizmet) için canlı ortaklarını da duyurdu. Libsyn, Podigee, Audioboom, Audiomeans ve Podspace bu özelliği kullanıma sundu. Spotify Video Distribution, Ocak ayında duyurulmuştu; o zaman Acast ve Omny Studio, lansman ortakları olarak öne çıkarılmıştı, ancak henüz yayında değiller. Spotify, SSS bölümünde artık, fikrinizi değiştirirseniz programınızı tekrar sadece ses içeren bir RSS beslemesine geçirebileceğinizi açıkça belirtiyor; ancak şirket, tüm video yüklemelerinizi kaybedeceğinizi uyarıyor.
Spotify, yapay zeka tarafından üretilen kişiselleştirilmiş ses içeriklerinin merkezi olmayı hedefliyor
Spotify, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanılarak ve yine Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturulabileceğini ve daha sonra dinlemek üzere Spotify’a aktarılabileceğini duyurdu.
Son birkaç yıldır, Google’ın NotebookLM, Hero ve son zamanlarda Adobe Acrobat gibi uygulamaları, kullanıcılara belgeler, günlük programlar ve makaleler gibi mevcut materyallere dayalı podcast’ler oluşturma olanağı sağladı. Şimdi Spotify da bu podcast’lere uygulaması içinden erişmenize izin veriyor, ancak bunu yapmak için bazı programlama araçlarına ihtiyacınız olacak.
Şirket, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanıyorsanız, Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturabileceğinizi ve daha sonra dinlemek üzere Spotify’a aktarabileceğinizi belirtti.
Şirket bir blog yazısında, “İnsanlar şimdiden asistanlarını kullanarak günlerini yönlendiren kişisel ses kayıtları oluşturmaya başladılar: sınav öncesi ders notlarının özetlerinden takvimlerindeki etkinliklerin bilgilendirmelerine kadar. Ve zaten her şeyi dinledikleri Spotify’da bunları da dinlemenin bir yolunu istiyorlar” dedi .
Podcast’ler, kolay erişim için kullanıcının Spotify kütüphanesinde görünecek ancak diğer Spotify kullanıcıları tarafından erişilemeyecek.
Yeni özellikten yararlanmak için kullanıcılar aracın GitHub sayfasına gidip oradaki talimatları takip edebilirler. Ardından, bir tarayıcı aracılığıyla Spotify hesaplarına giriş yapmaları istenecektir.
Bundan sonra, “Bana Dünya Kupası’nın tarihine derinlemesine inen, önemli oyuncular, nerede düzenlendiği ve bu yılki maçlar hakkında bilmem gerekenler hakkında detaylar içeren bir ses kaydı oluşturun” gibi bir istek yazabilir ve ajansdan bir podcast oluşturmasını ve Spotify’a kaydetmesini isteyebilirler. Kullanıcılar ayrıca podcast’lerinin Spotify listesine bir bağlantı da alacaklardır.
Yavuz Kömeçoğlu
23 Ekim 2023 at 08:49
🎙️ #AIPodcast ilk bölümüyle yayında! İlk bölümde konuğumuz #YapayZeka Uzmanı Elif Yılmaz.
Yapay Zeka Destekli Sanat ve Yaratıcılık üzerine sohbeti kaçırmayın.
DİKKAT: Konusundan, dialoglarına ve hatta konuk adına tamamen YapayZeka üretimi.
Seslendirme bile YapayZeka’ya ait.
Ne böyle bir kişi var, ne de bu sesler birisine ait!
Spotify’dan dinlemek için:
https://open.spotify.com/show/6nhuKcRWN3hbsovTs7KPtJ?si=4cb49f8ceea34db6&nd=1
Apple Podcasts’den dinlemek için:
https://podcasts.apple.com/us/podcast/ai-podcast/id1712368675