Bizimle iletişime geçin

Haberler

Yapay zeka podcast’leri tartışması büyüyor

Yapay zeka kullanımı podcast alanında yaygınlaştıkça tartışmalar da büyümeye başladı. Bazı örnek uygulamalar üzerinden yapay zekanın ürettiği seslerin dinleyicilerin ilgini çekip çekmeyeceği, insan podcaster’ların yerini tutup tutmayacağı tartışmalarını da çoğalttı. Destekleyenlerin yanı sıra şüpheyle yaklaşanlar da var.

Yayınlanma tarihi

on

İşte podcast’lerle ilgili gerçek: Çok fazla var. Podcast Index veritabanına göre kesin olarak 4 milyondan fazla. Yalnızca son üç gün içinde, yaklaşık 103.000 ayrı podcast bölümü çevrimiçi olarak yayınlandı. O kadar büyük bir ses içeriği seli ki, dinleyicilerin hiçbir zaman seçeneklerinin tükenmesine gerek kalmıyor. Hayatının geri kalanını Apple Podcast’lerdeki gerçek suç kataloğunda veya Spotify’daki spor sohbet programlarında çalışarak geçirebilirsin ve sonunda 2070’te Michael Barbaro, cesedine Mailchimp için bir reklam okurken yaşlılıktan ölebilirsin.

Halen devam eden üretken AI (yapay zeka) altına hücumunda, fırsatçı girişimciler en doymuş pazarlara bile girmek istiyor. ElevenLabs, WondercraftAI ve Podcastle dahil olmak üzere bir dizi girişim, AI seslerini dakikalar içinde oluşturmak için kullanımı kolay araçları tanıttı. Yani, sanki istenmiş gibi,  yapay zeka podcast’leri, istense de istenmese de burada.

İlk günlerde, kimse bu garip yeni podcast türünün kaç dinleyicisi olduğunu takip etmedi. Apple Podcasts ve Spotify gibi büyük merkezlerde robot sunucular için ayrı istatistikler yok. Bununla birlikte, en azından ilk bölümleri için açıkça izleyici bulan birkaç bireysel AI podcast var.

THE JOE ROGAN AI EXPERIENCE’IN YARATICISI HUGO

AI TARAFINDAN ÜRETILEN İLK podcast’i biraz aldatıcıydı. Dünyanın en popüler insan podcast sunucusunun klonlanmış sesini kullandı. Joe Rogan Yapay Zeka Deneyimi, Rogan’ın OpenAI CEO’su Sam Altman ve eski başkan Donald Trump gibi (eşit derecede sahte) konuklarla gevezelik ettiği bir dizi simülasyonu içeriyordu. İlk bölüm çıktıktan kısa bir süre sonra, gerçek Rogan bir tweet attı ve “Bu çok kaygan olacak çocuklar” diye yazdı.

Kopya, YouTube’da yarım milyondan fazla görüntülendi. Bazı dinleyiciler bunun yapay zeka olmasını umursamadı bile. “Aslında bu benim için yeterli. İyi şeyler” diye yazdı biri.

Joe Rogan Yapay Zeka Deneyimi,  Hugo adlı bir Rogan hayranı tarafından oluşturuldu. (Projeyle profesyonel olarak ilişkilendirilmek istemediği için WIRED’e tam adını vermeyi reddetti.) Şovun yapımını desteklemek için bir Patreon’u var ve yakın zamanda YouTube’da para kazanma özelliğini açtı, ancak herhangi bir kazanç sağlamayı beklemiyor. Özellikle Rogan’ın sesini veya benzerliğini kullanmaya izni olmadığının ve podcast platformlarının bu tür kimliğe bürünmeyi yasaklayabileceğinin farkında.

Hugo, yapay zeka ses araçlarının neler yapabileceğini göstermek istediği için bu diziyi yarattı. Bölümleri dinleyiciler için akıcı hale getirmek için dikkatlice düzenlemesine rağmen (doğru olması günler veya haftalar alabilir) makul ölçüde doğru taklitler olsalar bile konuşmaların kendilerinin özellikle büyüleyici olduğunu düşünmüyor. Hugo, “Teknolojik gelişimi nedeniyle podcast’i dinlemenin dışında hiçbir anlamı yok” diyor. Dna göre, “Sadece zaman kaybı.”

Seyircinin ortalıkta dolaşıp durmayacağı veya sadece alışılmadık ve yeni bir şeyi kontrol etmek isteyip istemediği belli değil; Hugo dört bölüm yayınladı ve sonraki her bölüm bir öncekinden daha az izleyici çekti.

WIRED, Hugo’nun yaklaşımını tekrarlayan yapay zeka tarafından üretilen podcast’lerin diğer birkaç yaratıcısıyla konuştu. Teknolojiyle oynamaktan zevk alıyorlardı, ancak nihai sonuçları deneylerin bir yan ürünü olarak görüyorlar. Örneğin İsrail merkezli ses mühendisi Lior Sol, ElevenLabs’in araçlarını kullanarak Myself, I Am and That adlı tuhaf bir podcast yarattı. Sesinin bir klonunu ve ardından son derece meta konuşmasında o klonun bir klonunu yaptı. Lior Sol, “Kesinlikle onunla eğleniyorum” diyor. Ancak bu, büyük kitleleri kovaladığı anlamına gelmiyor. Şu anda, dinleyicilerinin sayısı düzinelerce. Arkadaşları beğeniyor, o beğeniyor. Bu bir sanat projesi ve ticari bir şey yapma girişimi değil, yeni teknolojiyle uğraşma şansı.

DİĞER BAZI YARATICILAR, özellikle de yenilik etkisini yitirdikten sonra izleyicilerin ürettiklerini beğenmesini bile beklemiyor. Örneğin Andi Durrant, İngiltere merkezli içerik pazarlama girişiminde Yapay Zeka tarafından oluşturulan Sentetik Hikayeler adlı bir podcast oluşturmaya yardımcı oldu. Klonlanmış sunucu seslerine ek olarak, senaryo ve ses tasarımı da dahil olmak üzere, Sentetik Hikayelerin diğer tüm unsurları yapay zeka tarafından üretildi. Durrant, “Bir deney olarak bununla gurur duyduk. Yine de yaratıcı bir çalışma olarak sınırlamaları gerçekten çok çabuk anlıyorsunuz” diyor.

Bununla birlikte, AI podcasting girişimi WondercraftAI’nin CEO’su Dimitris Nikolaou, izleyicilerin AI tarafından oluşturulan podcast’lere sadakat geliştirebileceğine inanıyor. Ekibi, platformunun neler yapabileceğini göstermek için bir kavram kanıtı olarak, Y Combinator tarafından yürütülen Hacker News forumundaki en önemli haberlerin günlük kısa özetlerini sunan Hacker News Recap‘i oluşturdu. Şu anda ABD’de Apple Podcasts’in teknoloji tablosunda 31. sırada yer alıyor. (Başka yerlerde, daha da iyi performans gösteriyor. “Her nedense Letonya’da iki numarayız” diyor Nikolaou.)

Nikolaou, Hacker News Recap‘in yapay zeka tarafından oluşturulan senaryolarının insanlar tarafından yazılanlardan daha üstün olduğunu veya yapay seslerinin daha melodik olduğunu düşünmüyor. “Bunda özel bir şey yok. Bu, diğer herhangi bir teknoloji podcast’inde bulacağınız içerikle aynı” diyor ve ekliyor, “Ne olursa olsun, çok tutarlı olup her sabah yayınlayabilmemiz daha önemli.”

Podcast, Wondercraft’ın hizmetlerinin nasıl çalıştığını göstermek için tasarlandı: Hem komut dosyası hem de ses, Hacker News’in en üstünde görünen gönderilere dayalı olarak yapay zeka tarafından oluşturuldu. (Wondercraft, içeriğini kullanmak için Y Combinator’dan izin aldı, bu özellikle şaşırtıcı değil; başlangıç ​​inkübatörü de yatırımcılarından biri.) Yalnızca sesli biçimde bir bilgi özeti isteyen insanlar için bu tutarlı bir teklif.

Ayrıca Wondercraft’ın, blog gönderilerinin sesli bir versiyonunu yayınlamak isteyebilecek ancak bunu kendileri yapacak zamanı veya bir okuyucu tutacak parası olmayan haber bülteni yazarları gibi bazı bağımsız yaratıcı türlere hitap edeceğine inanıyor.

İNSAN PODCAST YAYINCILARI büyük podcast stüdyoları tarafından sıklıkla kullanılan AI düzenleme araçlarını benimsemeye başladı bile. Bu araçlar, arka plandaki gürültüyü gidermek veya mırıldanılan sözcükleri netleştirmek gibi görevleri basitleştirebilir. Ve bazıları seslerini reklamlar için klonlama fikriyle oynuyor. Örneğin bu hafta, The Ringer’ın kurucusu Bill Simmons kendi istikrarlı Spotify podcast’leri için sunucuların yapay zeka tarafından üretilen ses klonları tarafından okunan reklamlar geliştirme olasılığını tartıştı.

Tamamen yapay zeka tarafından oluşturulan sunucular ise tamamen başka bir hikaye.

Kim? Haftalık ortak sunucular Bobby Finger ve Lindsey Weber, AI düzenleme araçlarının potansiyel kullanım durumlarını görüyorlar, ancak AI ses üreten araçların uzun süredir devam eden çok sevdikleri podcast’leri için herhangi bir gerçek değere sahip olmasını öngörmüyorlar. Finger, “Mantıklı olmasının tek yolu gerçek bir şakadır. İkna edici değil” diyor.

NORMAL GOSSIP PODCAST’ININ SUNUCUSU KELSEY MCKINNEY

Yakın zamanda büyük çıkış yapan Normal Gossip’in sunucusu Kelsey McKinney, yapay zeka tarafından oluşturulan podcast’lerin izleyicilerle kalıcı bir şekilde bağlantı kuracağından şüphe ediyor. McKinney, “AI şeyleri, her biçimde ondan nefret ediyorum. İnsanlar diğer insanlarla bağlantılı hissetmek istiyor. Podcast’lerin bu kadar popüler olmasının nedeni, dinleyicilerin kendilerini onları yapan insanlara bağlı hissetmeleridir” diyor.

McKinney, yapay zeka podcast’lerini, eğlence şirketlerinin sanatı otomatikleştirmeye ve değerini düşürmeye yönelik daha büyük çabasının bir parçası olarak görüyor; yaratıcılardan ziyade maliyetleri düşüren yöneticiler tarafından yürütülen bir çaba olarak değerlendiriyor. McKinney, “Podcast’ler için AI kullanmak istiyorlar. Senaryo yazımı için AI kullanmak istiyorlar. Oyuncular için yapay zeka kullanmak istiyorlar. Yaratıcı insanlara ödeme yapmak istemediklerini söylemeye çalışıyorlar” diyor.

Özellikle “Kim?” gibi podcast’lerle? Weekly ve Normal Gossip – geveze, konudan sapan, komik, tuhaf – her hafta akort yapmanın temel çekiciliği, mikrofondaki belirli insanların söyleyeceklerini duymaktır. Teknoloji ne kadar gelişirse gelişsin, bir robotun bu deneyimi tam olarak tekrarlayabileceği fikri hâlâ saf bir bilim kurgu. (Spike Jonze’s Her 2: Her Starts a Podcast‘i 2033’te sinemalara geliyor.)

Bu, Nikolaou’nun Hacker News Recap‘nin temelsiz olduğu anlamına gelmez; bazı insanlar belli ki özetlenmiş haber makalelerinin kişilikten yoksun hoş, yapay bir sesle okunmasını istiyor. Ancak özetlenmiş haber makaleleri, popüler podcast’lerin büyük çoğunluğunu temsil etmiyor. Ortam, samimiyetle, dinleyicilerin eski arkadaşlar arasındaki bir sohbete kulak misafiri olduklarını veya odanın arkasında özellikle parlak bir panelde oturduklarını hissetmeleriyle tanımlanır. Podcast araştırmacısı Alyn Euritt,  2022 tarihli Podcasting as an Intimate Medium adlı kitabında dinleyicilerin kendilerini nasıl “hayali bir ulusal topluluğun üyeleri” olarak görmeye başlayabileceklerini anlatıyor. Haber özet programları gibi nişlerde bir robot yeterli olabilir. Ancak podcast işi bilgi üzerine kurulu değildir; konuşma üzerine inşa edilmiştir.

Yapay zeka podcast’leri, üretken yapay zeka ürünleri ve hizmetleri için büyüyen pazarda küçük bir balondur, ancak genç endüstri içindeki daha geniş gerilimleri açıklar. Teknoloji aynı anda hem gelişmiş hem de yapaydır; yakından dikkat etmediğiniz ve ayrıntıları tamamen yanlış anladığınız sürece gerçek gibi görünen sesler ve görseller üretebilir. Ve şu anda, AI’nın etkisi hakkındaki tartışmalar abartılarla tamamen çarpıtılıyor. Dikkat çekmeyi paradigma değiştirmeyle karıştırıyoruz. (Sahte Rogan podcast’i hakkında başka bir yorum: “Teknolojinin dünyalarını değiştirmesini izlerken büyükanne ve büyükbabamın nasıl hissettiğini artık merak etmem gerekmiyor.”) Sözcükler doğru sırada olabilir. Ama ton çok düz.

Kaynak: Kate Knibbs / Wired

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Danimarka, insanların kendi özelliklerini telif hakkıyla korumayı planlıyor

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. Bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Yayınlanma tarihi

=>

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. The Guardian’ın haberine göre, bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Danimarka Kültür Bakanlığı, mevcut yasayı değiştirmek için bir öneri sunması gerekse de, kurum şimdiden tüm partilerin desteğini almayı başardı.

Danimarka Kültür Bakanı Jakob Engel-Schmidt, The Guardian gazetesine verdiği demeçte, “Tasarıda, herkesin kendi bedeni, kendi sesi ve kendi yüz özellikleri üzerinde hak sahibi olduğu konusunda hemfikiriz ve bu konuda net bir mesaj veriyoruz. Ancak mevcut yasa, insanları yapay zeka ile üretilen içeriklere karşı bu şekilde korumuyor” dedi.

ABD’de, birkaç eyalet, seçimler sırasında kötüye kullanım ve rıza dışı cinsel içerikle ilgili derin sahtecilik yasalarını kabul etti. Kongre, eyaletlerin yapay zekayı 10 yıl boyunca düzenleme yetkisini elinden alacak yeni bir bütçe uzlaşma tasarısını değerlendirirken, bu yasaların çoğu şu anda risk altında.

Kaynak: TechCrunch

Okumaya devam et

Haberler

Meta, ses klonlama girişimi Play AI’ı satın almaya hazırlanıyor

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Yayınlanma tarihi

=>

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Bloomberg’in haberine göre şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Habere göre teknoloji devi, girişimin teknolojisini satın almayı ve bazı çalışanlarını bünyesine katmayı hedefliyor.

Play AI, web sitesine göre, herkesin müşteri hizmetleri gibi AI destekli kullanım durumları için kullanabileceği farklı türde sesleri klonlamasına olanak tanıyor. Crunchbase’e göre, bu girişim toplamda 23,5 milyon dolar fon topladı ve yatırımcıları arasında 500 Global, Kindred Ventures, Race Capital ve Soma Capital bulunuyor.

Meta şu anda sosyal platformlarındaki içerik oluşturucuların kendi sohbet robotlarını oluşturmalarına izin veriyor ve Meta AI sohbet robotuna video düzenleme özellikleri ekledi. Bir ses girişimini satın almak, şirketin yaratıcı paketine ses özellikleri eklemesine olanak tanıyacak.

Meta ve Play AI haberlere ilişkin yorum yapmadı.

Kaynak: TechCrunch

Okumaya devam et

Haberler

ElevenLabs, yapay zeka özelliklerine sahip mobil uygulamasını başlattı

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android için kullanıcıların hareket halindeyken metinden ses klipleri oluşturmasına olanak tanıyan, etiketler aracılığıyla ifade kontrolü ve popüler içerik oluşturma uygulamalarıyla sorunsuz entegrasyon sağlayan en yeni v3 alfa metinden sese modellerine erişim sunan bağımsız bir mobil uygulama başlattı.

Yayınlanma tarihi

=>

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android kullanıcılarının metinden ses klipleri oluşturmasına olanak tanıyan bağımsız bir mobil uygulama yayınladı.

Şimdiye kadar, ElevenLabs’ın yapay zeka destekli ses kütüphanelerini kullanarak örnekler üretmeniz gerekiyorsa, web uygulamasına güvenmek zorundaydınız. Şimdi hareket halindeyken klipler üretmek için mobil uygulamasını kullanabilirsiniz.

ElevenLabs mobil uygulaması, hareket halindeki içerik üreticiler için tasarlanmış şık ve sezgisel bir arayüzde güçlü AI ses üretme özelliklerini bir araya getiriyor. Kullanıcılar, 70’den fazla dilde binlerce gerçekçi sese erişebilir ve yaş, aksan ve stil filtreleri kullanarak her projeye en uygun sesi bulabilir. Uygulama, stadyum tezahüratlarından ince komedi zamanlamalarına kadar her ses klibini olağanüstü derecede insan sesine benzeten, benzeri görülmemiş bir duygusal aralık ve ifade kontrolü sunan son teknoloji Eleven v3 modelini içeriyor.

Uygulamayı diğerlerinden ayıran özellik, özelleştirme seçenekleri ve sorunsuz iş akışı entegrasyonu. Kullanıcılar, hayal ettikleri sesi tam olarak elde etmek için hız, kararlılık ve stil gibi ses parametrelerini ince ayar yapabilirler. Tek dokunuşla dışa aktarma özelliği sayesinde, oluşturulan sesler CapCut, TikTok, Instagram ve YouTube Shorts gibi popüler içerik oluşturma platformlarında anında paylaşılabilir. Uygulama, kullanıcıların ElevenLabs hesaplarıyla senkronize olarak, kişisel ses klonları, kaydedilmiş favoriler ve web platformundaki önceki içerikler dahil olmak üzere tam ses kitaplığına erişim sağlıyor. Ücretsiz kullanıcılar, mobil ve web uygulamaları arasında paylaşılan kredi limitleri ile ayda yaklaşık 10 dakika ses oluşturma hakkı elde ediyor.

V3 Alpha İfade Kontrolleri

Eleven v3 (alpha), satır içi ses etiketleri aracılığıyla ses ifadesinde benzeri görülmemiş bir kontrol sağlayarak AI konuşma sentezinde devrim yaratıyor. Önceki modellerden farklı olarak, v3 kullanıcıların [fısıldar], [güler], [kızgın], [heyecanlı] ve [iç çeker] gibi duygusal ipuçlarını doğrudan metne yerleştirerek performansları yönlendirmelerine olanak tanıyor ve doğal duygusal geçişlerle olağanüstü insan benzeri bir sunum yaratıyor. Bu etiketler birleştirilebilir (örneğin, “[mutlu][bağırır] Başardık! [güler]”) birleştirilerek, AI ses teknolojisiyle daha önce imkansız olan nüanslı performanslar elde edilebilir.

Modelin gelişmiş mimarisi, tüm duyguları ve ses efektlerini destekleyerek, ince ton değişikliklerinden cümle ortasında dramatik performans değişikliklerine kadar her şeyi mümkün kılıyor. v3, önceki sürümlerden daha fazla hızlı mühendislik gerektirse de, sesli kitaplar, videolar ve etkileşimli medya gibi uygulamalarda olağanüstü gerçekçilik sağlıyor. Gerçek zamanlı üretim ihtiyacı olan kullanıcılar için ElevenLabs, v3’ün gerçek zamanlı sürümü kullanıma sunulana kadar v2.5 Turbo veya Flash modellerini kullanmaya devam etmelerini öneriyor. Şirket, arayüzü üzerinden erişen self servis kullanıcılar için 2025 Haziran sonuna kadar v3 kullanımında %80 indirim sunuyor.

Çapraz Platform Entegrasyon Yetenekleri

ElevenLabs, geliştiricilerin AI ses teknolojisini çeşitli uygulamalara sorunsuz bir şekilde entegre etmelerini sağlayan, birden fazla platformda sağlam entegrasyon yetenekleri sunuyor. Platform, geliştiricilerin ses özelliklerini hızlı bir şekilde uygulamaya koyarken, kurumsal düzeyde güvenlik için GDPR ve SOC II uyumluluğunu koruyan Python ve TypeScript SDK’ları sağliyor. Kodsuz çözümler arayanlar için Albato, Make ve Appy Pie Automate gibi hizmetler, programlama uzmanlığı gerektirmeden ElevenLabs’ı yüzlerce popüler uygulamaya bağlamayı mümkün kılıyor.

Şirketin Konuşma Yapay Zeka teknolojisi, Salesforce, HubSpot ve Gmail gibi hizmetlere bağlanmak için Çok Kanallı Protokolü (MCP) destekleyen 11ai’nin tanıtımıyla entegrasyon olanaklarını daha da genişletti. Mobil uygulama entegrasyonu, geliştiricilerin önceden hazırlanmış sesler arasından seçim yapabileceği veya mobil uygulamalar için kendi seslerini özelleştirebileceği konuşma AI oyun alanı aracılığıyla kolayca gerçekleştirilebilir. Bu entegrasyon seçenekleri, ElevenLabs’ı web, mobil ve telefon kanallarında gerçekçi AI tarafından üretilen seslerle ürünlerini geliştirmek isteyen işletmeler için çok yönlü bir seçim haline getiriyor.

Kaynak: Perplexity

Okumaya devam et

En son