Haberler
Yapay zeka ses klonlamanın podcast’ler üzerinde devrim yaratan etkisi: Fırsatlar ve etik zorluklar
OpenAI’ın ChatGPT teknolojisi birçok sektörle birlikte ses alanını, özellikle podcast ekosistemini de derinden etkiliyor. Yapay zeka ses üretiminde yeni olanaklar sunarken, ses klonlamanın yarattığı riskler ve etik tartışmalar da giderek büyüyor.
Yayınlanma tarihi
2 yıl önceon
Yazar :
Podcast TurkeyYapay zeka (AI), neredeyse her sektörü bir şekilde etkileyen bir sonraki sanayi devrimi olma yolunda ilerliyor. Buna, yapay zeka ses klonlama teknolojisinin içerik oluşturuculara gerçeğe yakın sesleri kolaylıkla üretme yeteneği sunarak ortamı değiştirdiği podcasting de dahil.
Yapay zeka destekli araçların podcast sunucuları ve yapımcıları arasında giderek daha popüler hale gelmesiyle, en son yeniliğin ses prodüksiyonunu dönüştürmesi bekleniyor. Bununla birlikte, yapay zeka ses klonlama kullanan üretim sürecine, etik kaygılara ve yapay zeka tarafından üretilen sesleri ayırt etmek daha zor hale geldikçe podcasting’in geleceğinin neler getirebileceğine geniş bir şekilde bakmak gerekir.
AI Ses Klonlama Nedir?
Arkasındaki süreç karmaşık olsa da yapay zeka ses klonlama, gerçeğe yakın sentetik sesler oluşturmak için yapay zekanın kullanılmasıdır. Bir kişinin sesinin özelliklerini analiz ederek ve taklit ederek çalışır. Süreç şunları içerir:
- Bir kişinin konuşma kayıtlarından oluşan bir veri kümesi üzerinde makine öğrenimi algoritmaları eğitimi
- Çeşitli fonemleri, tonlamaları ve nüansları yakalama
- Toplanan verileri kullanarak sesi yeniden oluşturma
Bu nedenle, bir ses modeli oluşturulduktan sonra yapay zeka, metin girişine dayalı olarak konuşma içeriği üretebilir ve temel olarak orijinal konuşmacının sesini klonlayabilir.
Podcast Prodüksiyonunda Yapay Zeka Ses Klonlama
Podcasting söz konusu olduğunda, yukarıdakilerle aynı ilkeler geçerlidir. Bir dizi ağız hareketini ve ses birimini yakalamak için tipik olarak çeşitli ifadelerden oluşan kayıtlı bir komut dosyası kullanılarak bir AI ses klonu oluşturulur.
Taklit bir ses kullanarak tüm podcast’leri oluşturmak söz konusu olduğunda bunun bir faydası olabilir, ancak mevcut haliyle daha küçük, daha yaygın kullanımları var. Bunlar, aşağıdakileri yapmak için düzenleme amacıyla AI ses klonlama araçlarını kullanan podcast yapımcıları gibi şeyleri içerir:
- Telaffuz hatalarını düzeltme
- Doğru olgusal hatalar
- Reklam okumaları oluştur
Model oluşturulduktan sonra her şey nispeten basit; yalnızca kullanıcıların metin yazmasını ve yapay zekanın işini yapmasına izin vermesini gerektirir. Ancak bu, yeniden çekimlere ve ek kayıtlara ayrılan zamandan tasarruf sağlayan güçlü bir post prodüksiyon aracı yapmak için yeterli.
Podcast’ler için Yapay Zeka Ses Klonlamanın İyisi ve Kötüsü
Kulağa harika geliyor ve bazı bölümleri öyle, ancak AI ses klonlama teknolojisini kullanırken bazı dezavantajlar da var. İlk olarak, aerodinamik podcast prodüksiyonuna, basitleştirilmiş düzenleme süreçlerine ve farklı ses özelliklerini kolaylıkla üretme yeteneğine izin vermesi iyi.
Bununla birlikte, AI ses klonlaması mükemmel değil; bu üretilen sesler bazen monoton veya robotik gelir ve genellikle ritim ve tonlamada kusurlar var. AI ses klonlarında “insan” unsurunu geliştirmek için çalışan birçok şirket olsa da, henüz tam olarak orada değil.
AI Voice Cloning, Daha Derin Hikaye Anlatımı Sağlıyor
AI ses klonlamanın başka bir kullanımı, podcast’in anlatımını zenginleştirerek tarihi bir şahsiyeti veya ünlüyü hayata geçirmesi. Bununla birlikte, teknoloji içerik için pek çok yaratıcı yol sunsa da, özellikle vefat etmiş kişiler söz konusu olduğunda, özellikle sesler izinsiz kullanıldığında, aynı zamanda etik kaygılara da yol açıyor.
Yapay Zeka Ses Kopyalama Yönetmeliği İhtiyacı
Mevcut durumda, AI tarafından üretilen seslerde içerik denetimi, büyük ölçüde içeriği barındıran platformlara bırakılmıştır. Bu platformların, kötüye kullanımı önlemek için yapay zeka tarafından üretilen sesleri kullanan içeriği izlemesi ve denetlemesi çok önemlidir. Ne de olsa, tüm teknolojiler gibi, kötü amaçlar için tasarlanmasa da, genellikle bu şekilde kullanılmaktadır ve kullanılmaya devam edecektir.
Dolandırıcılar, torununun kimliğine bürünen birine para göndermesi için neredeyse kandırılan Kanadalı bir büyükanne örneğinde olduğu gibi, insanları aldatmak için AI ses klonlamasını zaten kullandılar.
Bu tür olaylara ve sahte ses kliplerinin çoğalmasına yanıt olarak Play.ht ve Descript gibi şirketler, yetkisiz ses klonlamayı önlemek ve hizmetlerinin sorumlu bir şekilde kullanılmasını sağlamak için önlemler alıyor.
Geniş bir sanatçı yelpazesini temsil eden bir sendika olan SAG-AFTRA’nın genel müdürü Duncan Crabtree-Ireland, ses klonlamanın sahte ünlü onayları veya diğer zararlı amaçlar için potansiyel kötüye kullanımı konusundaki endişelerini dile getirdi.
Ancak AI ses klonlama teknolojisi ilerlemeye devam ederken bunun yeterli olup olmayacağı bilinmiyor. Zamanla, hükümet düzenlemesinin konusu haline gelebilir. Şimdilik, sektördeki paydaşlar, teknolojinin mümkün olduğunca sorumlu ve etik bir şekilde kullanılmasını sağlayarak uygun koruma önlemleri geliştirmek ve uygulamak için birlikte çalışmaya odaklanmış durumda.
Podcast’lerde Yapay Zeka Ses Klonlamanın Geleceği
Teknoloji ilerledikçe, özellikle gerçeği yapay zeka tarafından üretilenden ayırt etmek zorlaştıkça, gezinmek için etik zorluklar olsa da, yapay zeka ses klonlaması çok fazla fırsat sunuyor. Örneğin, AI yeterince iyi hale gelirse, bir senaryo ne kadar çabuk bir bölüme dönüşebilir?
Bir senaryodan tam bir bölüm oluşturulmasa bile, bölümleri oluşturulabilir. Özellikle misafiri olmayanlar veya sohbet etmeye ihtiyaç duyanlar ve özünde iyi hazırlanmış monologlara güvenenler.
Aynı zamanda, hikaye anlatımı ve prodüksiyondaki kullanımından daha önce bahsedilmişti ve muhtemelen zaman geçtikçe gelişecekler. Üstelik, ne kadar uygun fiyatlı ve erişilebilir hale geliyorsa, tek başına podcast yayınlayanların veya küçük ekiplerin post prodüksiyon sorunlarının kolayca üstesinden gelmesine olanak tanıyacak.
Şu anda ana sorun hala gerçekçilikten yoksun, ancak bu bile hızla değişiyor. AI ses klonlamanın kullanıldığı bir örnek, kayıtları oluşturarak teknolojiyi test eden bir muhabirden geliyor. Kayıtlar, aile üyelerine dinletildiğinde o kadar etkili olmasa da, onu zaten tanımayan insanların neredeyse yarısını kandırmayı başardı.
Başka bir sorun da, podcast’lerin insan bağlantısının hayati önem taşıdığı samimi bir ortam olması ve potansiyel insan bağlantısı kaybını dikkate alınması gereken bir şey haline getirmesidir. Yine de, etik ve diğer sorunlar başlarının üzerinde görünse bile, teknolojinin toplum tarafından büyük olasılıkla benimsenmesi muhtemeldir.
Çözüm
AI ses klonlama teknolojisi, içerik oluşturma ve düzenleme için yeni olanaklar sunarak podcasting endüstrisini yeniden şekillendirmeye hazırlanıyor. Teknoloji gelişmeye devam ederken içerik oluşturucular, platformlar ve dinleyiciler için etik sonuçları, güvenlik endişelerini ve podcast’lerin mahrem doğası üzerindeki potansiyel etkileri dikkate almak çok önemli.
AI ses klonlama daha gelişmiş ve erişilebilir hale geldikçe, paydaşlar bu devrim niteliğindeki teknolojinin podcasting ortamında ve ötesinde sorumlu ve etik kullanımını sağlamak için birlikte çalışmalı.
Kaynak: Spencer Hulse / Grit Daily
Beğenebilirsin
Haberler
Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı piyasaya sürdü
Wondercraft, “içerik oluşturmak için tasarlanmış ilk yapay zeka aracı” olarak adlandırdığı “Wonda”yı piyasaya sürdü. Bu araç, kullanıcıların basit bir sohbetle profesyonel ses ve video oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıyor.
Yayınlanma tarihi
3 saat önce=>
21 Ağustos 2025Wondercraft, Wonda’yı tanıtarak, içerik oluşturmak için özel olarak tasarlanmış ilk yapay zeka aracının tanıtımını yaptı. Y Combinator destekli şirket, bu teknolojinin kullanıcıların doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıdığını ve geleneksel düzenleme yazılımlarına veya teknik uzmanlığa ihtiyaç olmadığını duyurdu.
Duyuruya göre, kullanıcılar istedikleri içeriği tanımlıyor ve Wonda, sezgisel bir konuşma arayüzü aracılığıyla gerçek zamanlı yinelemelere izin vererek içeriği oluşturuyor. Platform, şirketin zaman çizelgelerine, kayıt yazılımlarına ve geleneksel düzenleme araçlarına dayanan geleneksel içerik oluşturma iş akışlarından “radikal bir değişim” olarak adlandırdığı şeyi temsil ediyor.
Wondercraft’ın kurucu ortağı Dimitris Nikolaou, “İnsan hikâye anlatıcılığı, kamp ateşi etrafında yapılan sohbetlerle başladı. Wonda bizi o sadeliğe geri götürüyor: Siz konuşursunuz, Wonda yaratır” diyerek, “Hiçbir şey insan hikâye anlatıcılığı kadar güçlü değildir, ancak birçok yaratıcı fikir, eski düzenleme araçlarının zaman çizelgelerinde yok olur. Adobe’nin yaratıcılığı basitleştirmek için 30 yılı vardı. Wonda ise bunu 30 saniyede yapıyor” diye devam ediyor.
Lansman, içerik oluşturma engellerinin pazarlama ekiplerini zorlamaya devam ettiği bir dönemde gerçekleşti. Wondercraft tarafından yakın zamanda yayınlanan bir araştırma raporuna göre, küresel içerik üreticilerinin %80’inden fazlası artık iş akışlarına yapay zekayı dahil ediyor ve yaklaşık %40’ı fikir aşamasından üretime kadar uçtan uca yapay zeka kullanıyor. Sesli reklamcılık , tüketici etkileşimi ile reklamveren yatırımı arasında belgelenmiş %22’lik bir farkla, önemli ölçüde keşfedilmemiş bir potansiyele sahip.
Teknik yetenekler ve mevcut sınırlamalar
Wonda, içerik oluşturucularına şu anda altı temel işlev sunuyor. Sistem, konuşma komutlarıyla içerik oluşturmayı mümkün kılıyor, yüklenen notlardan veya dosyalardan senaryolar oluşturuyor, etkileyici yapay zeka sesleri üretiyor veya mevcut sesleri kopyalıyor, özel müzikler ve efektler ekliyor, görseller ve avatarlar aracılığıyla görsellere hayat veriyor ve yayına hazır, cilalı ve son halini almış içerikler sunuyor.
Platform, uygun renkleri, yazı tiplerini ve düzenleri seçmek için web sitelerini analiz ederek marka unsurlarını otomatik olarak entegre eder. Eksiksiz ses kontrolü, kullanıcıların oluşturulan ses içeriğinde tonu, duyguyu ve tempoyu ayarlamasına olanak tanır. Özel ses parçaları ve efektler, Wondercraft kütüphanesinden alınabilir veya bireysel projeler için özel olarak yeni sesler üretilebilir.
Wonda şu anda yalnızca ses prodüksiyonu için faaliyet gösteriyor ve video üretim yetenekleri 2025 sonbaharında beta kullanıcılarına sunulacak. Şirket, video özelliğinin genişlemesi için kesin bir tarih veya hangi kullanıcıların öncelikli erişime sahip olacağını belirtmedi.
Wondercraft, Şubat 2024’ten bu yana 110 ülkede 300.000’den fazla kullanıcıya ulaştı. Platform, Amazon, Spotify, BetterHelp, Dünya Bankası ve Publicis Groupe’daki yaratıcı ekiplere hizmet verirken, aynı zamanda Spotify Advertising tarafından onaylanan ve kullanılan bir yapay zeka prodüksiyon platformu olarak da faaliyet gösteriyor.
Sektör bağlamı ve piyasa zamanlaması
Bu duyuru, pazarlamacıların %72’sinin 2025’te yatırımlarını artırmayı planladığı, programatik reklamcılıkta önemli bir büyüme döneminde geldi. Dijital reklam yatırımlarının en küçük payı olmaya devam etmesine rağmen, sesli reklamcılık özellikle 2023 ile 2025 yılları arasında programatik harcamaların %7’sinden %9’una mütevazı bir büyüme gösteriyor.
Sesli içerik oluşturma zorlukları, 2025 boyunca çeşitli platform entegrasyonlarına yol açtı. Trade Desk, 28 Nisan 2025’te Bunny Studio ile ortaklık kurduğunu duyurdu ve bu ortaklık, Kokai platformunda doğrudan sesli reklam üretimine olanak sağladı. Benzer şekilde, AudioGO da Şubat 2025’te otomatik teklif verme için Dinamik Fiyatlandırma özelliğini kullanıma sunarak, sektörün sesli reklam iş akışlarını basitleştirme çabalarını gösterdi.
Kuruluşlar verimlilik iyileştirmeleri ararken, pazarlama topluluğu yapay zeka destekli içerik araçlarına artan bir ilgi gösteriyor. Treasure Data, CDP World 2024’te Müşteri Veri Platformları için Yapay Zeka Çerçevesini tanıttı ve pazarlama operasyonlarını geliştirmek üzere tasarlanmış, kişi tabanlı üretken yapay zeka sohbet arayüzlerini tanıttı.
Kurucu ortak ve yaratıcı ekonomi uzmanı Oskar Serrander, “Yaratıcı üretimin geleceği, azınlık için karmaşıklık üzerine değil, çoğunluk için daha basit konuşmalar üzerine inşa edilecek,” dedi. “Yapay zeka ajanlarının yakında tarayıcı kadar temel olacağı yeni bir insan yaratıcılığı çağına giriyoruz. Wonda, fikirlerinizi gerçek zamanlı olarak şekillendirmek için geleneksel iş akışlarını ve yazılımları diyalogla değiştiriyor.”
Uygulama ve erişilebilirlik
DAX Global Operasyonlardan Sorumlu Başkan Yardımcısı Jake Rea, son beta döneminin ardından şu geri bildirimde bulundu: “Wonda, Wondercraft platformuna eklenen değerli bir yenilik. Müşterilerimize sunduğumuz ses prodüksiyon hizmetlerini daha da kolaylaştırmak için tasarlandı. Wondercraft, yapay zeka alanında gelişmeye devam ediyor ve hem verimliliği hem de yaratıcı çıktıları artıran yenilikçi özellikler sunuyor.”
Platform, 1 Eylül 2025’ten itibaren bir bekleme listesi sistemiyle faaliyet gösterecek ve şirket haftalık 10.000 kullanıcıyı sisteme dahil etmeyi planlıyor. Bekleme listesi üyeleri için öncelikli erişim 30 güne kadar uzatılabiliyor, ancak Wondercraft öncelikli seçim için belirli kriterleri ayrıntılı olarak açıklamadı.
Şirket, Wonda’nın yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu ele aldığını belirtiyor. Geleneksel ses ve video prodüksiyonu genellikle birçok içerik üreticisinin sahip olmadığı özel yazılım bilgisi, profesyonel ekipman ve teknik uzmanlık gerektirir.
Wondercraft, Londra ve New York’taki ofisleriyle dünya çapında faaliyet gösteriyor ve 110 ülkedeki müşterilere hizmet veriyor. Şirket, Y Combinator, Podcast Sunucusu Steven Bartlett, Unicorn AI ses platformu ElevenLabs ve Will Ventures’tan destek alıyor.
Teknik mimari ve farklılaşma
Sistemin konuşma arayüzü, kullanıcıların belirli yazılım arayüzlerini öğrenmesini gerektiren mevcut içerik oluşturma platformlarından onu farklı kılıyor. Kullanıcılar, zaman çizelgelerini değiştirmek, ses seviyelerini ayarlamak veya karmaşık katman sistemlerini yönetmek yerine, gereksinimlerini doğal dilde iletiyor.
Yapay zeka aracısı bu istekleri işler ve ek konuşma girdilerine dayanarak yineleme yeteneğini korurken uygun içerik üretir. Bu yaklaşım, birçok kişi ve kuruluşun profesyonel kalitede ses ve video içeriği üretmesini engelleyen teknik engelleri potansiyel olarak azaltır.
Platformlar daha gelişmiş hedefleme ve ölçüm yetenekleri geliştirdikçe, programatik ses kullanımı yaygınlaşmaya devam ediyor. Spotify, Temmuz 2025’te otomatik podcast satın alımını 12 pazarda 170 milyon dinleyiciye genişleterek, büyük platformların ses envanterine erişimi nasıl demokratikleştirdiğini gösterdi.
Wonda’nın lansmanının zamanlaması, yapay zeka aramalarının geleneksel pazarlama yaklaşımları üzerindeki etkisine dair artan endişelerle aynı zamana denk geliyor. Pazarlamacıların %58’i yapay zeka destekli arama sonuçlarında içerik görünümünü izlemek için manuel gözlem tekniklerini kullanırken, Wonda gibi araçlar, değişen arama ortamlarına uyum sağlamak için daha hızlı içerik oluşturma potansiyeline sahip.
Piyasa etkileri ve rekabet ortamı
Wonda’nın lansmanı, içerik oluşturmaya özel olarak odaklanan ilk yapay zeka aracını temsil ediyor ve bu da onu yaratıcı çalışmalara uyarlanmış genel amaçlı yapay zeka araçlarından farklı kılıyor. Şirket, mevcut yazılımları geliştirmek yerine tüm iş akışlarını değiştirmeye odaklanıyor ve bu da birden fazla araç bağımlılığını ortadan kaldırmak isteyen kuruluşlara hitap edebilir.
Platformun yaklaşımı, mevcut ürünlerine yapay zeka özellikleri ekleyen geleneksel yazılım satıcılarının yaklaşımından farklıdır. Kullanıcılar, karmaşık arayüzleri öğrenip ardından yapay zeka desteği uygulamak yerine, içerik oluşturma hedeflerine ulaşmak için doğrudan yapay zeka aracısıyla iletişim kurarlar.
2023 yılında eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün deneyimli ismi Oskar Serrander tarafından kurulan Wondercraft, yapay zeka teknolojisi ve içerik üretiminin kesişim noktasında konumlanıyor. Serrander’in geçmişinde Spotify, Acast, iHeartMedia ve Carat/Dentsu’da deneyim bulunuyor.
Şirketin genişleme stratejisiyle ilgili olarak Serrander, “Sadece dünyanın en kapsamlı içerik stüdyosunu inşa etmiyoruz; aynı zamanda yaratıcılığın ihtiyaç duyulduğu her yerde güçlenmesini sağlayacak bir aracı inşa ediyoruz” dedi.
Şirket, ortaklıklar aracılığıyla genişlemeyi ve acentesini yaratıcı çalışmaların halihazırda gerçekleştiği platformlara entegre etmeyi planlıyor. Bu dağıtım stratejisi, kullanıcıların tamamen yeni platformlar benimsemesini gerektirmek yerine, mevcut iş akışı araçlarıyla entegre olarak benimsenmeyi hızlandırabilir.
Wonda’yı deneyimlemek ve yeni Wondercraft içerik stüdyosuna erişmek isteyen kullanıcılar, wondercraft.ai/wonda adresinden bekleme listesine kaydolabilirler. Şirket, hizmetin fiyatlandırma ayrıntılarını açıklamadı veya bireysel içerik oluşturucular ile kurumsal müşteriler için farklı seviyelerin mevcut olup olmayacağını belirtmedi.
Zaman çizelgesi
- Şubat 2024 : Wondercraft, 110 ülkede 300.000’den fazla kullanıcıya ulaşarak kullanıcı sayısını artırmaya başladı
- 3 Şubat 2025 : AudioGO, otomatik teklif verme için Dinamik Fiyatlandırmayı tanıttı
- 28 Nisan 2025 : Trade Desk, sesli reklam oluşturma için Bunny Studio’yu entegre ediyor
- Temmuz 2025 : Spotify, otomatik podcast satın alımını 170 milyon dinleyiciye genişletiyor
- 19 Ağustos 2025 : Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı duyurdu
- 1 Eylül 2025 : Wonda bekleme listesi haftalık 10.000 kullanıcı hedefiyle açılıyor
- Sonbahar 2025 : Video üretim yeteneklerinin beta sürümüne sunulması planlanıyor
Özet
Kim: Eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün kıdemli ismi Oskar Serrander tarafından kurulan, Y Combinator destekli bir yapay zeka içerik stüdyosu olan Wondercraft.
Ne: İçerik oluşturma için özel olarak tasarlanmış ilk yapay zeka aracı olan Wonda’nın piyasaya sürülmesi, kullanıcıların geleneksel düzenleme yazılımlarına ihtiyaç duymadan doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına ve düzenlemesine olanak sağlıyor.
Ne zaman: 19 Ağustos 2025’te duyuruldu, bekleme listesi 1 Eylül 2025’te açılacak ve video özellikleri 2025 sonbaharında beta kullanıcılarına sunulacak.
Nerede: Londra ve New York’ta şirket ofisleri bulunan, 110 ülkede 300.000’den fazla kullanıcıya hizmet veren küresel platform.
Neden: Karmaşık geleneksel iş akışlarını basit konuşma arayüzleriyle değiştirerek yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu gidermek ve iş akışlarına yapay zekayı dahil eden yaratıcıların %80’ini hedeflemek.
Kaynak: PPC.Land
Haberler
Pocket FM’den, anlatıları dönüştürme ve merak uyandıran hikayeler yazma aracı
Hindistan merkezli sesli dizi platformu üreticisi Pocket FM, sesli dizilerin Netflix’i olmayı hedefliyor. Yani şirket, yüzlerce bölümlük sesli dizilerini kullanıcılarının zevkine uygun hale getirmeyi amaçlıyor. Bunun için içerikleri hızla yayınlaması gerekiyor ve bu konuda yapay zekaya yöneliyor.
Yayınlanma tarihi
6 gün önce=>
15 Ağustos 2025Hindistan merkezli sesli dizi platformu üreticisi Pocket FM, sesli dizilerin Netflix’i olmayı hedefliyor. Yani şirket, yüzlerce bölümlük sesli dizilerini kullanıcılarının zevkine uygun hale getirmeyi amaçlıyor. Bunun için içerikleri hızla yayınlaması gerekiyor ve bu konuda yapay zekaya yöneliyor.
Lightspeed destekli girişim, yazarlarına bir bölüme daha iyi sonlar önermek veya anlatıyı daha ilgi çekici hale getirmek gibi şeyler yapabilen bir yapay zeka araç seti sunuyor. Bu araçların hikaye yazım sürecini hızlandırması bekleniyor.
Pocket FM, ses dizileri için ses üretmek amacıyla ElevenLabs gibi bazı yapay zeka araçlarını kullanıyor. Ayrıca, şirket içinde yazım ve uyarlama yardımı için yapay zeka araçlarını test etti.
Pocket FM’in kurucusu Rohan Nayak, yapay zeka araçlarının tüm yazarlara sunulacağını, böylece yazarların bölümlerini bitirmelerinin daha az zaman alacağını söyledi.
CoPilot adı verilen yazma aracı, herhangi bir yazarın hikaye oluşturmasına yardımcı olmak için kullanılabilir.
CoPilot, belirli bir bölüm için anlatı tabanlı yazıyı diyalog tabanlı yazıya dönüştürebilir. Ayrıca, belirli bir türdeki sesli diziler için yazıyı daha ilgi çekici hale getirmek üzere şekillendirmek için “vuruş analizi” de yapabilir. Araç ayrıca, “kısaltma”, “genişletme” ve bir komut aracılığıyla metin oluşturma gibi temel sohbet robotu tarzı yazım özelliklerine de sahip.
Şirket, CoPilot’u geliştirmek için kullanıcıların belirli bir türdeki belirli bir hikaye ile daha fazla etkileşim kurmasını sağlayan şeyin ne olduğunu anlamak amacıyla binlerce saatlik veri noktasını inceledi.
Buna dayanarak, karakterler arasındaki çatışmayı artırmak ve bölümü daha heyecanlı hale getirmek için sonlar önermek üzere tasarlanmış yazı önerisi özellikleri ekledi. Yapay zeka ayrıca, ses üretilirken kullanılabilecek arka plan efektleri için etiketler de önerebiliyor.
Araç, karakterlerin biyografilerini, ilişkilerini otomatik olarak oluşturabilir ve farklı bölümlerin olay örgüsü noktalarını özetleyebilir; böylece yaratıcıların yazarken bu ayrıntılara tekrar başvurmalarına olanak tanıyor.
CoPilot’un ayrıca bir bölüm hakkında yorum yaparak olay örgüsünü, dilbilgisini kontrol eden ve nitel geri bildirimler bırakan bir inceleme aracı da bulunuyor.
Pocket FM, perde arkasında, karakter gelişimleri ve ilişkileri için bir hikâyenin bağlamını ve anlatı tutarlılığını korumak üzere daha küçük modelleri eğitiyor. Ayrıca, kullanıcılardan gelen sinyalleri kullanan girişim, yapay zekayı hikâyeye daha fazla dram katması için teşvik ediyor.
Uluslararası genişleme ve yerelleştirme planları
Yapay zeka araçlarının gelişiyle birlikte Pocket FM, metni bir dilden diğerine çevirmenin yanı sıra, o bölgenin kültürüne daha uygun şekilde isimleri ve ifadeleri değiştiren çeşitli pazarlara yönelik uyarlama araçları da piyasaya sürdü.
Şirket, geçen yıl Avrupa ülkesinde kullanıcılarla etkileşim kurmakta zorlandığı yönündeki haberlerin ardından, bu aracı ilk olarak bu yılın başlarında Almanya’da CoPilot paketinin bir parçası olarak diğer bölgelerdeki hikayeleri dönüştürmek için kullanıma sundu.
Nayak, şirketin bu denemeden harika sonuçlar aldığını, Haziran ayında aylık uygulama içi gelirinin 700.000 doları aştığını söyledi.
Nayak, “Yeni bölgelere açılmaya başladığımızda, o pazarda anlamlı bir şekilde var olmamız 12-18 ayı buluyordu. Kullanıcı edinmeye ve pazarı büyütmeye başlamak için en az 1.000 saatlik içeriğe sahip olmanız gerekiyor. Şimdi bunu üç aydan kısa sürede yapabiliyoruz” dedi.
Araç, Alman pazarındaki program çıktıları açısından yazar verimliliğini %50’ye kadar artırdı. Ayrıca, şirketin programların daha hatasız taslaklarını oluşturmasına yardımcı olarak sesli diziler için daha yüksek kullanıcı sadakati sağladı.
ABD’de, bu yeni yapay zeka araçlarının yardımıyla oluşturulan diziler artık izlenme süresinin %10’unu oluşturuyor. Ayrıca, bu diziler son 12 ayda 7 milyon dolar gelir elde ederken, yapım maliyetlerini 2-3 kat azalttı.
İçerik üretimini ölçeklendirmek için teknoloji oluşturma
Pocket FM, şirket içinde farklı yapay zeka özelliklerini benimsemesi sayesinde içeriği hızla ölçeklendirebildi. Girişim, ayda yaklaşık 1.000 pilot yayın başlattığını belirtti. Üstelik, yalnızca içerik hacmi bile birkaçının hit olmasını sağlıyor.
Ancak sesli gösteri sadece bir bölüm. Şirket, Pocket Toons platformuyla hikâyeleri çizgi romanlara dönüştürecek araçlar üzerinde çalışıyor . Ayrıca Nayak, videonun da şirketin araştırabileceği olası bir format olduğunu söyledi. Turlar boyunca 196 milyon doların üzerinde fon toplayan girişim , bir mikro drama uygulaması üzerinde de denemeler yapıyor.
Pocket FM, gelecek yıl programlarından toplanan verilere dayanan ve yazım yardımı, uyarlama, dramatizasyon ve hikaye bağlamını koruma gibi farklı araçları içeren kendi tekil büyük dil modelini (LLM) yayınlamayı planlıyor. Şirketin kurucu ortağı Prateek Dixit, kendi LLM programına geçtiğinde, ayrı özellikler için çok sayıda küçük model eğitmesine gerek kalmayacağını söyledi.
Yapay zekanın potansiyel dezavantajları
Yapay zekayı benimsemenin yan etkileri oldu.
Pocket FM, son 12 ayda birden fazla dönemde çalışan veya taşeron olarak çalışan kişileri işten çıkardı. Ayrıca, yazarların zaman içinde getirilerinin azaldığına dair raporlar da var. Şirket, istihdam ve ücret sorunları nedeniyle Kaliforniya’da davalarla karşı karşıya.
Bir şirket temsilcisi, bu işten çıkarmalara yanıt olarak, “İçerik odaklı çoğu sektörde olduğu gibi, proje bazında çeşitli yazar, seslendirme sanatçısı ve prodüksiyon ortaklarıyla çalışıyoruz ve kaynakları her pazara göre uyarlıyoruz. Yapay zekanın temel yaratıcı topluluğumuz üzerinde çok az etkisi oldu; bunun yerine, erişimi ve çıktıyı genişletmek için yeni yollar açtı,” dedi.
Kalite konusunda da sorular var. Şirket, kaliteyi bir gösterinin izlenme oranlarına göre ölçüyor.
Temel argüman, yeni yapay zeka araçlarının tek başına içerik üretenler için bile bir yazar odası gibi davrandığı ve böylece daha hızlı bir şekilde daha fazla içerik üretebilecekleri yönünde. Ayrıca, rakamlara bakıldığında, yazarlar yapay zekanın yardımıyla hikayeyi hızla düzenleyebilirler. Ancak bu araçlar, platforma “yapay zeka kaynaklı içerik” (yani düşük kaliteli, yapay zeka tarafından oluşturulmuş içerik) ekleyebilir ve kullanıcıların önerilerini etkileyerek iyi hikayeler keşfetmelerini zorlaştırabilir.
Pocket FM, yapay zekanın yardımıyla sağlam bir yapıya sahip hikayelerin popülerlik kazanacağını savunuyor.
Şirket, her içeriğin kalite ve özgünlük sağlamak için yapay zeka destekli moderasyon sistemi tarafından incelendiğini belirtti. Ayrıca, yapay zeka moderasyon sisteminin, sesin yayınlanmasını onaylamadan önce tekrar, telif hakkı sorunları, içerik sağlığı ve diğer kalite ölçütleri gibi unsurları kontrol ettiğini iddia ediyor. Her program eşit şekilde destekleniyor ve kullanıcı etkileşimi, bir programın sıralamasını belirliyor.
Bir diğer endişe ise yazarların zamanla yapay zekaya aşırı bağımlı hale gelebilmesi.
Almanya’da, yapay zeka, belirli programlar için program başına insanlardan daha fazla içerik yazıyor. Pocket FM’in daha fazla yapay zeka aracı sunma planlarıyla, yapay zeka tarafından yazılan içerik miktarı artabilir. Bununla birlikte, daha fazla program yayınlama beklentisi de yükselebilir. Kullanıcı benimsemesi hızla artmazsa, ortalama getiriler düşebilir.
Şirket, TechCrunch’ın iadelerle ilgili sorularına doğrudan yanıt vermedi, ancak yapay zeka araçlarının bir yazarın işini hızlandırabileceğini ve bir bölümü sayılara ve izleyici geri bildirimlerine göre düzenlemelerine yardımcı olabileceğini belirtti. Yani, tamamen yeniden yazmak yerine hedefli iyileştirmeler yapabilirler.
Bir sözcü yaptığı açıklamada, “Bu şekilde, daha hızlı içerik oluşturma, kaliteyi veya alaka düzeyini düşürmüyor; sadece yazarın rolünü daha üretken çıktıları düzenlemeye, iyileştirmeye ve yönlendirmeye kaydırıyor” dedi.
Kaynak: TechCrunch
Haberler
Meta, yapay zeka ses girişimi WaveForms’u satın aldı
Meta, AI ses teknolojisi girişimi WaveForms’u açıklanmayan bir bedel karşılığında satın aldı. Bu satın alma, şirketin yeni AI birimi Superintelligence Labs’ı güçlendirmek için yapılan en son hamle ve Meta’nın PlayAI’yi satın almasının ardından son bir ay içinde yaptığı ikinci büyük AI ses teknolojisi satın alımı.
Yayınlanma tarihi
2 hafta önce=>
9 Ağustos 2025Meta, AI ses teknolojisi girişimi WaveForms’u açıklanmayan bir bedel karşılığında satın aldı. The Information’ın haberine göre, bu satın alma, şirketin yeni AI birimi Superintelligence Labs’ı güçlendirmek için yapılan en son hamle ve Meta’nın PlayAI’yi satın almasının ardından son bir ay içinde yaptığı ikinci büyük AI ses teknolojisi satın alımı.
Sadece 8 ay önce kurulan WaveForms, PitchBook verilerine göre Andreessen Horowitz’den 40 milyon dolarlık yatırım aldı ve bu yatırım turunda şirketin değerlemesi 160 milyon dolar olarak belirlendi.
Girişimin iki kurucu ortağı, eski Meta ve OpenAI araştırmacısı Alexis Conneau ile eski Google reklam stratejisti Coralie Lemaitre’nin Meta’ya katıldığı bildirildi. Conneau, OpenAI’da çalışırken GPT4-o Advanced Voice Mode sinir ağlarını ortaklaşa oluşturdu.
TechCrunch, WaveForms’a ulaşarak şirketin baş teknoloji uzmanı Kartikay Khandelwal’ın da Meta’ya katılıp katılmayacağını ve şirketin diğer yaklaşık 14 çalışanının (LinkedIn’e göre) anlaşmanın sonucunu öğrenmek istedi.
WaveForms kendi web sitesini kapatmış gibi görünüyor, ancak şirketin LinkedIn sayfasında misyonunu, dinleyicinin insan ve yapay zeka tarafından üretilen konuşmaları ayırt edip edemediğini ölçmeye çalışan “Konuşma Turing Testi”ni çözmek olarak tanımlıyor. WaveForms ayrıca, bireysel öz farkındalık ve yönetimi anlamaya odaklanan “Duygusal Genel Zeka”yı da geliştiriyordu.
Kaynak: TechCrunch
Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı piyasaya sürdü
Pocket FM’den, anlatıları dönüştürme ve merak uyandıran hikayeler yazma aracı
Meta, yapay zeka ses girişimi WaveForms’u satın aldı
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Araştırma12 ay önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Haberler3 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik2 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı