Haberler
Podcast yayıncılığına bugün başlasaydım farklı yapacağım 3 şey
Podcast’e yeni başlayacak bir kişi için en iyi yardımcı bir başka podcast yayıncısının yıllara yayılmış deneyimi olabilir. Danny Brown yaklaşık 10 yıllık bir deneyimin ardından, “Podcast Yayıncılığına Bugün Başlasaydım Farklı Yapacağım 3 Şey” başlığıyla hem özelleştiri de bulunuyor, hem de yeni başlayacak olan podcast meraklılarına ışık tutuyor. Bu harika önerilere kulak vermenizde yarar var.
Yayınlanma tarihi
10 ay önceon
Yazar :
Podcast TurkeyTwitter’da, Facebook gruplarında, Reddit’te vs. internete bir göz attığınızda podcast başlatmakla ilgili sorulara sıkça rastlayacaksınız. Birçok yanıtta satın alınacak ekipmanlar, kullanılacak sunucular vs. paylaşılıyor.
Hepsi iyi, hepsi güzel. Ancak sıklıkla görmediğiniz şey, kişisel deneyimlere ve alınan derslere dayanarak neyi neden yapmamanız gerektiğidir.
Dolayısıyla, bu hiçbir şekilde yapılması ve yapılmaması gerekenlerin kapsamlı bir listesi olmasa da (sonuçta her şey bireysel ihtiyaçlara bağlı) işte 2016’da podcast yayıncılığına ciddi bir şekilde başladığımda keşke bilseydim dediğim üç ders.
1: Bir Planım Olmalıydı
Podcast yayıncılığına ilk girişimimi (2009 yılında Blog Talk Radio’da yayınlanan tek bir bölüm) saymazsak, ilk gerçek podcast yayınım Life Through a Dram adlı eski bir hobi podcast yayınıydı.
Temelde o hafta gözüme çarpan bir konu hakkında konuşmamdan ve bir kadeh kaliteli malt viskinin tadını çıkarırken bu konu üzerine kafa yormamdan oluşuyordu.
Bir süreliğine eğlenceli olsa da (ve en sevdiğim eğlencelerden birini yapmama izin verse de!), ne hakkında konuşmam gerektiği konusunda zorlanmaya başladığım için kısa sürede tükendi.
- Haberleri tekzip etmeli miyim, edersem ne kadar ciddi olmalılar?
- Özel hayatımdan bahsetmeli miyim?
- Arkadaşlarım olmalı mı?
- Seyrek yayın yapsam fark eder mi?
Tüm bu sorular ve daha fazlası ortaya çıktı, çünkü başladığımda bir planım yoktu. Bunun yerine, podcast yapan bazı insanları gördüm ve ne kadar zor olabilir ki diye düşündüm. Ayrıca tonlarca insanın benim mesajlarımı dinlemek isteyeceğini bekliyordum; bu konuda ne kadar yanılmışım!
Söylemeye gerek yok ama bu ve kendime sorduğum sorular yüzünden kısa süre içinde programdan soğudum ve programın tadı kaçtı.
Bugün ne zaman yeni bir podcast’e başlasam, daha programa başlamadan önce cevaplamak istediğim sorularla ilgili bir planım oluyor:
- Format
- Hedefler
- Pazarlama planı/topluma erişim
- Hedeflerime ulaşırsam, o zaman ne olur?
- Gerekirse nasıl dönerim?
- Yapar mıyım?
Bunlar her yeni podcast’te üzerinden geçtiğim notlardan sadece birkaçı ve her bir noktayı yanıtlamak söz konusu olduğunda her şeyin neye benzediğine dair bir çerçeve planlıyorum. Bu olmadan bir podcast başlatmıyorum çünkü muhtemelen ilerleyen zamanlarda bu yayını da beğenmeyeceğimi biliyorum (bu, bir podcast’in doğal sonucuna ulaşmasından farklıdır).
Bu yüzden önceden plan yapın ve programdan ne istediğinizi bilin.
2: Rakamlarla Uğraşmazdım
Bu muhtemelen tüm podcast yayıncılarının başını sallayarak eşlik edebileceği bir durum; her dakika analizlerinizi kontrol etme takıntısı. Bu bendim (cidden) HER DAKİKA! Yeni bölüm mü çıktı?
İstatistikleri kontrol edin! Sosyal medyada yeni paylaşım mı? İstatistikleri kontrol et! Bir dakikadır istatistikleri kontrol etmediniz mi? İstatistikleri kontrol edin!
Sanırım bu her yeni podcaster için doğal bir şey (benim için öyleydi); başladığınız için heyecanlısınız ve kaç kişinin bu heyecanı paylaştığını görmek istiyorsunuz. Sonuçta, arkadaşlarınıza, ailenize, bağlantılarınıza söylediniz ve hepsinin sizi dinleyeceğini biliyorsunuz, değil mi…?
Ben de istatistikleri kontrol ettim. Ve kontrol ettim. Ve iyi şans için bir kez daha kontrol ettim. Ve tabii ki fark çok azdı.
Ve bu moral bozucuydu.
Her ne kadar ilk podcast hobi amaçlı ve planlamadığım bir yayın olsa da, çok az insanın duymak istediği bir şey yapıyor olmak yine de cesaret kırıcı geliyordu.
Ama o zaman neden dinlesinler ki? Bir pazarlama planım yoktu; sadece sosyal medyada bir kez paylaştım ve bir sonraki bölüm için yola koyuldum. Bir e-posta listem yoktu. Diğer podcast yayıncılarıyla ağ kurmadım.
En önemlisi, kimseye dinlemesi için bir sebep vermedim.
Sadece kaydettim, yükledim, yayınladım ve hepsi bu kadar. Belki de Düşler Tarlası anımı bekliyordum, ama -dinleyiciler gibi- o an gelmedi.
Bir podcast oluşturmak, harika bir pazarlama planı ve büyüme stratejisi olsa bile zaman alır. İşin içine o kadar çok şey giriyor ki, bunu göstermek için harika analizlerle işe koyulmak neredeyse imkansız.
Bu nedenle, tüm guruların ilk günden itibaren almanız gerektiğini söylediği binlerce indirmeyi alamadığınız için rakamlara takılmayın.
Bunun yerine, programınızı optimize etmek için kullanabileceğiniz verilere bakın:
- Dinleyici büyümesi.
- Dinleyicilerden ve diğer podcast yayıncılarından gelen öneriler.
- Bölümlerin yayılma oranı/kalınlığı ve dinleyicilerin nerelerde azaldığı.
- En etkili yönlendirme kanalları.
Analizler harikadır, çünkü bize nerede başarılı olduğumuzu ve nerede daha fazla çaba göstermemiz ya da kayıplarımızı kesip kaçmamız gerektiği konusunda bilgi verirler.
Onları kullanın, ancak onlara zincirlenmeyin.
Bu konudaki bazı içgörülü düşünceler için Twitter’da süper bilgili ve uber dostu Mark Asquith’in bu cevheri de içeren şu başlığına göz atın:
12/ A podcast episode must be constructed in such a way that it benefits the listener, not us. Rather than creating a simple, repeatable *format* for the show, we should be focused on creating a simple, repeatable *formula* that results in a depth of content.
— Mark Asquith, That British Podcast Guy (@MrAsquith) May 10, 2021
(Bir podcast bölümü, bize değil dinleyiciye fayda sağlayacak şekilde kurgulanmalıdır. Program için basit, tekrarlanabilir bir *format* oluşturmak yerine, içerik derinliği ile sonuçlanan basit, tekrarlanabilir bir *formül* oluşturmaya odaklanmalıyız.)
3: Nasıl Düzenleme Yapacağımı Öğrenirdim
Bunu ne kadar söylesem azdır; ilk başladığımda keşke kurgulamayı ve en ufak değişikliklerin bile ne kadar önemli olduğunu öğrenmiş olsaydım. Bunun yerine, Life Through a Dram kaydedildi ve ham olarak yüklendi. Ve dostum, bunu tekrar dinlediğimde acı veriyor.
- Seste uzun boşluklar
- Öksürme
- Hiçbir yere gitmeyen başıboş cümleler
- Çok fazla yankı ve arka plan gürültüsü
Şimdi, bunun bir kısmı her zaman olacaktı; büyük bir odadaydım, çok sayıda sert, çıplak yüzey vardı, klima veya ısıtıcı çalışıyordu ya da pencereler açıktı ve dışarıdan çok fazla gürültü geliyordu.
Ama şimdi ne yaptığımı bildiğim için, saatlerce YouTube videoları izleyerek, diğer podcast yayıncılarına sorarak ve genel olarak prodüksiyon süreci hakkında daha fazla bilgi edinerek, en azından bazı temel düzenleme süreçlerini öğrenmemek için gerçekten bir mazeret olmadığını biliyorum.
Sanırım o zamanki sorunum iki katlıydı:
- Sesin neden önemli olduğu konusunda cahildim (evet, şimdi aptalca geliyor!)
- Çok tembeldim
Düzenleme profesyonel podcast yayıncılarının yaptığı bir şeydi ve çok paraya mal oluyor ve çok zaman alıyordu; neden bununla uğraşayım ki?
Ama sonra; belki de programımın büyümemesinin nedenlerinden biri de buydu. Belki de seyirci dinledi ve “Eğer bizim deneyimlerimizi önemsemiyorsa, ben neden onu önemseyeyim ki?” diye düşündü.
Bir düşünün; yeni bir film izlemeye gidiyorsunuz, dört gözle bekliyorsunuz ve Dolby Atmos ses sisteminin olduğu VIP salonlarından birinde oturmak için küçük bir servet harcadınız. Bir deneyim için her şey hazır.
Sonra film başlıyor ve seste tıslama var, görüntülerde kurgu yok, sadece kamera durduğunda keskin kesmeler var vs.
Bu durum filmden aldığınız keyfi ciddi şekilde azaltır (eğer filmin tamamını izlemeye devam ettiyseniz). Podcast yayıncılığı da aynıdır; dinleyicileriniz için hak ettikleri deneyimi yaratın. Bu şu anlama gelir:
- Ses seviyeleri ve normalizasyon hakkında bilgi edinmek
- LUFS hakkında bilgi edinmek
- Dolgu içeriği ve istenmeyen gürültü hakkında bilgi edinmek
- Mikrofon tekniğini öğrenmek
- İyi bir kayıt ortamının önemi hakkında bilgi edinmek
Bu sonuncusu muhtemelen en çok gözden kaçan, ancak “düzeltilmesi” en kolay olanlardan biridir. Çıplak, sert yüzeyli bir odadaysanız, yankı yapacaktır. Evet, mikrofonunuza yaklaşabilirsiniz, ancak bu yeni sorunlara neden olabilir (yakınlık etkisi, plosives, vb.).
Bu yüzden yumuşatıcılar ekleyin. Minderler, yastıklar, halı, perdeler, yumuşak bir sandalye vb. Tüm bunlar sesinizin sert yüzeylerden yansımasını azaltır, bu da daha sonra düzenlemeyi kolaylaştırır.
Bazı podcast yayıncıları hiç düzenleme yapmadıklarına ve buna gerek duymadıklarına yemin ediyor. Ve bu iyi; eğer bu sizin için işe yarıyorsa, harika (yine de bazı bölümleri dinledim ve düzenleme yapmadıklarını söyleyebilirsiniz).
Ancak diğer herkes için, düzenlemenin temellerini ve farklı ses prodüksiyonu hilelerini ve tekniklerini öğrenmenizi şiddetle tavsiye ederim. İnanın bana, buna değer.
Bütçenize, donanımınıza ve gerekli öğrenme eğrisine bağlı olarak düzenleme için de bazı harika seçenekler var:
- GarageBand
- Audacity
- Hindenburg Pro (Benim kullandığım)
- Reaper
- Logic Pro
- Adobe Audition
Sıra Sizde
Podcast yayıncılığına başladığımda yaptığım üç hata bunlardı. Daha fazlası da var (örneğin transkriptlere hak ettikleri saygıyı göstermemek), ancak bu üçü muhtemelen en başından itibaren kolayca gözardı ettiğim hatalar.
Peki ya siz? Listeye sizin neler ekleyeceğinizi gerçekten merak ediyorum…
Bir dahaki sefere kadar, mutlu podcast yayınları.
Kaynak: Danny Brown / Pod Chat News
Beğenebilirsin
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
YouTube, Android TV uygulamasının ana ekranına özel bir “Podcast” sekmesi ekledi
Google, Gemini sohbet robotuna Canvas editörü ve yapay zeka podcast’leri ekledi
Spotify Audiobooks bağımsız yazarlar için yeni bir yayıncılık programı başlattı
Haberler
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.
Yayınlanma tarihi
10 saat önce=>
27 Mart 2025YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.
Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.
Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.
Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”
YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.
YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.
Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.
Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.
Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.
Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.
(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)
Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.
Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.
YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.
Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.
Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.
Kaynak: Max Tani / Semafor
Haberler
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
Yayınlanma tarihi
3 gün önce=>
25 Mart 2025OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.
OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.
ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.
Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.
Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.
Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.
Kaynak: TechCrunch
Haberler
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.
Yayınlanma tarihi
7 gün önce=>
21 Mart 2025OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.
OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.
Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.
OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.
İşte “gerçek suç tarzı”, yıpranmış bir ses:
OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.
Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.
OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.
Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.
Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.
Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.
OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.
OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.
GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.
Kaynak: TechCrunch
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Haberler2 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik1 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı
- Araştırma7 ay önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor