Haberler
Podcast’e ilgi neden artıyor?
Podcast ekosistemi tüm boyutlarıyla büyütüyor. Ancak podcast yayıncılığının esas gelişimini “içerik kalitesi ve değeri” belirleyecek.
Yayınlanma tarihi
3 yıl önceon
Yazar :
Özcan YazıcıPodcast sözcüğü Türkiye’de hala birçok kişi için yeni bir kavram. Ama pandemi sürecinde, eve kapanılan günlerde yıldızı bir anda parladı. Hem Dünya’da hem de Türkiye’de dinleyicisi de, yayıncısı da arttı.
Podcast’e ilginin bu denli yükselmesinin elbette tek nedeni pandemi değil. Yeni bir mecra olarak “sesin” cazibe merkezi haline gelmesi, hedef kitleye ulaşmada benzersiz bir iletişim olanağı sağlaması ilginin artmasını destekledi.
Anımsatmakta yarar var. Hâlâ podcast’in ne demek olduğunu bilmeyenler için, “radyonun dijitalleşmiş hali” diyebiliriz. İsteğe bağlı, indirilebilir ses dosyası olan podcast’i istediğiniz zaman, istediğiniz koşullarda dinleyebilirsiniz, bildiğimiz radyodan farklı olarak.
Sosyal medya çağında, yazı, fotoğraf, videonun yaygınlaştığı bu dönemde, sese ilgi neden artıyor? Milyonlarca kullanıcısı olan Facebook, Instagram, Twitter, TikTok, Youtube gibi platformlar varken, neden podcast yayınlarına ilgi büyüyor?
Araştırma şirketi Nielsen’in birkaç gün önce yayınlanan “Podcasting Today” raporuna göre ABD’de günlük podcast dinleyicilerinin yüzde 50’sinden fazlası son iki yılda podcast dinlemeye başlamış.
2015 yılında yayınlanan podcast sayısı 51 bin 144 iken 2019 yılında 318 bin 517 oldu. 2020’de ise neredeyse 3 kat artarak podcast sayısı 885 bin 262’ye ulaştı. Ama esas patlama pandeminin en yoğun yaşandığı günler olan 2021 ve 2022’de gerçekleşti. www.podcastindex.com’un son verisine göre yayınlanan podcast sayısı Mayıs 2022’de 4 milyon 113 bini aşmış durumda.
Türkiye’ye ilişkin henüz kapsamlı bir araştırma ve rapor yok, ama podcast’e yönelik ilgi İngiltere, AB ülkeleri, Avustralya, Yeni Zelanda, Kanada, Hindistan, hatta Afrika ülkelerinde bile artıyor.
Kapsamlı veriler olmasa da Türkiye’de de son birkaç yılda podcast yayıncı ve yayınlarında büyük bir artış olduğunu görüyoruz. Bağımsız yayıncıların yanı sıra, sayıları her geçen gün çoğalan kurumlar, STK’lar, şirketler de kendi podcast’lerini başlatarak bu yeni mecraya adım atıyorlar. Yine podcast odaklı girişimler, işler ve meslekler de çoğalıyor.
PODCAST’E BAŞLAMAK KOLAYLAŞTI
Peki neden? Bu ilgiyi tetikleyen ne oldu?
Kuşkusuz bu yükselişin arkasında birden fazla güçlü neden var.
Bir önceki yazımda da aktardığım gibi aslında podcast 2004 yılından beri hayatımızda yer alıyor.
Ama 2019 yılından itibaren podcast alanında yaşanan patlamada en büyük etkiyi Spotify’ın bu alana büyük yatırım yapması oldu. Podcast, deyim yerindeyse Apple’ın hakimiyetinde ve himayesinde kendi halinde kapalı bir ekosistem yapısında ilerliyordu. Ancak Spotify kapısını açınca hem milyonlarca kullanıcısına podcast sundu hem de Apple ekosisteminin dışındaki dünyaya da ulaştırarak kapsama ve erişim alanını büyüttü.
Spotify’ın bu atılımı Apple’ı da kış uykusundan uyandırdı ve Apple Podcasts 2021’de yeni yatırımlarla altyapısını tamamen yeniledi. Spotify’ın ardından Deezer da müziğin yanı sıra podcast’e yöneldi. Büyük çoğunluğu ABD merkezli daha onlarca küçük büyük şirket podcast ekosistemi içerisinde ürün ve hizmet geliştirmeye başladı.
Bu teknoloji yatırımları milyonlarca yeni dinleyiciye erişme olanağı tanıdığı gibi aynı zamanda podcast’e giriş ve başlama eşiğini basitleştirerek içerik geliştirmeyi ve yayınlamayı destekledi. Hatta bugünlerde yaygınlaşmaya başlayan yapay zekâ destekli araçlarla kayıt, düzenleme, yayınlama ve dağıtım sürecini kolayca çözebiliyorsunuz. Bugün itibariyle en büyük zorluğun kişi ve kurumların podcast farkındalığıyla vizyon eksikliği ve strateji geliştirememe olduğunu söyleyebiliriz.
SOSYAL MEDYA KARMAŞASINDAN KAÇIŞ
Bu teknik nedenin dışında önemli bir başka neden de sosyal medya platformlarının odağında olduğu dijital iletişim alanında yaşanan kargaşa, milyonlarca mesaj arasında kullanıcıların zihinsel olarak giderek yorulması ve platformlardan kaçışın hızlanması bir anda yeni bir mecra olarak “sesi” cazibe merkezi haline getirdi.
Yayıncı ile dinleyici arasında kurulan sakin “iletişim” ve “ilişki” sosyal medyanın karmaşasının ardından birçok kişinin podcast’i keşif sürecini hızlandırdı. Mobil yaşamın kökleştiği bir süreçte radyoyu bilen ve alışkın olanlar için “indirilebilen” ve “isteğe bağlı” ses dosyaları yeni ve benzersiz bir fırsat sundu; podcast’ler bilgi edinmenin, eğlenmenin yeni mecrası olmaya başladı.
Podcast’i keşfeden kuşkusuz yalnızca “dinleyiciler” olmadı. “Sesini” duyurmak isteyen ilgili, istekli olan herkes ve her kurum içerik geliştirerek bu yeni mecrada yer almaya, bu kitlelere ulaşmaya çalıştılar. Radyoda olduğu gibi bir “onay” mekanizmasının ortadan kalkması, isteyen herkesin programını (podcast’ini) kaydedip birkaç adımda kendi özgür iradesiyle hemen yayınlayabilmesi potansiyel olarak herkesi yayıncı, herkesi dinleyici haline getirdi.
PODCAST’İN YARATTIĞI ETKİ
Podcast’i yeni odak haline getiren nedenlerden birisi de sunulan içeriğin dinleyici tarafından yüksek oranda algılanması, alınması. Bir dinleyici ilgi duyduğu, sevdiği bir podcast’in “oynat” butonuna bastığında, sunulan mesajla bir Facebook, Twitter paylaşımıyla karşılaşmasının ötesinde bir iletişim kurabiliyor. Birçok araştırmanın da gösterdiği gibi kulağına konuk olduğunuz dinleyici podcast’te aktarılan içeriğin(mesajın) yüzde 70-80’den fazlasını algılıyor, düşünüyor, heyecanlanıyor. Bu, belki de hiçbir dijital mecranın sunamayacağı muhteşem bir olanak. Bu konuda farkındalığı artan kişi ve kurumlar hedef kitlelerine ulaşabilmek ve özgün içerikler geliştirebilmek için daha fazla kafa yormaya başladılar.
Sosyal medyada olduğu gibi milyonlarla, hatta yüzbinlerle kurulan bir iletişim yerine podcast aracılığıyla binlerle, hatta bazen yüzlerce kişiyle kurulan iletişim, ilişki şekli daha “değerli” oldu. Arzu, istek, heyecan, merakla podcast yayınına yönelen dinleyicinin, yayıncıyla kurduğu ilişki şekli kargaşadan uzak, daha kaliteli, seçkin bir zemin oluşturdu.
PODCAST’TE SINIR HEDEFLERİNİZ VE HAYALLERİNİZ
Podcast’e ilginin artmasında bir başka neden de, yazı, video gibi iletişim araçlarına göre sesi tüketmenin daha kolay olması, mobil yaşamın içerisine insanlara esneklik ve süreklilik sunması. Podcast’i “nerede, ne zaman ve nasıl” istiyorsanız öyle dinleyebilirsiniz. Kontrol tamamen sizde. Bu yüzden özellikle Z kuşağı ve onlara yakın kuşaklar arasında podcast çok daha fazla ilgi görüyor.
“Podcast nedir?” sorusuna teknik olarak daha net ve sınırlı bir yanıt vermek mümkün olsa da, “hangi içeriğin podcast olduğu” konusunda verebileceğimiz tek yanıt, “hayallerin sınırı” olabilir. Belirli bir hedef kitle için sesi kullanarak yaratmak istediğiniz her türlü içerik sizin podcast’iniz olabilir. Ses dosyanızı kaydedersiniz, düzenlersiniz (prodüksiyon), sunucuya yüklersiniz ve Spotify, Apple Podcasts gibi onlarca dinleme platformuna dağıtırsınız. Hepsi bu! Eğer akademideyseniz bu bir ders içeriği olabilir, bir haber bülteni olabilir, bir eğlence kaydı olabilir, bir yarışma olabilir, bir eğitim kursu olabilir, şirket içi bir İK yayını olabilir, tiyatro olabilir ve daha birçok şey olabilir. Siz “ses” ile ne hedeflerseniz, ne yapmak isterseniz podcast odur. Yeter ki, seçtiğiniz hedef kitleniz için dinlemeye “değer” bir içerik sunsun. Tek engel, “hedefleriniz ve hayallerinizin” sınırı.
Açıkçası podcast’in bu yönüne ilişkin farkındalık, tasarım ve yaratım süreci henüz gelişme aşamasında. Geleneksel kültürel davranış ve kalıpların ötesine geçmek akşamdan sabaha olmuyor. Ama podcast’e yönelimin güçlenmesini sağlayan nedenlerden birisi de bu. Her kişi ve kurum için içerik keşif yolculuğu sürüyor.
PODCAST GELİR MODELLERİ İLGİYİ DESTEKLİYOR
Podcast’in bu hızlı yükselişini destekleyen bir başka etken de, artan dinleyici ve yayıncı sayısına paralel olarak gelir model ve kaynaklarının da oluşmaya ve gelişmeye başlamış olması. Özellikle podcast reklamlarında da son birkaç yılda büyük artış oldu. Yine birkaç gün önce yayınlanan 6. IAB ABD Podcast Reklam Geliri Raporu’na göre, ABD podcast reklam geliri büyümesi 2021’de çarpıcı bir şekilde arttı ve 1.4 milyar dolara ulaştı. Bu rakamın 2022 sonunda 2 milyar doları aşması, 2024’te ise 4,2 milyar dolara ulaşması bekleniyor. Türkiye’de henüz podcast reklamcılığına ilişkin kayda değer veriler oluşmamış olsa da, yayın ve yayıncı sayısının artışına bağlı olarak podcast reklamcılığının da gelişeceği açık. Yine sponsorluk anlaşmaları, markalı podcast yayınları, Spotify ve Apple Podcast’in öncülük ettiği podcast abonelik modeli, Patreon gibi platformlar üzerinden gerçekleşen dinleyici bağışları gibi farklı gelir modelleri de yine yaygınlaşıyor.
Özetle, tüm bu etkenler birlikte çarpan etkisi yaratarak podcast ekosistemini tüm boyutlarıyla büyütüyor. Bundan sonraki sürecin ve gelişimin bir parçası teknoloji geliştirme ve altyapıyla ilgili olmaya devam edecek. Önceki yazımızda da söz ettiğimiz gibi güçlü bir olasılıkla, podcast yayıncılığı giderek ses ve videonun karışımıyla hibrit bir yapıya doğru evrilecek. Ancak podcast yayıncılığının esas gelişimini “içerik kalitesi ve değeri” belirleyecek. İnsanlara (hedef kitlelere), 10 dakika, 20 dakika ya da 60 dakika boyunca o yayını dinlemekten kaçınamayacakları içerikler üreten ve istikrarlı biçimde sunan podcast’ler ilgi görmeye devam edecek. Bunların sayısının artış oranı da gelişimin hızını ve mesafesini belirleyecek.
NOT: Bu yazı ilk olarak Gazete Duvar‘da yayınlanmıştır.
Beğenebilirsin
Haberler
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.
Yayınlanma tarihi
13 saat önce=>
27 Mart 2025YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.
Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.
Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.
Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”
YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.
YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.
Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.
Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.
Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.
Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.
(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)
Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.
Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.
YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.
Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.
Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.
Kaynak: Max Tani / Semafor
Haberler
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
Yayınlanma tarihi
3 gün önce=>
25 Mart 2025OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.
OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.
ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.
Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.
Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.
Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.
Kaynak: TechCrunch
Haberler
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.
Yayınlanma tarihi
7 gün önce=>
21 Mart 2025OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.
OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.
Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.
OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.
İşte “gerçek suç tarzı”, yıpranmış bir ses:
OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.
Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.
OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.
Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.
Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.
Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.
OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.
OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.
GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.
Kaynak: TechCrunch
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Haberler2 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik1 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı
- Araştırma7 ay önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor