Haberler
Podcast’inizi neden sesli arama için optimize etmelisiniz ve nasıl yapabilirsiniz?
Podcast’iniz için sağlam bir SEO stratejiniz olsa da onu sesli arama için optimize ettiniz mi? Çünkü bu farklı bir yaklaşım gerektiriyor. Podcasting için sesli aramanın neden bu kadar önemli olduğuna ve bunu desteklemek için SEO stratejinizi nasıl optimize edebileceğinize bir göz atalım.
Yayınlanma tarihi
1 yıl önceon
Yazar :
Podcast TurkeyTamamen sesimizi kullanmaya dayanan bir sektör için sesli arama hakkında pek konuşmuyoruz.
Akıllı hoparlörün ortaya çıkışından bu yana (yaklaşık 2014), sesli aramanın insanların çevrimiçi bilgi bulma şekli üzerinde büyük bir etkisi oldu.
On yıl önce, “Hey Google, bana balkabaklı baharatlı lattelerin sömürge tarihi hakkındaki şu Blindboy podcast bölümünü çal ” diye bağırmayı asla hayal edemezdiniz ve bu gerçekten işe yarıyordu.
Ama günümüzde işe yarıyor. Ve teknoloji her geçen gün daha akıllı hale geliyor.
Podcast’iniz için sağlam bir SEO stratejiniz olsa da onu sesli arama için optimize ettiniz mi? Çünkü bu farklı bir yaklaşım gerektiriyor.
Podcasting için sesli aramanın neden bu kadar önemli olduğuna ve bunu desteklemek için SEO stratejinizi nasıl optimize edebileceğinize bir göz atalım.
Podcasting’de Sesli Arama Neden Önemli?
Podcast yayıncıları olarak izleyicilerimiz ses tutkunlarından oluşuyor, bu nedenle bölümlerinizi sesli komutla aranabilir hale getirmeye çalışmak çok mantıklı.
Ancak çoğu zaman bu, unuttuğumuz bir podcast keşif alanıdır. İlgili sorgular için podcast’lerimizi arama motorlarında görünür kılmak için çok zaman harcayacağız, ancak podcast’inizi Siri’yi kullanarak en son ne zaman bulmaya çalıştınız?
Sesli aramanın çok da önemli olmadığını düşünebilirsiniz, ancak 2019’da Google, sesli aramanın tüm aramaların %20’sini oluşturduğunu söylemişti. Bu sayının şimdi daha da yüksek olması muhtemel.
Podcasting’de sesli aramanın önemli olmasının birkaç nedeni:
Sesli arama zaten birçok kişi için norm haline geldi
Sesli komut kullanmak , Alfa Kuşağı dinleyicileri (13 yaş altı) için zaten çok normal . Aslında bu nesil daha okuma yazma bile bilmeden internette arama yapıyor.
Bir anlığına bunun içinize sinmesine izin verin.
Sesli arama geçici bir moda değil, bu nesil (ve birçok Z kuşağı dinleyicisi) için bir norm haline geldi ve Alfa Kuşağı büyüdükçe daha yaygın hale gelecek. Podcast’inizi sesli arama için ne kadar çabuk optimize ederseniz, podcast’iniz bu büyüyen ve büyük ölçüde kullanılmayan dinleyici demografisi için o kadar görünür olacak.
Yapay zeka asistanları aramanın geleceğidir
OpenAI’nin ChatGPT’si gibi yapay zeka asistanları gerçekten gelişmiş sesli arama işlevlerine sahip. Birçoğu, bu tür yapay zeka araçlarının, çevrimiçi bilgi bulmada başvurulacak yöntem olarak eninde sonunda arama motorlarını geride bırakacağını öngörüyor.
Bu değişim gerçekleştiğinde, dinleyiciler şu anda olduğu gibi ‘beslenme podcast artriti’ gibi basit arama anahtar kelimeleri kullanmak yerine, botlardan podcast’leri çok sohbetli bir şekilde önermelerini isteyecekler.
Akıllı hoparlör sahipliği büyük oranda arttı
Edison’un sonsuz arama raporu, ABD’de akıllı hoparlör sahipliğinin 2017’de sadece %7’den 2023’te %36’ya çıktığını gösterdi. Bu, yalnızca ABD’de 100 milyondan fazla kişinin akıllı hoparlöre sahip olduğu anlamına geliyor.
Ancak insanların sesli arama için kullandıkları yalnızca akıllı hoparlörler değil. Podcast’leri dinlemek için akıllı telefonlarımızı, Apple saatlerimizi ve Carplay’i de kullanıyoruz. Bu kolaylık ve kolaylık çağında devam ettikçe sesli komutları yalnızca daha fazla kullanacağız.
İnsanlar hareket halindeyken podcast’leri dinliyor
Podcast dinlemenin en büyük avantajlarından biri, okuma veya TV izlemenin aksine, dinlerken birden fazla görevi gerçekleştirebilmeniz.
Dinleyiciler açıkça hareket halindeyken eğlenmek istiyorlar. Yakın zamanda yapılan bir YouGov anketi, podcast dinlemek için en popüler üç zamanın egzersiz (%29), günlük işe gidip gelme (%42) ve ev işi (%49) sırasında olduğunu gösterdi.
Başka bir çalışma, düzenli podcast dinleyicilerinin %49’unun araba kullanırken dinlediğini gösterdi.
Koşudaysanız veya arabanızla işe gidiyorsanız ve dinlediğiniz bir bölüm biterse, bir sonraki bölümü manuel olarak aramak büyük bir rahatsızlık yaratır, hatta tehlikeli (ve bazı durumlarda yasa dışıdır).
Artık podcast’inizi sesli arama için optimize etmenin podcasting’de neden hayati önem taşıdığına dair temel bilgiye sahipsiniz… bunu gerçekte nasıl yapıyorsunuz?
Podcast’inizi Sesli Arama İçin Nasıl Optimize Edebilirsiniz?
İşte başlamanıza yardımcı olacak bazı taktikler.
Bölüm başlıklarınızdaki sorunları çözün
Sesli aramadan bahsetsek de konuşmasak da, içeriğinizle ilgili sorunları çözmek harika bir SEO stratejisidir. Ancak sesli arama için problem çözme açısından düşünmek daha da etkilidir çünkü insanlar sesli komutları bu şekilde kullanırlar.
Örneğin, Friends’in ölmesiyle ilgili Chandler hakkındaki bir podcast bölümünü bulmak için akıllı bir hoparlör kullanıyorsanız, “Bul” yerine “Bana Matthew Perry’nin nasıl öldüğüyle ilgili bir podcast bul ” (SEO anahtar kelimesi kalın harflerle yazılmıştır) gibi bir şeye gidersiniz. podcast Matthew Perry’nin ölümü”, Google’a yazıyor olsaydınız muhtemelen yapacağınız gibi.
Sesli arama (şaşırtıcı olmayan bir şekilde) normal aramaya göre çok daha fazla konuşmaya dayalıdır. Ve harika olan şey, SEO için optimizasyon yapmanın, kulağa doğal olmayan anahtar kelimeler eklemeye çalışmaktan çok daha güzel bir yol olması.
Bu nedenle, ilgili hedef kitlenin ne tür niş sorunları veya soruları olacağını öğrenmek için araştırmanızı yapın. Ardından, podcast’inizin bu sorulara yanıt sağladığını açıkça belirten bölüm başlıkları ve açıklamaları oluşturabilirsiniz.
SEO anahtar kelimelerinizle çok stratejik olun
Tüm SEO stratejilerinde olduğu gibi, ses için optimizasyon yaparken anahtar kelime araştırmanızı yapmak istersiniz. Ancak sesli aramada, normalde normal SEO’da düşünmeniz gerekmeyen, dikkate almanız gereken birkaç ekstra şey var.
Örneğin, başlığınızda telaffuzu (veya deşifre edilmesi) zor olan bir kelime veya terim var mı? Bir yapay zeka asistanı bunu yanlış anlayabilir mi veya araştırmacının ne söylediğini bilmiyor olabilir mi?
Geçtiğimiz günlerde The Podcast Host’taki Lindsay bana podcast’i ‘Jarnsaxa Rising’de karşılaştığı bir zorluktan bahsetti:
“Jarnsaxa” Norveççe “demir bıçak” anlamına gelen bir kelimedir ve İskandinav mitolojisindeki Jotun devinin adıdır. Geçmişte fragman takası yaptığımızda, insanlar başlığı duyuyor ama yazılı olarak görmüyorlar, bu yüzden aramaya çalıştıklarında örgü podcast’lerini buluyorlar, yani “iplik” + “çoraplar.” Ancak podcast, Apple Podcast listelerinde ilk kez görünmeye başladığında, İspanyolca konuşulan ülkelerde”j” harfinin “ya” sesi olarak telaffuz edildiği ülkelerde listelendi.
Lindsay, Jarnsaxa Rising’in yaratıcısı
Bu nedenle, bu tür kelimeleri ve dinleyicilerin söylemesini ve ses kontrollü cihazların anlamasını kolaylaştıracak alternatif anahtar kelimeler sağlayıp sağlayamayacağınızı düşünmeye değer.
Bölüm verilerini eksik etmeyin
Bir podcast bölümü yayınlamak üzereyken, bölüm verilerinin tuhaf kısmını atlayabileceğinizi düşünebilirsiniz. İnsanlar gerçekten program notlarınızı okuyor mu? Konuk biyografisi bu kadar önemli mi?
Ancak bu, açıklamalarınızı, ev sahibi ve konuk biyografilerinizi, kategorilerinizi ve etiketlerinizi eksik bırakabileceğiniz anlamına gelmez. Bunların hepsi arama motorlarının podcast’inizin alakalı olduğuna karar vermesine yardımcı olacak veriler.
Notları göster, podcast’lerinizi yalnızca daha erişilebilir hale getirmekle kalmaz, aynı zamanda keşfedilebilir de kılar. Gösteri notlarınız, sesli arama yapanların podcast içeriğinizi bulmasına yardımcı olacak tüm önemli SEO anahtar kelimelerini bir araya getirmek için mükemmel bir fırsat.
Gösteriniz sırasında anahtar kelimelerinizden de bahsetmeyi unutmayın. Bölüm web sayfalarınıza yapay zeka tarafından oluşturulan transkriptleri ekliyorsanız (bu konuya daha sonra değineceğiz), bu, anahtar kelimelerinizin sayfada görünmesi için başka bir fırsat yaratır; bu yalnızca yazılı içerikle ilgili değil.
Başlıkları ve açıklamaları net ve kısa tutun
Benzer şekilde, podcast meta verilerinizde kulağa akıllıca gelen bölüm başlıklarından ve çok ayrıntılı olan herhangi bir şeyden kaçınmak iyi bir fikir.
Kelime oyunları kulağa sevimli gelebilir ancak podcast’inizi organik olarak büyütmenize yardımcı olmayacaklar. Aklınıza takılan uydurma kelimeler mi var? Güçlü bir hayır.
Eğer dille oynamaktan hoşlanıyorsanız ve bu bir podcast yayıncısı olarak kimliğinizin bir parçasıysa, bunu değiştirmeyin. Ancak podcast başlıklarınız ve açıklamalarınız bunun yeri değil.
Tekrar ediyorum, insanların nasıl arama yapacağını düşünün. Belirsiz, uydurma kelimeler veya uzun, karmaşık ifadeler kullanmak, podcast’inizin hiçbir yerde görünmesini sağlamaz.
Her bölüm için bir web sayfası oluşturun
Pek çok podcast web sitesi, tek bir web sayfasında birden fazla bölümü barındıracak veya sezon başına bir web sayfası oluşturacaktır. Pratik olarak bu mantıklıdır, ancak düşündüğünüzde keşfedilebilirlik açısından pek de iyi olmadığını görürsünüz.
Her bölüm için özel bir web sayfası oluşturmak, kullanıcıya “Bu, aradığınız podcast sayfasıdır” diyen birçok tabela bırakma fırsatı verir. Her bir web sayfasında, sayfa içi SEO anahtar kelimelerinizi artırmak ve insanlara aradıkları bilgiyi vermek için başlığınız, açıklamanız, gösteri notlarınız ve hatta tam bir transkriptiniz olacaktır. Bir sayfada birden fazla bölümün olması bu fırsatı kaçırdığınız anlamına gelir.
Ve eğer bu sayfalar için içerik oluşturmaya zamanınız olmadığından endişeleniyorsanız, işte bu noktada chatGPT gibi yapay zeka araçları bir podcast yayıncısının en iyi dostudur.
Podcast web sitenizi mobil optimize edin
Bu makalenin başlarında da değindiğim gibi sesli arama, akıllı konuşmacı etkinliğiyle sınırlı değildir. İnsanlar ayrıca sesli arama için akıllı telefonlar, akıllı saatler ve eller serbest carplay cihazları gibi cihazları da çok kullanıyor.
Dolayısıyla, podcast web siteniz mobil cihazlar için optimize edilmemişse, bunun sesli arama SEO’nuz üzerinde oldukça büyük bir etkisi olacaktır. Sayfa hızı ve tasarım gibi şeyler mobil optimizasyon için çok önemlidir. Podcast web sitenizin mobil cihazlar için ne kadar iyi optimize edildiğini Google Search Console’u kullanarak test edebilir veya bu Google sayfasındaki düğmeyi tıklayabilirsiniz.
Tüm arama motorları için optimize edin
Birçok kişi için Google = SEO olması şaşırtıcı değil. Google çok büyük. Ama bu Facebook = sosyal medya demek gibi bir şey.
Gerçek şu ki, Google piyasadaki birçok arama motorundan sadece bir tanesidir ve dinleyicinin hangi akıllı hoparlör cihazını kullandığı, hangi arama motorunun kullanıldığını belirleyecektir.
Örneğin Siri (Apple) Google’ı, Alexa Bing’i kullanıyor. Podcast’inizin Bing’de nasıl sıralandığını görmek için en son ne zaman arama yaptınız? Ayrıca ChatGPT’nin yeni entegrasyonu Bing ile Gözat’ın, bu arama motorunun gelecekte çok daha fazla kullanılacağı anlamına geldiğini de belirtmekte fayda var. Ancak ne olursa olsun podcast’inizin yalnızca Google için değil tüm arama motorları için optimize edildiğinden emin olmak istersiniz.
SEO ile ilgili her şeyde olduğu gibi podcast’inizi sesli arama için optimize etmek hızlı bir kazanç değildir. Ancak podcast yayıncılarının görünürlük ve keşfedilebilirlik konularını düşünürken sesli aramayı akılda tutması çok önemli.
Sesli aramanın hiçbir yere gitmesi mümkün değil; dolayısıyla içeriğinizi bu tür aramalar için ne kadar erken optimize ederseniz, bundan o kadar hızlı yararlanabilirsiniz.
Kaynak: Katie Paterson / The Podcast Host
Beğenebilirsin
Haberler
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.
Yayınlanma tarihi
18 saat önce=>
27 Mart 2025YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.
Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.
Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.
Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”
YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.
YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.
Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.
Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.
Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.
Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.
(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)
Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.
Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.
YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.
Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.
Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.
Kaynak: Max Tani / Semafor
Haberler
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
Yayınlanma tarihi
3 gün önce=>
25 Mart 2025OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.
OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.
OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.
ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.
Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.
Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.
Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.
Kaynak: TechCrunch
Haberler
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.
Yayınlanma tarihi
1 hafta önce=>
21 Mart 2025OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.
OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.
Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.
OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.
İşte “gerçek suç tarzı”, yıpranmış bir ses:
OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.
Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.
OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.
Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.
Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.
Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.
OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.
OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.
GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.
Kaynak: TechCrunch
YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor
OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi
OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Haberler2 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik1 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı
- Araştırma7 ay önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor