Bizimle iletişime geçin

Haberler

Steve Pratt: Dikkat nasıl kazanılır ve korunur?

Bugün olabileceğiniz en kötü şey ortalama olmak. İster bir restoran, ister bir araba, ister bir kitap, ister bir TV programı veya bir podcast olsun, ortalama olmak ezilmektir; bunun nedeni basit. İnsanlar bir seçeneğe sahip olduğunda, daha iyisini seçerler. Bugün, kategori ne olursa olsun, tüketicilerin birçok seçeneği var. Steve Pratt dikkat çekme konusunda uzman ve bu seçim ikilemini sık sık düşünüyor. Amplifi Media kurucusu Steve Goldstein, podcast yayıncılarının sürdürülebilir büyüme için doğru ilgiyi çekmek ve elde tutmak için kullanmaları gereken stratejiler hakkında Steve Pratt ile bir söyleşi gerçekleştirdi.

Yayınlanma tarihi

on

Bugün olabileceğiniz en kötü şey ortalama olmaktır. İster bir restoran, ister bir araba, ister bir kitap, ister bir TV programı veya bir podcast olsun, ortalama olmak ezilmektir; bunun nedeni basit. İnsanlar bir seçeneğe sahip olduğunda, daha iyisini seçerler. Bugün, kategori ne olursa olsun, tüketicilerin birçok seçeneği var.

Steve Pratt dikkat çekme konusunda uzman; bu seçim ikilemini sık sık düşünüyor. Steve, markalar için orijinal şovlar yaparak podcasting alanında cesurca yeni bir çığır açan ilk markalı podcast içerik ajansı olan Pacific Content‘i kurdu. Steve ve birinci sınıf personeli akıllı ve cesurdu. Steve, markalara, pazarlamacılara, içerik oluşturuculara ve girişimcilere farklılaştırma stratejisi sağlayan Department of Differentiation‘ın kurucu ortağı olarak yoluna devam etti.

Altı yıl önce Amplifi Media & Sound That Brands’ın hala listelerde zirvede olan ulusal bir gıda şirketi adına markalı bir gösteriyi tanıttığı zaman arkadaş olduk. Steve’in yeni kitabı Earn it: Unconventional Strategies for Brave Marketers çıktı ve içerik geliştirmedeki en kritik iki unsur olan farklılaşma ve dikkat çekme konusunda bir ustalık sınıfı sunuyor. Podcast yayıncılarının sürdürülebilir büyüme için doğru ilgiyi çekmek ve elde tutmak için kullanmaları gereken stratejiler hakkında konuşmak üzere bir araya geldik.

Steve Goldstein (SG) – Artık herkesin TikTok beyni var. Zihinlerimizin hızlı kaydırmalı içerikler için yeniden kablolandığı 6 saniyelik bir dünyada yaşıyoruz. Bu, dikkat çekmeyi daha da zorlaştırıyor gibi görünüyor.

Steve Pratt (SP) – Doğru, dikkat çekmek zor. Basit cevap, insanların hoşuna giden ve vakit geçirmekten memnun olacakları şeyler yapmamız gerektiği, insanları rahatsız edip internette onları takip etmek yerine. Ulaşmaya çalıştığınız insanların %99’unu rahatsız etmekten rahatsız olmuyorsanız, başarılı olmak istiyorsanız ilerlemenin tek yolu budur.

SG – Kulağa ideal geliyor ama ikimiz de bunun inanılmaz derecede zor olduğunu biliyoruz.

SP – İnsanlar için gerçek değer yaratmak zor bir iş. Geniş kapsamlı ‘sprey ve dua’ kampanyaları yürütmek kolay, ancak insanların ‘Bu iyi harcanmış bir zamandı’ demesini sağlayacak içerikler oluşturmak çok daha zor.

SG – Bunun için çıta açıkça daha yüksek. Kitapta vasatlığın yeterince iyi olmadığını yazıyorsunuz.

SP – İnsanların zamanını ve dikkatini kazanmak isteyen pazarlamacılar ve içerik yaratıcıları için harekete geçme çağrısı, harika şeyler yapmaktır. Herkesten farklı olan ve tüketici veya dinleyici için benzersiz değer yaratan şeyler, aksi takdirde onların zamanını ve dikkatini alamazsınız.

Kendi alışkanlıklarınızı incelediğinizde, dikkatinizi çeken ve bilerek engellediğiniz şeyleri incelediğinizde, çıtanın ne kadar yükseğe konduğu açıkça ortaya çıkıyor. Dikkatimizi çekmeye çalışan bu kadar çok şey hiç olmamıştı. Tıklama tuzağı başlıklar veya başka bir şey olsun, hepimizin artık çok güçlü filtreleri var ve zamanımızı neye harcayacağımıza karar verirken giderek daha da seçici oluyoruz.

SG – Birçok içerik yaratıcısı ve pazarlamacı, ilgi çekmeyi memnuniyet ve elde tutma ile karıştırıyor. Ben radyo işinden geliyorum. Birkaç yıl önce, New York’taki büyük bir reklam ajansında birkaç kıdemli radyo yöneticisiyle birlikteydim ve ajansın ticari radyoya bakış açısı oldukça aşağılayıcıydı, “Sizler dikkat çekmek için ‘Jello Jumps’ gibi aptalca şeyler yapıyorsunuz.” diyorlardı. Haklıydı. Dikkat çekiyordu, ancak belki de bir marka oluşturmak için doğru tür değildi. Sınıfın soytarısı da dikkat çeker.

SP – Bu yüzden kitabımın başlığındaki “kazanmak” kelimesi çok kasıtlı. Dikkat çekebilirsiniz veya onu yakalayabilirsiniz veya onu akrobasi ve kısa vadeli şeylerle çalabilirsiniz. Bunu bir kez yaparsanız, bir moda veya şaka gibi olur. Kazanılan dikkat farklıdır. Zaman içinde tutarlı bir mükemmellik ve insanlara onlar için değer sunmaya kararlı olduğunuzu gösteren bir geçmiş geliştirmeyi gerektirir.

Dikkat çekmek güvene dönüşür çünkü kendinizi tekrar tekrar kanıtlıyorsunuz. Bu sadece bir kerelik bir şey değil. Güven kazandığınızda, insanlar sizinle ilişki kurmaya ve kim olduğunuzu ve neyi savunduğunuzu anlamaya daha istekli olurlar.

SG – Yani, dikkat çekmek gerçekten uzun vadeli bir oyun. Dikkat çekmekle ilgili.

SP – Evet ve podcaster’lar insanları tutmada harika bir iş çıkarıyorlar. Eğer bu insanların %80 veya %90’ını bir bölüm boyunca yakalayabilirseniz, gezegende bu kadar zaman ve ilgi görebileceğiniz başka bir yer düşünemiyorum. Bir pazarlamacı olduğunuzu ve birinin kapısını çalıp, “Hey, her iki haftada bir gelip oturma odanızda yarım saat takılmamda bir sakınca var mı?” demeniz gerektiğini düşünün. Kimse buna evet demez; ama podcasting söz konusu olduğunda evet derler.

SG – Şimdi yeni sorunlarımız var. Birden fazla platform için içerik oluşturma zorluğunu düşünüyorum, ses, video, TikTok, YouTube Shorts… hepsi.

SP – Kısa biçimli sosyal video, pandemiden beri beni büyülüyor. 30 saniye veya bir dakikada ilgi çekici hikayeler anlatmayı öğrenmek ilginç bir deneyim oldu. Fırsat, her birinin benzersiz güçlü yanlarından yararlanarak farklı platformlarda hikaye anlatmaktır. İnsanlar sizinle nerede bağlantı kurarsa kursun, eğlence veya platforma uyan bilgiler aracılığıyla değer sağlıyorsunuz. Ancak en büyük zorluk, onları bulundukları yerden ayrılmaya ve gitmelerini istediğiniz yere sizi takip etmeye ikna etmektir.

SG – Jerry Seinfeld, günümüzün büyük sorununun kısa dikkat süreleri değil, kaliteli içerik olduğunu söylüyor. “Dikkat süresi diye bir şey yoktur. Sadece izlediğiniz şeyin kalitesi vardır. Dikkat süresi fikrinin tamamı, bence, yanlış bir adlandırmadır. Eğer onları eğlendiriyorsanız, insanların dikkat süreleri sonsuzdur.”

SP – Evet, haklı. Kısa dikkat süreleri değil; kalite. İnsanlar değer verdikleri bir şeye tüm dikkatlerini verirler. Harika bir podcast, Netflix dizisi veya kitap bulduğunuzda, onunla tonlarca zaman geçirirsiniz. Hepimiz gerçekten çok seçiciyiz ve zamanımızı iyi kullandığımızdan emin olmak istiyoruz.

SG – Seinfeld’den bahsetmişken, kitapta George Costanza’dan bahsediyorsunuz ve “tam tersini yapıyorsunuz.” Programcılığımın ilk zamanlarında biri bana, eğer herkes promosyonlarında hızlı konuşuyorsa, kelimeleri ortadan kaldıracağımı ve yavaş konuşacağımı söylemişti.

SP – Tam tersini yapmanın birçok farklı katmanı vardır. Biri, herkesten farklı olmaktır. Popüler olanı kopyalıyorsanız, ikinci, üçüncü, dördüncüyseniz, kimse sizinle vakit geçirmeyecektir. Kimse ortalamayı sevmez. Dikkat çekmek için, alışılmışın dışında olmalı, öne çıkmalı, farklı olmalı ve kendinize özgü bir şey yapmalısınız. Bunu yapmazsanız, çevrimiçi içeriklerin devasa denizine karışırsınız.

SG – Daha fazla para kazanmak için daha fazla içerik üretme konusunda da baskı var.

SP – Reklam destekli bir iş modelindeyseniz, orijinal bir gösteri yapıyor ve para kazanmaya çalışıyorsanız, daha fazla envanteriniz olsun ve daha fazla reklam satabilesiniz diye çok sayıda gösteri yayınlamak ve “her zaman açık” bir gösteri olmak için çok fazla ekonomik baskı vardır. 30 vasat bölümün birikip görmezden gelinmesindense, üç veya dört aylık bir arayla harika bir altı bölümlük sezon geçirmeyi tercih ederim.

SG – Siz ve ben, indirmenin bir dilekten başka bir şey olmadığına inanıyoruz. Anahtar, gerçek dinlemeyi takip etmektir. Ağustos ayında Podcast Movement’taki ” View From The Top ” panelimde eski Pacific Content ortağınız Dan Misener vardı. Dan, doğrulanmış dinleme için davul çalıyor.

SP – İnsanların size verdiği zaman ve ilgiyi ölçmeye geliyor. Tamamlanma oranlarına bakmayı seviyorum. İnsanların gelip, örneklemeye başladığı ve ilk bir veya iki dakikada sürü halinde ayrıldığı tamamlanma oranı grafiklerini görebilirsiniz, bunun sıkıcı olduğunu ve zamanıma ve ilgime değmediğini söylüyorlar. İnsanların zamanının ve dikkatinin nerede harcandığını gösteren bu grafikler, editoryal kalitenin bir göstergesidir. Dikkatlerini çekmiyorsanız gösteri yeterince iyi değildir.

SG – Podcast sektörüne yeni başlayan veya yeni bir şey yapmayı düşünen içerik üreticilerine önerileriniz var mı?

SP – İçerik stratejisi dikkat çekmek için güçlü bir araçtır. Günümüzde, çeşitli platformlarda düzenli olarak harika içerik paylaşmanın önünde hiçbir engel yok. Özellikle podcast’lerde, iyi yapıldığında, bu ortam önemli miktarda zaman ve dikkat çekebilir; genellikle bölüm başına 30 ila 45 dakika veya daha fazla, ki bu diğer formatlarla karşılaştırılamaz.

Az hizmet alan bir topluluğa odaklanmak en etkili içerik stratejilerinden biri olabilir. Daha az rekabetle, kitlenizle derinlemesine etkileşim kurma ve ihtiyaçlarını karşılayan daha az seçenekle olağanüstü bir kaynak olma fırsatınız olur. Bu topluluğa gerçekten hizmet ederek, üyeler arasında bir bağ duygusu yaratırsınız ve onları şovunuzun savunucuları ve elçileri haline getirirsiniz.

SG – Steve, bilgeliğini paylaştığın için teşekkürler. Harikasın. Kitap mükemmel. Sana muazzam başarılar diliyorum.

Kaynak: Steve Goldstein / RainNews

Haberler

YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor

Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.

Yayınlanma tarihi

=>

YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.

Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.

Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.

Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”

YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.

YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.

Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.

Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.

Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.

Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.

(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)

Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.

Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.

YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.

Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.

Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.

Kaynak: Max Tani / Semafor

Okumaya devam et

Haberler

OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

Yayınlanma tarihi

=>

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.

OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.

ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.

Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.

Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.

Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.

Kaynak: TechCrunch

Okumaya devam et

Haberler

OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı

OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.

Yayınlanma tarihi

=>

OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.

OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.

Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.

OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.

İşte “gerçek suç tarzı”, yıpranmış bir ses:

OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.

Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.

OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.

Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.

Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.

Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.

OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.

OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.

GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.

Kaynak: TechCrunch

Okumaya devam et

En son