Bizimle iletişime geçin

Haberler

Spotify’ın yaratıcılar için etkileri

Sounds Profitable’da Bryan Barletta, Spotify for Creators’ın videoya geçişinin ince ayrıntılarını yazdı ve bunu “podcasting için bir uyandırma çağrısı” olarak nitelendirerek video yükleyerek kaybedebileceğiniz para kazanma seçeneklerinin altını çizdi.

Yayınlanma tarihi

on

Spotify, geçtiğimiz hafta Los Angeles’ta düzenlenen ve hem video podcasting hem de video yaratıcılarının önde gelen isimleriyle dolu bir izleyici kitlesinin katıldığı bir etkinlikte büyük bir duyuru yaptı. Etkinliğin odak noktası, Spotify Premium abonelerine dinamik olarak eklenen reklamsız bir video deneyimi ve nitelikli içerik oluşturuculara gelirden pay sağlayan Spotify İş Ortağı Programına yapılan en son eklemeydi. Ayrıca eski adı Anchor olan Spotify for Podcasters’ın adını Spotify for Creators olarak değiştirdiler.

Her ikisi de etkinliğe katılan Bloomberg’den Ashley Carman ve Podnews’ten James Cridland‘ın bu etkinlikle ilgili haberlerinden inanılmaz etkilendim. Yaptıkları haberlerin bir kısmını tekrar anlatacak olsam da, her şeye değinmeyeceğim ve çalışmalarını okumak için zaman ayırmanızı tavsiye ederim.

Bu program Spotify’ın video girişiminin ne olacağını gerçekten sağlamlaştırıyor ve ana gelir kaynağı olan Premium abonelikleri iki katına çıkardığına işaret ediyor. Spotify’ın platformu “Spotify for Creators” olarak değiştirmesi ve video ve seste RSS dağıtımına meydan okumasını Spotify’ın Podcasting’e öncelik vermemesi olarak görmek kolay olsa da, bu duyuru (çoğumuz) için değildi. Bu, video içerik oluşturucularına Spotify’ın artık onlara açık olduğunu ve yalnızca sesli bir sürüm oluşturma zorunluluğu olmadığını söyleyen, kuma çakılmış bir bayraktı.

İnce Detaylar

Dikkatinizi çekmek istediğim son derece önemli dört ayrıntı var.

Birincisi, Spotify’a bir video podcast yüklediğinizde, Spotify uygulamasını kullanan izleyicileriniz için RSS beslemesinin veya sesli podcast’inizin hiçbir yönü çağrılmayacak. Spotify tarafından barındırılan bu önbelleğe alınmış dosya, Spotify tüketicileri için, programınızı izliyor veya dinliyor olmalarından bağımsız olarak sorunsuz bir şekilde oynatılıyor. O bölümün her bir oynatımı artık bir video.

Bu da Spotify’daki izleyiciler için tamamen bir kayıp anlamına geliyor:

  • IAB Onaylı İndirmeler ve İletilen Reklam ölçümü
  • Analitik veya ilişkilendirme ön eki URL’leri ve Reklam Dağıtımı takibini tetikleme yeteneği
  • Günlük düzeyinde veriler veya barındırma platformunuzdaki herhangi bir raporlama
  • Hosting platformunuzdan dinamik olarak eklenen reklamlar
  • Streaming Ad Insertion, uygulama içi sesli reklamlar sunmak için belirli Megaphone yayıncılarına sunuluyor
  • Kendi programatik ilişkilerinizi yönetme yeteneği

İkincisi, Spotify video çözümü olmayan podcast’ler için RSS URL’nizi aramaktan hala çok mutlu olduğu için, YouTube’dan farklı olarak, esas olarak podcast kapak resminin statik görüntüsü olan videoları kabul etmiyor.

Üçüncü olarak, Spotify’daki tüm video podcast’ler Spotify Premium Aboneleri için reklamsız olacak (en azından Spotify tarafından dinamik olarak sunulanlar). Bu, Spotify uygulamasında video podcast’leri tüketen ücretsiz kullanıcılara ve Spotify’da ve Spotify dışında RSS tabanlı bölümleri dinleyenlere Spotify Reklam Ağı reklamları sunmaya devam edecekleri anlamına geliyor, çünkü dinamik reklamlar Megaphone ve Spotify for Creators’da barındırılan RSS ile iletilen podcast’lerde yayınlanmaya devam edecek. Podcast, video envanterine doğrudan kendi dinamik veya akış reklamlarını sunma yeteneğine sahip olmayacak (Hatırlatma: Video dinlemek bu durumda hala videodur).

Spotify, YouTube’da olduğu gibi podcast sunucusu tarafından okunan entegre reklamlara (ya da Spotify’ın deyimiyle sponsorluk) hala izin verildiğini açıkça belirtiyor. Ve sanırım Spotify’ın satış haklarına sahip olmak için oldukça fazla ödeme yaptığı ilişkiler için bazı “Entegre Reklamlar” sattığını göreceğiz. Podcast, Spotify İş Ortağı Programı’na katılmaya hak kazanırsa, ki bu herkese açık nitelikler eskisinden çok daha katı görünüyor, 2 Ocak 2025’ten itibaren reklam almayan Premium aboneler için Premium Video Gelirini paylaşmaya hak kazanacaklar. Bunun nasıl işlediği hala tam olarak açık değil, ancak destek belgelerinde hafifçe tanımlanmış.

Son olarak, bir içerik oluşturucunun Spotify Premium’da podcast’lerinin tüketiminden elde edeceği paydan, bugün kendilerine sunulan dinamik ve akış reklam gelirlerinden daha fazla kazanıp kazanmayacağı konusunda hiçbir fikrimiz yok. Sadece bu karşılaştırmayı bilmiyoruz, aynı zamanda bunun YouTube’daki eşdeğeriyle nasıl karşılaştırılacağı hakkında da hiçbir fikrimiz yok. YouTube’dan daha yüksek bir uygunluk eşiğiyle, hiçbir reklam veya Premium gelirinin ödenmediği bu uygunluk öncesi süre podcast yayıncıları için önemli bir kayıp olabilir.

Podcasting’e (Potansiyel) Etkisi

Podcast yayıncıları podcast’lerini her zaman YouTube’a yükleyebiliyordu, ancak yaklaşık iki yıl önce YouTube, Podcast’lerin platformlarında yaşaması için özel bir alan ayırmaya karar verdi. İlk günden itibaren, bu yükleme tamamen YouTube tarafından önbelleğe alınan bir video dosyasıydı. Bu lansmanda, uygulamalarının kullanıcılarının RSS tabanlı bir podcast eklemelerine izin vermek için desteği genişleterek tüm podcast’lerini tek bir uygulamada tüketmelerini sağladılar. YouTube hiçbir zaman bir RSS podcast’i aramak ve bulmak için bir yol sağlamadı veya belirli bir kullanıcının uygulaması için manuel olarak yüklenmemiş RSS podcast’i aramadı.

Bu konuyu gündeme getirmemin nedeni, YouTube ile ilgili her şeyin hem yeni izleyici kitlesi hem de keşfedilebilirlik açısından katkı sağlamasıdır. Crooked Media ile birlikte sunduğumuz son araştırmamız, Audio Primaries’in %48’inin Youtube’da izledikleri değil dinledikleri yeni podcast’leri keşfettiğini vurguluyor. Podcast’leri YouTube’a yükleme sürecinde podcast’iniz için hiçbir indirme talebi zarar görmedi.

Aynı şey Spotify için söylenemez. Teknik ve kullanıcı deneyimi açısından mantıklı: İzlemek ve dinlemek arasında geçiş yapmak için dosyanın tamamen aynı olması gerekiyor. Spotify pek çok büyük yayıncı için ciddi bir indirilme oranına sahip, yani bu etki önemsiz değil ve muhtemelen bir podcast’in tüketiminin %50’sinin veya daha azının RSS beslemesinde gerçekleşmesine neden olabilir.

Kısa bir not: Bir şeyi dar parametrelerle tanımlamak tek bir amaca ulaşır; büyüme kapasitesini sınırlamak. Bir podcast’in ne olduğunu tanımlama fikri (sadece en ilgi çekici sesli materyal biçiminden daha fazlası) her kanalda sektörümüzün büyümeye devam etme kapasitesini sınırlar. RSS olmaması onu podcast olmaktan çıkarmaz ve daha da önemlisi, podcast’inizi duvarlarla çevrili bir bahçe çözümüne yükleme seçeneğine sahip olmak aslında açık dağıtımdır.

Bu değişiklik önemsiz değil çünkü sektörümüzün destek vermediği bir yöne doğru gidiyor. Bir podcast’in sunucu tarafından okunan entegre reklamları satmasına ve yönetmesine yardımcı olacak çok az araç mevcut. Entegre reklamlar da hem satış hem de operasyonel açıdan pek çok podcast’in uzaklaştığı bir şey ve bir bölümün yayına girmesi için kesin bir son tarihle satış yapmak farklı bir düşünce tarzı. Bu bölümler reklamsız olarak yüklendiğinde, envanter yok olur. Raporlama ve ilişkilendirme konusunda reklamverenlerle nihayet bir rahatlık seviyesine ulaştığımızı ve bunların hepsinin bu yeni ortama uyum sağlaması gerekeceğini söylemeye gerek bile yok.

Tüm bunlar ve biraz daha fazlası, bu yolu seçen herhangi bir podcast için kesinlikle doğrudur, ancak sektörün genel olarak bu şekilde ilerleyeceğine ikna olmadım. Ve daha da önemlisi, bu duyurunun bizim için olduğuna ikna olmadım.

Spotify Zamanınızın Daha Fazlasını İstiyor

Bu makaleyi yazdığım sırada Spotify’da en çok dinlenen 19. podcast, Markiplier’ın PowerWash Simulator oynadığı, Apple Podcasts’te bulamadığım ama YouTube’da bulduğum bir video podcast.

Podcasting popüler bir kelime ve pek çok kişi onu sıkı bir şekilde tanımlamaya çalışsa da, giderek daha fazla insan RSS beslemesine sahip olmadan podcast tüketiyor. YouTube’daki podcast’leri keşfetmek göz açıcı, milyonlarca görüntüleme alan (bazı durumlarda 24 saatten kısa sürede) ancak ses odaklı Podcast uygulamalarında hiç yer almayan ya da başlangıçta bir RSS beslemesi bile olmayan podcast’ler. Podcast’lerin YouTube’da bir yuvaya sahip olduğunun duyurulması sektörümüze orada olma daveti olduğu kadar, video içeriğinin kendisini podcast olarak adlandırması ve iyi ya da kötü bu heyecandan yararlanması için de bir fırsattı.

Az önce sunduğumuz araştırmaya dönüp baktığımızda, benim için en çok iki şey öne çıkıyor:

  1. Podcast tüketicilerinin %49’u YouTube’da geçen yıla kıyasla daha fazla zaman geçiriyor
  2. Video Primes, Audio Primes’a göre çok daha fazla içerik tüketiyor

YouTube Premium ve YouTube Music’in toplam ücretli abone hacminin 2 katına sahip olan Spotify, kullanıcılarını YouTube Music ya da Apple Music’e kaptırmayacağından emin görünüyor ve tüm büyük video içerik oluşturucularını Spotify’a çekme hamlesi işe yararsa YouTube’dakilerin Spotify’da daha fazla zaman geçirmesini sağlamaya çalışıyor.

Sonuç

Edison Research’ün Q3 2024 Top 50 Podcast raporuna göre bugün, en iyi 50 Podcast’ten 33’ünün YouTube’da video podcast’i var. Bunlardan dokuzunun videolarında yalnızca statik görseller yer alırken, Spotify’da halihazırda videoları bulunan beşi de dahil olmak üzere geri kalan 24’ünün YouTube’da tam video podcast’leri bulunuyor.

Hâlihazırda video yayınlayanların bu alana girmeyi tercih etmelerinin sağlayacağı finansal fayda ve izleyici kitlesini artırma potansiyeli çok büyük olmadıkça, bu duyurunun sektörümüzü YouTube’un alana girişinden daha fazla altüst etmesini beklemiyorum. En iyi podcast’lerin çoğunun Spotify’da sahip olduğu kitlenin büyüklüğü nedeniyle Spotify’da oynatılan tüm bölümler için dinamik reklam ekleme özelliğini kaybetmek önemsiz bir seçim değil.

Reklamcılığın Spotify için bir öncelik olmadığı çok açık olsa da, özellikle de etkinlikte bu konuda ne kadar olumsuz konuştuklarına bakılırsa, büyük podcast yayıncılarının çoğu bir gecede bu düğmeyi çevirirse, Spotify Premium’a abone olan kitlenin kaybı nedeniyle Spotify Reklam Ağı’nın değeri büyük ölçüde azalacaktır. Spotify’da ödeme yapan kullanıcılara reklam verebilmelerinin tek yolu bu olduğundan, reklamverenlerin kitlesel göçünü önlemek için fiyat tabanını düşürmelerinin ve programatik pazarlarını kurmalarının ardında bu kararın önemli bir faktör olduğuna inanıyorum. YouTube’da olduğu gibi Spotify’da da aynı veya benzer bir benimseme gerçekleşirse, Spotify Premium kullanıcılarından oluşan geniş kitlelere sahip olanlara dinamik reklamlar sunmak için hala çok sayıda ses envanterine sahip olacaklar.

Bu duyuru podcast yayıncılığı için bir uyanış çağrısıdır. Bu yolda ilerleyecek yayıncıları destekleyecek sağlam çözümlerden yoksunuz. Raporlamadan operasyonlara ve entegre reklam çözümlerine kadar. Sektörümüz büyüyor, belki daha önce gördüğümüz katlarda ya da hepimizin aradığı çıkışlarla değil ama yıldan yıla istikrarlı ve tutarlı bir büyüme. Dolayısıyla, genişlemenin zorluğundan yakınan tüm bireyler ve şirketler için, işte isabet listeniz. Bir sonraki girişiminiz ya da şirketinizin genişleme yolu.

Kaynak: Bryan Barletta / Sounds Profitable

Haberler

YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor

Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.

Yayınlanma tarihi

=>

YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.

Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.

Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.

Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”

YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.

YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.

Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.

Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.

Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.

Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.

(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)

Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.

Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.

YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.

Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.

Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.

Kaynak: Max Tani / Semafor

Okumaya devam et

Haberler

OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

Yayınlanma tarihi

=>

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.

OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.

ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.

Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.

Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.

Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.

Kaynak: TechCrunch

Okumaya devam et

Haberler

OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı

OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.

Yayınlanma tarihi

=>

OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.

OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.

Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.

OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.

İşte “gerçek suç tarzı”, yıpranmış bir ses:

OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.

Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.

OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.

Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.

Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.

Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.

OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.

OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.

GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.

Kaynak: TechCrunch

Okumaya devam et

En son