Bizimle iletişime geçin

Haberler

Amazon canlı radyo uygulaması Amp’yi kullanıma sundu

Amazon, kullanıcıların canlı radyo yayını yapmalarına olanak tanıyan Amp uygulamasını, IOS için sınırlı erişimli beta sürümünü ABD’de piyasaya sürdü.

Yayınlanma tarihi

on

Amazon, kullanıcıların canlı radyo yayını yapmalarına olanak tanıyan Amp uygulamasını, IOS için sınırlı erişimli beta sürümünü ABD’de piyasaya sürdü. Amp ile, içerik oluşturucular on milyonlarca lisanslı şarkıyla kendi şovlarını ücretsiz olarak yapabilecek.

Amazon’un yeni ürünü hakkında Amp Başkan Yardımcısı John Ciancutti ile yapılan söyleşiyi sizlerle paylaşıyoruz:

Amazon, kendi canlı radyo programlarınızı DJ’lik yapmanızı sağlayacak yeni bir uygulama olan Amp’in sınırlı erişimli beta sürümünü piyasaya sürdü. İçerik oluşturucular, Universal Music Group, Sony Music Entertainment, Warner Music Group ve Beggars Group, Believe, CD Baby ve PIAS gibi bağımsız müzik şirketlerinden oluşan uzun bir listeden oluşan on milyonlarca lisanslı şarkı kataloğunu kullanabilecek. İçerik oluşturucular, abonelik, ek donanım veya düzenleme gerekmeden ayrıca topluluklarıyla gerçek zamanlı olarak etkileşim kurabilecek.

“Radyo her zaman müzik ve kültürle ilgili olmuştur” diyen Amp Başkan Yardımcısı John Ciancutti, “Ama bugün ilk kez ortamı icat ettiğinizi hayal edin. İnsanların radyo hakkında sevdiği şeyleri (spontane konuşma, yeni müzik keşfi, farklı kişilikler ve geniş programlama) günümüz teknolojisinin mümkün kıldığı her şeyle birleştirirsiniz. Telefonu, sesi ve müzik sevgisi olan herkesin kendi şovunu yapabilmesini sağlardınız. Ve biz de tam olarak bunu yapıyoruz. Amp, mikrofonu alıp hava dalgalarını çalıştırmanızı mümkün kılıyor. Sonsuz bir program kadranına sahip olacak yeni bir radyo sürümü yaratıyoruz” dedi.

Amp, sektördeki en büyük isimlerden bazılarının yanı sıra herkesin canlı şovlar oluşturabileceği bir marka inşa ediyor. Sınırlı betanın bir parçası olarak Amp, müziğin en büyük isimlerinden bazılarının gelecek programlarının listesini duyuruyor. Hip-hop’un tartışmasız hüküm süren kraliçesi Nicki Minaj, yakında şarkıcı-söz yazarı Tinashe, elektronik sanatçısı ve kemancı Lindsey Stirling’in gelecek şovlarına ek olarak, radyo programı Queen Radio’nun merakla beklenen dönüşünü Amp’e gelecek. Travis Barker, Lil Yachty ve Big Boi; tanınmış isimler Tefi Pessoa ve Nikita Dragun; popüler radyo sunucuları Zach Sang, Kat Corbett, Christian James Hand ve Guy Raz; müzik ve kültür yayını The FADER’dan yazarlar da Amp’de olacak.

Amp Başkan Yardımcısı John Ciancutti, “Beta sürümle, içerik oluşturucular Amp’i, bu yıl içerisinde deneyimleyecekler ve uygulamayı birlikte oluşturmak için gereken geri bildirimi sağlayacaklar” dedi.

Amp kullanımı tamamen ücretsiz olacak. İçerik oluşturuculara programlarını oluştururken kullanabilecekleri on milyonlarca şarkıdan oluşan bir kataloğa erişim ve canlı arayanları programlarına katılmaya davet etme yeteneği sağlanacak. Amp, yerleşik keşif ve bildirimler oluşturacak, böylece dinleyiciler içerik oluşturucuları ve gelecek şovları bulup takip edebilecek. Yayın sahipleri, kimin ve ne zaman konuşacağını kontrol ederek arayanları yayına dahil edebilecek. Gösterilerini önceden planlayıp programlayabilecekler ve şarkıları izleyicileriyle gerçek zamanlı olarak dinleyebilecekler. Gelecekte Amp, Alexa entegrasyonlarıyla sosyal paylaşımlarla dinleyicileri aradıkları içeriği kadranda sunarak içerik oluşturucularla buluşturacak. Böylece yenilikçi yeni arama ve keşif özellikleri de ürüne eklenecek.

Amp’in nasıl çalışacağı ve onu benzersiz kılanın ne olduğu hakkında daha fazla bilgi edinmek için resmi beta lansmanından önce Ciancutti ek olarak şu soruları yanıtladı.

Amp Başkan Yardımcısı John Ciancutti

Amp, içerik oluşturucular için nasıl bir fırsat sunuyor?

Amp ile canlı bir radyo programı oluşturmanız için yeni bir yol oluşturuyoruz. Amp, dinleyicilerin radyo hakkında sevdikleri şeyleri günümüz teknolojisinin mümkün kıldığı şeylerle birleştiriyor. İnsanlar, müziği keşfetme ve paylaşmada yeni bir evrim arayışındalar. Amp, bugün çalma listeleri oluşturup paylaşan milyonlarca insana müzik sevgilerini canlı şovlara dönüştürmenin yeni bir yolunu sunarken, hayranların canlı ses deneyiminin nasıl daha derinlerine inebileceklerini yeniden keşfediyor.

Amp neden sınırlı erişimle başlatılıyor ve yalnızca erişim koduna sahip olanlar tarafından kullanılabiliyor?

Amp çalışmaları devam ediyor. Her düzeydeki içerik oluşturucu topluluklarına hizmet edebilmek için onlarla diyalog halinde olmamız gerektiğine inandığımız için beta sürümde yayınlamaya karar verdik. Uygulamayı kullanmalarına ve bize hangi özellikleri istediklerini söylemelerine ihtiyacımız var. Bu sınırlı erişimli beta, farklı içerik oluşturuculardan oluşan bir toplulukta ilk benimseyen tutkulu kişilerle ortak olmamıza olanak tanıyacak, böylece deneyimi iyileştirebilir ve uygulama resmi olarak kullanıma sunulduğunda herkese daha iyi hizmet verebiliriz.

Amp, içerik oluşturucular için hangi zorlukları çözüyor?

Uydu kuleleri veya kayıt stüdyoları gerekli olmasaydı, pazarlık için lisans anlaşmaları olmasaydı ve ihtiyaç duyduğunuz araçlar zaten telefonunuzda olsaydı kendi radyo programınızı nasıl kurardınız? Amp, müzik kültürü ile dijital müziği bir araya getiriyor. Kendine özgü bir müzik zevkine sahip bir kişinin, bir dinleyici kitlesine ulaşmak için bir radyo istasyonunda iş bulması gerekmiyor artık. Sadece telefonlarından Amp’te bir yayın başlatmaları ve herkese ulaşmaları yeterli. Bugünden itibaren, insanlar bu yeni canlı ses deneyiminin yaratılışını gerçek zamanlı olarak gözlerinin önünde görebilecekler.

Sizin bakış açınızdan, Amp radyoyu nasıl yeniden tasarlıyor?

Ben çocukken radyo bugünkünden çok farklıydı. DJ’ler yereldi. Ebeveynlerim arasında San Francisco’dan Miami’ye gidip gelirdim ve radyo her şehirde tamamen farklı geliyordu. Müzik değil, ses, her şey. DJ’ler yerel müzik ve yükselen sanatçıları çalardı; yerel müzik kültürünü yönlendirdiler. O DJ’lerle bir bağlantı hissettim. Tabii ki kim olduğumu bilmiyorlardı; ben onların dinleyicilerinden biriydim. Ancak Amp ile bu ilişki her iki yöne de gidebilir. Amp’in dinleyicilere bu fırsatı sunacağı için heyecanlıyım. Bu beta lansmanı, bu fırsatı yaratmamızı sağlıyor. Sıfırdan yepyeni bir içerik oluşturucu topluluğu oluşturmak kolay değil, bu yüzden bu kadar çok büyük ismin bu geliştirme sürecinde bize katılmasından dolayı çok heyecanlıyız.

Amp’te nasıl bir şov yaratırsınız?

Amp’i herkesin kullanması kolay olacak şekilde tasarlıyoruz; bir şovu kolayca kurmak ve canlı yayına geçmek için gereken her şey uygulamada yerleşik olarak bulunuyor. Bir içerik oluşturucu olarak kendi şovunuzu sunabilir, hit parçalar veya derin kurgular çalabilir, spor sohbetleri yapabilir, pop kültürü üzerine riffler yapabilir ve sizinle aynı fikirde olan dinleyicilerle kendi çalma listelerinizi oluşturabilirsiniz. Deneyim ve kullanıcı arayüzü gerçekten sezgisel; uygulamayı başlatmaktan saniyeler içinde yeni bir gösteri hazırlayabilirsiniz.

Amp’in sosyal ses uygulamalarından veya müzik akışı hizmetlerinden farkı nedir?

Amp için başlangıç ​​noktamız radyo. Bu, deneyimin tam lisanslı bir müzik kataloğunu kullanma becerisine odaklandığı anlamına geliyor. Canlı ses teknolojisiyle ilgili sonsuz fırsatlar olduğunu düşünüyoruz. Amp, insanların küratörlüğünü yaptığı gösteriler için bir alan yaratarak kültürel deneyimi canlı sese taşıyor.

Amp yeni içerik oluşturuculara nasıl bir destek sunuyor?

Amp web sitesi, içerik oluşturucuların ve dinleyicilerinin güncel bilgiler ve canlı destek alabilecekleri yerdir. Bu, nasıl canlı yayına geçeceğinizden ve içeriğinizi Amp için nasıl optimize edeceğinize, gelecek içerik oluşturucu programlarından haberdar olmaya ve bunlara nasıl katılacağınıza kadar her şeyi içeriyor. Ekibimiz ayrıca içerik oluşturucularımızın yeni kitleler bulmasına yardımcı olmak için pazarlama kanallarımızda öne çıkacak ve tanıtılacak şovları belirleyecek.

Amazon, Amp üzerinde sanatçılarla nasıl çalışıyor?

Sanatçılar, Amp ile yapabilecekleri şeylerle ilgili gerçekten güçlü karşılık verdiler. Gösteriler yapmak, yeni müzikler çalmak ve kendilerini etkileyen şarkıları paylaşmak istiyorlar; ayrıca hayranlarının da yaratmaya başlamasını sağlamak için Amp’i kullanmaktan bahsettiler.

Amazon ihlalleri nasıl ele alacak ve kullanıcı güvenliğini nasıl koruyacak?

Müşteri güveni ve güvenliği, ilk günden beri önceliğimiz oldu. Amazon’a katıldığımda zaten Amp üzerinde çalışan küçük bir ekip vardı; güven ve güvenlik ekibimizin lideri de onlardan biriydi. Herkese açık betanın başlamasıyla birlikte, güvenlik ve güvene odaklanan kapsamlı topluluk yönergelerimiz var. Dinleyiciler ve içerik oluşturucular, bu yönergelerin algılanan ihlallerini doğrudan bir şovdan veya uygulamadan bildirebilir ve raporları inceleyen ve gerçek zamanlı olarak harekete geçen 7/24 bir denetleme ekibimiz var. Dinleyicileri ve içerik oluşturucuları korumak en başından beri aklımızda olan bir konuydu ve bunu doğru anladığımızdan emin olmak istiyoruz. Sonuç olarak, uygulama ve denetleme ekibimiz, sorunları belirleyebilmemiz ve gerektiğinde harekete geçebilmemiz için kullanıcılarımızla açık bir iletişim hattı oluşturdu.

Uygulamada ne dinliyorsunuz?

Amp’de en sevdiğim programlardan birinin adı CRIOYO Radio. Her türlü Latin müziğini çalan Daniel adında bir yaratıcı tarafından yönetiliyor. Gösteriyi New York’tan yönetiyor, ancak kökleri Latin Amerika ve Karayipler’de; bu yüzden müzikten inanılmaz derecede iyi anlıyor. Dinlemeyi seviyorum, çünkü müzik hakkında çok şey öğreniyorum. Ben de sık sık gösteriye çağırıyorum. Çaldığı müzik hakkında konuşuyoruz ama aynı zamanda kökenleri hakkında da konuşuyoruz. Harika yemeklerden, nereye seyahat etmem gerektiğine kadar her şeyi konuştuk. Bu sohbetler, bir yaratıcı olarak onunla olan ilişkimi derinleştirdi ve programın dinleyicisi olarak yaşadığım topluluk duygusunu güçlendirdi.

Amp’in beta sürümüne nasıl erişebilirsiniz ve ne zaman daha fazla içerik oluşturucuya sunulacak?

İnsanlar, ABD IOS App Store’dan Amp’i indirerek ve bekleme listesine kaydolarak veya Amp Bültenine abone olarak beta sürümüne erişebilir. İnsanlar ayrıca  uygulamaya katılmak için düzenli olarak kodları bırakacağımız Instagram, Twitter ve TikTok’taki @onamp_ sosyal hesaplarını takip edebilir.

Amp’e erişmek için bir Amazon hesabına ihtiyacınız var mı?

Evet, kullanıcılar Amp için oturum açma kimlik bilgileri olarak ücretsiz bir Amazon hesabı kullanmalı veya oluşturmalı.

Kaynak: Amazon

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

YouTube dinamik reklam ekleme özelliği getirmeye hazırlanıyor

Semafor’un haberine göre YouTube dinamik reklam ekleme özelliğini devreye sokabilir. Haberde, YouTube’un açık RSS kullanan ses podcast’lerinde olduğu gibi “ana sunucu tarafından okunan reklamların dinamik olarak tek tek YouTube videolarına eklenmesine ve değiştirilmesine izin vereceği” belirtiliyor. YouTube iddialarla ilgili henüz bir yorum yapmadı.

Yayınlanma tarihi

=>

YouTube, YouTuber’ların, podcast yayıncılarının, yayıncıların ve diğer içerik oluşturucuların para kazanma biçimlerini altüst edebilecek ve Google’ın sahip olduğu devin medya dünyasının merkezindeki yerini sağlamlaştırabilecek teknik bir değişikliği test etmeye hazırlanıyor.

Semafor, platformun şu anda Spotify ve Apple Podcasts gibi diğer platformlarda olduğu gibi, ana sunucu tarafından okunan reklamların YouTube videolarına dinamik olarak eklenmesine ve değiştirilmesine olanak tanıyacak bir özellik geliştirdiğini öğrendi.

Ortalama bir YouTube tüketicisinin büyük bir fark görmesi pek olası olmasa da, bu hamle YouTube’da önemli ölçüde daha fazla reklam esnekliği yaratacak ve podcast yayıncıları için potansiyel olarak daha büyük bir reklam doları havuzunun kilidini açabilecek.

Şirket sözcüsü bir e-postada, planlanan testlerle ilgili paylaşacakları herhangi bir ayrıntı olmadığını söyledi, ancak Semafor’u YouTube CEO’su Neal Mohan’ın platformun 2025 hazırlıklarını özetleyen halka açık mektubuna yönlendirdi: “Bu yıl podcast yayıncılarını desteklemek için daha fazla araç sunacağız, içerik oluşturucular için para kazanmayı iyileştireceğiz ve podcast’leri keşfetmeyi daha da kolaylaştıracağız.”

YouTube’un testi, video yoluyla sohbet programı tüketiminin patlamasıyla birlikte birçok YouTuber ve podcast yayıncısının platformla ilgili bir şikayetine odaklanıyor.

YouTube videolarda kendi programatik reklamlarını yayınlıyor ve bu reklamlardan elde edilen geliri içerik oluşturucular, podcast yayıncıları ve yayıncılarla paylaşıyor. Ancak Apple Podcasts, Spotify ve diğer podcast platformlarında, podcast yayıncıları genellikle kendi host-read reklamlarını satıyor ve bu reklamlar, podcast yayıncısı üzerinde anlaşılan indirme hedefine ulaştığında değiştirilebiliyor. Bu değiştirilebilirlik, aynı sponsorluğun belirli bir podcast bölümünde sonsuza kadar yayınlanmayacağı anlamına gelir, bu nedenle eski podcast bölümlerini dinleyen dinleyicilerin o anda kendileriyle alakalı bir reklam alma olasılığı daha yüksektir ve podcast yayıncıları bu reklam alanı için daha fazla ücret talep edebilir. YouTube’un podcast tüketimi için bir platform olarak büyümesine rağmen, bu dinamik olarak eklenen ana sunucu tarafından okunan video reklamlarına izin vermedi, yani bir podcast sunucusunun bir YouTube videosunda okuduğu reklam, o videoda kalıcı olarak sıkışmış durumda.

Bu nedenle, YouTube podcast izleyicileri için büyüyen bir yer temsil etse de, en iyi podcast yayıncılarının çoğu hala paralarının çoğunu diğer platformlardan kazanıyor. YouTube bu reklam değiştirme özelliğini podcast yayıncılarına açarsa, YouTube’da daha yüksek fiyatlı reklam paketleri satarak veya çeşitli podcast platformlarında reklamları bir araya getirerek daha iyi para kazanmalarına olanak sağlayabilir.

Daha geniş podcast reklam pazarını da etkileyebilecek bazı karışıklıklar var. Spotify ve Apple gibi platformlardaki bölüm indirmeleri oldukça istikrarlı ve öngörülebilir olma eğilimindeyken, YouTube izleyiciliği, tek bir videonun YouTube’un algoritmasında ilgi görüp görmediğine veya geniş çapta paylaşılıp paylaşılmadığına bağlı olarak çılgınca değişebilir. YouTube izleyicileri aynı zamanda geleneksel podcast dinleyicilerinden daha az değerli olarak görülüyor çünkü genellikle bir videoya rastlıyorlar ya da belirli bir podcast’i arayan dinleyicilerden daha kısa bir süre izliyorlar. Bu durum, değiştirilebilirliğin olmamasıyla birleşince YouTube’daki reklamların fiyatını düşürdü.

Ancak bu hamle, YouTube’un podcast yayıncılığına odaklanmasının ciddiyetine ve bu mecranın YouTube’un ana işi için ne kadar önemli olduğuna işaret ediyor.

Şirket, platformdaki aylık podcast dinleyicisinin 400 milyon saati aştığını ve yakın zamanda bir ay içinde YouTube’da podcast içeriği görüntüleyen bir milyar kullanıcı olduğunu belirterek, büyük podcast kitlesini giderek daha fazla sayıda olduğunu duyurdu. Ayrıca haber yaratıcıları için giderek daha fazla ortaklık teklif ediyor.

(Semafor’un edindiği bilgiye göre, şirketin ilk podcast direktörü Kai Chuk kısa bir süre önce YouTube’dan ayrıldı. Şirket Semafor’a Podcast Ortaklıkları ekibini Haber ve Yurttaşlık Ortaklıkları ekipleriyle bir araya getirerek yeniden yapılandırdığını ve “Kai Chuk’a yıllar boyunca yaptığı tüm katkılar için minnettar olduğunu” söyledi.)

Bu ayın başlarında Semafor’un Mixed Signals podcast’ine verdiği bir röportajda Mohan, bir CEO olarak bir numaralı endişesinin, en iyi içerik oluşturucularının hala platformda yayın yapmak istemelerini sağlamak olduğunu vurguladı.

Mohan, YouTube’un son üç yılda içerik oluşturuculara, medya şirketlerine ve diğer ortaklara 70 milyar dolar ödeme yaptığını söyleyerek, “Nihayetinde can damarımız, temel bileşenlerimizi memnun etmekle ilgili. Eğer içerik üreticilerimize iki çok temel şekilde hizmet sunamıyorsak o zaman başımız dertte demektir. YouTube, dünyanın neresinde olurlarsa olsunlar yaratıcı bir fikri ya da yaratıcıyı hayranlarıyla buluşturmanın en etkili yolu olmalı. … İkincisi ise, ilk günlerden bu yana misyonumuzun temelini oluşturan, para kazanmalarına yardımcı oluyor muyuz? Biz orijinal ve en büyük yaratıcı ekonomisiyiz” dedi.

YouTube’un podcast yayıncılığına daha fazla odaklanması rakiplerinin de dikkatini çekti.

Spotify 2010’ların sonlarında müziğin ötesine geçerek podcast sektörüne açılmak için yüz milyonlarca dolar harcadı. Bu çaba bazı iyi belgelenmiş başarısızlıklar ve yanlış adımlar getirmiş olsa da, sonuçta şirketin abonelikleri artırma ve podcast yayıncılığının en büyük oyuncularından biri olma hedefine ulaşmasına yardımcı oldu. Şirket konumunu YouTube’a bırakmaya hevesli değil. Geçen yıl İsveçli yayın devi, en iyi podcast yayıncılarından bazılarına video eklemeleri için ödeme yapmaya başladı. Şirket ayrıca bu yılın başlarında premium aboneler için reklamsız görüntülemeyi başlattı.

Netflix’in de kendi platformunda podcast yayıncılığına geçip geçmeyeceğini araştırdığı bildiriliyor.

Kaynak: Max Tani / Semafor

Okumaya devam et

Haberler

OpenAI: Yapay zekalı sesli asistan artık sohbet etmek için daha iyi

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

Yayınlanma tarihi

=>

OpenAI, ChatGPT’de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha az rahatsız etmek için güncellemeler yayınladı.

OpenAI eğitim sonrası araştırmacısı Manuka Stratta, Pazartesi günü şirketin resmi sosyal medya kanallarında yayınlanan bir videoda değişiklikleri duyurdu.

OpenAI’nin son güncellemesi, yapay zekalı sesli asistanlarda sıkça karşılaşılan ve kullanıcılar düşünmek ya da derin bir nefes almak için durakladıklarında sözlerini kesen bir sorunu ele almayı amaçlıyor.

ChatGPT’nin ücretsiz kullanıcıları artık, kullanıcıların AI asistanıyla konuşurken kesintiye uğramadan duraklamalarına olanak tanıyan Gelişmiş Ses Modunun yeni bir sürümüne erişebiliyor. OpenAI’nin Plus, Teams, Edu, Business ve Pro katmanlarına abone olanlar da dahil olmak üzere ChatGPT’nin ücretli kullanıcıları da artık Gelişmiş Ses Modu’nu kullanırken daha az sıklıkta kesinti yaşayacak ve sesli asistan için geliştirilmiş bir kişilik elde edecekler.

Bir OpenAI sözcüsü yaptığı açıklamada, ödeme yapan kullanıcılar için yeni yapay zeka sesli asistanının “cevaplarında daha doğrudan, ilgi çekici, özlü, spesifik ve yaratıcı” olduğunu söyledi.

Gelişmiş Ses Modu’nda yapılan iyileştirmeler, yapay zeka sesli asistan alanındaki rakiplerin yoğun baskısı altında gerçekleşti.

Oculus’un kurucu ortağı Brendan Iribe tarafından yaratılan Andreessen Horowitz destekli bir girişim olan Sesame, kısa süre önce Maya ve Miles adlı doğal sesli yapay zeka asistanlarıyla viral oldu. Alexa’nın LLM destekli versiyonunu piyasaya sürmeye hazırlanan Amazon gibi daha büyük oyuncular da yapay zeka sesli asistan alanına daha agresif bir şekilde adım atıyor.

Kaynak: TechCrunch

Okumaya devam et

Haberler

OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı

OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.

Yayınlanma tarihi

=>

OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.

OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.

Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.

OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.

İşte “gerçek suç tarzı”, yıpranmış bir ses:

OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.

Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.

OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.

Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.

Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.

Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.

OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.

OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.

GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.

Kaynak: TechCrunch

Okumaya devam et

En son