Bizimle iletişime geçin

Haberler

Sesame AI etkileyici sesli asistanını tanıttı

Kaliforniya merkezli start-up Sesame AI, daha gerçekçi diyaloglar oluşturmak için mikro duraklamalar, tonlama ve kahkaha gibi kasıtlı kusurları kullanan bir konuşma modeli geliştirdi.

Yayınlanma tarihi

on

Kaliforniya merkezli bir startup olan Sesame AI, konuşma çıktısına kasıtlı olarak kusurları dahil ederek sesli yapay zekaya alışılmadık bir yaklaşım getiriyor. Yeni modelleri, daha otantik diyaloglara ve yapay zeka sistemlerinde “ses varlığı” olarak adlandırdıkları şeye doğru erken bir adımı temsil ediyor.

İlk testlere göre, Sesame’ın en etkileyici özellikleri, konuşmalar sırasında mikro duraklamalar, vurgu değişimleri ve kahkahalar gibi ince unsurlar. Bir etkileşimde, Sesame’in avatarı Maya, bir kullanıcının ani kıkırdamasına gerçek zamanlı olarak yanıt vererek duygusal farkındalık gösterdi.

Sistem, cümle ortasında kendi kendini düzeltme, kesintiler için özür dileme ve dolgu sözcükleri gibi insan benzeri davranışları kasıtlı olarak içeriyor. Techradar bu kasıtlı kusurları özellikle övdü ve ChatGPT veya Gemini’nin cilalı kurumsal tonundan ne kadar farklı olduklarına dikkat çekti.

İş stresi veya parti planlaması hakkındaki tartışmalar gibi simüle edilmiş senaryolarda, sistem genel ifadelere geri dönmek yerine bağlama uygun yanıtlar ve sorular sağladı.

Sesame AI semantik ve akustik belirteçleri kullanıyor

Henüz resmi bir makale yayınlanmamış olsa da, Sesame’in blog yazısı mimarileri hakkında fikir veriyor. CSM, temel işleme için bir omurga transformatörünü (1-8 milyar parametre) ses üretimi için daha küçük bir kod çözücü (100-300 milyon parametre) ile birleştiren iki parçalı bir transformatör yapısı kullanıyor.

Sistem, perde ve vurgu gibi ses özellikleri için akustik belirteçlerin yanı sıra dilsel özellikler ve fonetik için semantik belirteçler kullanarak konuşmayı işliyor. Eğitimi optimize etmek için, ses kod çözücü ses karelerinin yalnızca on altıda biri üzerinde eğitilirken, anlamsal işleme tüm veri kümesini kullanıyor.

Model, beş dönem boyunca bir milyon saatlik İngilizce ses verisi üzerinde eğitildi. Uçtan uca bir mimaride 2.048 jetona kadar (yaklaşık iki dakikalık ses) dizileri işleyebiliyor. Bu yaklaşım, metin ve sesi entegre bir şekilde işlemesiyle geleneksel metinden sese sistemlerinden ayrılıyor.

Blog yazısında doğrudan belirtilmese de demo ses, Google’ın açık kaynaklı LLM Gemma’sının 27 milyar parametreli bir versiyonunu kullandığını ortaya koyuyor.

Testler insana yakın performans ortaya koyuyor

Sesame ile yapılan kör testlerde, katılımcılar kısa konuşma parçacıkları sırasında CSM ile gerçek insanlar arasında ayrım yapamadı. Bununla birlikte, daha uzun diyaloglar, zaman zaman doğal olmayan duraklamalar ve ses artefaktları gibi sınırlamaları ortaya çıkardı.

Sesame, model performansını ölçmek için özel fonetik kıyaslamalar geliştirdi. Dinleme testlerinde, katılımcılar üretilen konuşmayı bağlam olmadan duyduklarında gerçek kayıtlara eşdeğer olarak değerlendirdiler, ancak bağlam sağlandığında orijinali tercih etmeye devam ettiler.

Deneklerin yapay zeka tarafından üretilen konuşma tercihi neredeyse insani seviyelere ulaşıyor. | Resim: Sesame AI

Gelecekteki gelişmeler ve açık kaynak planları

Sesame, araştırmalarının temel bileşenlerini Apache 2.0 lisansı altında açık kaynak olarak yayınlamayı planlıyor. Önümüzdeki aylarda, hem model boyutunu hem de eğitim kapsamını büyütmeyi ve 20’den fazla dile genişletmeyi planlıyorlar.

Şirket özellikle önceden eğitilmiş dil modellerini entegre etmeye ve konuşmacı geçişleri, duraklamalar ve hızlanma gibi konuşma dinamiklerini doğrudan verilerden öğrenebilen tam çift yönlü yetenekli sistemler geliştirmeye odaklanıyor. Bu gelişme, veri küratörlüğünden eğitim sonrası yöntemlere kadar işleme hattı boyunca temel değişiklikler gerektirecek.

Geliştiriciler, “Sesli varlığa sahip dijital bir yol arkadaşı oluşturmak kolay değil, ancak kişilik, hafıza, ifade ve uygunluk dahil olmak üzere birçok cephede istikrarlı bir ilerleme kaydediyoruz” diyor.

Eski Oculus CTO’su Brendan Iribe ve ekibi tarafından kurulan Sesame AI, Andreessen Horowitz liderliğinde önemli bir A Serisi fon sağladı. Bir demo mevcut.

Doğal yapay zeka seslerinin asistanların benimsenmesi üzerindeki etkisi, ChatGPT’nin Gelişmiş Ses Modu etrafındaki heyecanla kanıtlandı. LLM’ler tarafından desteklenen sesli asistanların, Amazon’un Alexa+’ı piyasaya sürmesinin de gösterdiği gibi, giderek daha yaygın hale gelmesi muhtemel.

Kaynak: The Decoder

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Araştırma

Sesli kitap satışları çift haneli büyümeyle 2,2 milyar dolara ulaştı

Sesli kitap satışları çift haneli büyüme ile 2,2 milyar dolara ulaştı; Amerikalı yetişkinlerin %51’i (134 milyon kişi) sesli kitap dinledi.

Yayınlanma tarihi

=>

Sesli kitap satışları çift haneli büyüme ile 2,2 milyar dolara ulaştı; Amerikalı yetişkinlerin %51’i (134 milyon kişi) sesli kitap dinledi.

Kâr amacı gütmeyen ticaret grubu Audio Publishers Association tarafından iki araştırma şirketi aracılığıyla düzenlenen iki ankette şu bilgiler elde edildi:

  • Sesli kitap satış gelirleri 2024 yılında çift haneli büyüme kaydetti. Sesli kitap satış gelirleri 2024 yılında 2,22 milyar dolara ulaşarak bir önceki yıla göre %13 artış gösterdi. Satış artışları, 2024 yılında gelirlerin %99’unu oluşturan ve bir önceki yıla göre %14 büyüme kaydeden dijital sesli kitaplar tarafından sürdürülmeye devam ediyor. Bu bilgiler, küresel araştırma şirketi Toluna tarafından yürütülen Audio Publishers Association Satış Anketi’nden alındı.
  • Amerikalı yetişkinlerin %51’i (134 milyon kişi) sesli kitap dinledi. Dinlemeyenler arasında ilgi önemli ölçüde artmıştır: %38’i sesli kitaplarla ilgilendiğini belirtirken, bu oran geçen yıl %32 idi ve çok ilgilenenlerin sayısı %10’dan %18’e neredeyse iki katına çıktı.

Bu rakamların ardındaki çalışma, Sesli Kitap Yayıncıları Birliği’nin talebi üzerine 1.700 ABD’li yetişkine anket uygulayan Edison Research tarafından yapıldı.

Manşetlerin arkasında, bu anketten elde edilen birkaç önemli bulgu yer aldı:

  • Dinleyicilerin giderek artan bir kısmı, sesli kitap tüketiminde erişilebilirliği önemli bir faktör olarak belirtmektedir: %72’si sesli kitapların tercih ettikleri dinleme platformunda mevcut olmasının önemli olduğunu, %63’ü ise kütüphane uygulaması üzerinden erişimin önemli olduğunu belirtiyor.
  • Genel kurgu, türlere göre gelirlerin en büyük payını oluşturuyor ve 2023 gelirlerine göre %16 artış gösterdi. Bilim kurgu/fantastik, romantik ve genel kurgu dışı türler, gelir açısından geri kalan en popüler türleri oluşturuyor.
  • Tür satışlarında yıllık bazda en büyük artışlar romantik (+%30), çocuk ve genç yetişkin (+%26) ve bilim kurgu/fantastik (+%21) türlerinde görüldü.
  • AI tarafından seslendirilen sesli kitapların tüketimi ve sayısı artmış olsa da, AI tarafından seslendirilen sesli kitapları deneme isteği yıllık bazda düşüş göstermiş ve 2023’te %77 olan oran 2025’te %70’e geriledir.

Son nokta özellikle ilginç. İnsan okuyucuların AI performansları tarafından yerinden edilmesi, serbest okuyucuların çoğunun işlerinin düzensiz ve değişken olduğu profesyonel okuyucular arasında önemli bir endişe konusu.

Daha fazlası BURADA

Kaynak: RainNews

Okumaya devam et

Haberler

YouTube podcast yayıncılığına hakim değil

Podcast sektöründe YouTube hakkında tartışmaların endişe düzeyine ulaştığına dikkat çeken Paul Reesmandel, “Haberlerde ve konferanslarda, platformun artık podcasting’i ‘domine ettiği’ yönünde abartılı açıklamalar duyuyorum. Basitçe söylemek gerekirse, bu doğru değil” diyerek bir takım verilerle bu iddianın gerçek olmadığını savundu.

Yayınlanma tarihi

=>

YouTube’un, özellikle tüketicilerin video platformuna olan ilgisinin artması nedeniyle, podcasting alanında önemli bir güç haline geldiğine şüphe yok. Nisan 2023’te yayınlanan Cumulus Media / Signal Hill Insights Podcast Download araştırması, YouTube’un ABD’de en çok kullanılan podcast tüketim platformu olarak Spotify’ı ilk kez geride bıraktığını gösterdi. Platform, ertesi yıl Canadian Podcast Listener‘da Kanada’da da birinci sırada yer aldı.

O zamandan beri, podcasting topluluğunda YouTube hakkında tartışmalar, heyecan ve endişe doruk noktasına ulaştı. Haber makalelerinde ve konferanslarda, platformun artık podcasting’i “domine ettiği” yönünde abartılı açıklamalar da duyuyorum. Basitçe söylemek gerekirse, bu doğru değil.

Bu, mantık olarak kolay bir çıkarım. YouTube’un en çok tercih edilen podcast uygulaması olduğunu duyuyorsunuz. Buradan, bir numara olmanın hakimiyet anlamına geldiğini, podcast uygulamaları turnuvasının mutlak galibi olduğunu düşünmek çok da zor değil. Ancak bu bir spor değil ve tüketici tercihi Super Bowl veya FIFA Dünya Kupası değil. Tek gerçek şampiyonu bulmak için Wimbledon eleme turları yok.

Sıralamalara odaklanmak genel tabloyu bulanıklaştırır ve bugün Kuzey Amerika’da podcast yayıncılığını tek bir platformun domine etmediği gerçeğini gölgeliyor.

Spring Download araştırmasından alınan bir ön izleme, ABD’de YouTube’a olan tercihin artmaya devam ettiğini gösteriyor. Bugün, haftalık podcast tüketicilerinin %39’u en çok YouTube’u kullandığını söylüyor. Bu, diğer platformlardan daha büyük bir pay olsa da, %39 çoğunluk bile değildir.

Başka bir deyişle, podcast tüketicilerinin çoğunluğu – %61 – en sık YouTube dışında başka bir platform kullanıyor. Bunun yaklaşık yarısı Spotify (%21) ve Apple Podcasts’e (%8) birlikte gidiyor. Kalan %32’lik kısım ise iHeartRadio, Amazon Music, bir podcast’in web sitesi ve diğerleri de dahil olmak üzere uzun bir uygulama ve platform kuyruğu tarafından talep ediliyor.

Ölçülen şeyin ne olduğu konusunda da net olalım. Bu paylar, tüketicilerin en sık kullandıkları platformları temsil ediyor, ancak sadece bunları değil. YouTube’u en çok kullanan podcast tüketicilerinin %39’u diğer podcast platformlarını da kullanıyor. Aslında, YouTube’u en çok kullananların yarısı Spotify’ı da ara sıra veya sık sık kullanırken, en az dörtte biri Amazon Music, iHeartRadio veya Pandora’yı kullanıyor.

Çoğu tüketici tek bir podcast platformuna sahip değil, iki veya daha fazlasını kullanıyor. Sounds Profitable’ın araştırma ortağı olarak, Signal Hill Insights olarak, onların çığır açan araştırmalarındaki zengin bilgileri perde arkasından inceleme fırsatı buluyoruz. The Podcast Landscape 2024‘ten daha önce yayınlanmamış bir bulgu, platform hakimiyeti kavramını perspektifine oturtuyor. Aylık ABD podcast tüketicilerinin sadece %26’sı podcast’ler için tek bir uygulama veya hizmet kullandığını söyledi.

Dahası, ABD ve Kanada’daki YouTube kullanıcılarının en az yarısı, YouTube podcast’lerini ses platformlarında da dinlediklerini söylüyor. Bunun nedeni, ekranlara bakamayacakları veya bakmak istemedikleri zamanlar olması ve bu durumlarda sesin çok daha uygun olmasıdır.

Tüm bunlar, YouTube’u ve podcasting alanındaki artan etkisini küçümsemek için söylenmiş değildir. Ancak artık bu konudaki tartışmaları biraz yumuşatmanın zamanı gelmiştir. Şu anda tüm podcast yayıncılarının YouTube’u tamamen benimsemesi gerektiğini söylemek abartılıdır.

Bunun yerine, büyümeye odaklanan herhangi bir podcast yayıncısının, bu strateji YouTube’a girmeyi ertelemek veya direnmek olsa bile, düşünülmüş bir YouTube stratejisine sahip olması mantıklıdır. Podcast tüketicilerinin çoğu hala en sık ses odaklı platformları kullanıyor ve hatta YouTube’u öncelikli olarak kullananların çoğu ses uygulamaları kullanıyor. Bu (henüz) bir ölüm kalım meselesi değil.

YouTube podcasting, bu mecranın genel büyüme hikayesinin bir parçasıdır. Haftalık podcast tüketicilerinin büyük çoğunluğu (%86) en azından ara sıra YouTube’u kullanıyor ve bu, keşif için önde gelen kaynak. Bir podcast’in bundan yararlanabileceği birçok yol var ve panik, korku, çaresizlik veya teslimiyetle karar vermemek önemlidir.

Yani, hayır, YouTube podcasting sektörünü domine etmiyor. Podcast’lerin son derece çeşitli platform ve uygulamalardan oluşan bir ekosistemde kolayca dağıtılabilmesi, bu ortamda herhangi bir platformun domine etmesini engelleyen bir faktör olarak işlev görüyor. Ancak, YouTube yine de dikkate alınması gereken bir güç. Signal Hill olarak, altı yıldır birçok araştırmada YouTube’un yükselişini takip ediyoruz ve podcasting sektörünün gelişmeye ve büyümeye devam etmesiyle birlikte, podcast tüketicilerinin YouTube’u neden ve nasıl kullandığını araştırıp analiz etmeyi sabırsızlıkla bekliyoruz.

Spring Download’da paylaşacağımız daha birçok yeni içgörü var, örneğin insanların en sevdikleri podcast’leri nasıl ve nerede tükettikleri ve akıllı TV’lerin ortaya çıkan rolü gibi. 17 Haziran’da Cumulus Media ile düzenleyeceğimiz ücretsiz web seminerine mutlaka kaydolun.

Kaynak: Paul Riismandel / Signal Hill Insights

Okumaya devam et

Haberler

Yerel podcasting sektör için neden bir sonraki büyük sıçrama olabilir?

Podcast sektörünün deneyimli isimlerinden Mathew Passy, yerel podcast yayıncılığının sektör için bir sonraki büyük sıçrama olabileceğini savundu. Passy, “Mahallenizdeki pizza dükkânı The Daily’ye sponsor olmuyor. Ama kendi dağıtım bölgelerinde dinleyicileri olan bir programı destekleyebilirler” diye yazdı.

Yayınlanma tarihi

=>

Podnews’in editörü James Cridland, podcast:location etiketinin artan potansiyeline dikkat çekti. Bu etiket artık sadece podcast yayıncısının bulunduğu yeri değil, bölümün gerçekte hangi konumu ele aldığını da gösterebiliyor. Cridland, “Adelaide yakınlarındaki şarap imalathaneleri veya Fransa’daki katedraller hakkında yapılmış podcast’leri gösteren bir web sitesi hayal edin” diye yazdı.

Podcast hakkında benimle beş dakikadan fazla konuşmuşsanız, muhtemelen bu fikri savunduğumu duymuşsunuzdur: Yerel, podcast’in geleceğidir.

Her Zaman Hayalini Kurduğum Yerel Dizin

Yıllardır, tutkulu bir proje oluşturmayı hayal ediyorum: Dinleyicileri, yakın çevrelerine odaklanan içerik üreticilerle buluşturan bir dizin. Uygulamayı açtığınızda, bulunduğunuz konuma bağlı ilgili içerikler karşınıza çıkıyor. Genel trend konular değil, zengin, yere dayalı medya.

Belki de yakın kasabalardaki bağımsız restoranların yemeklerini öne çıkaran bir yemek severdir. Ya da yerel lisenin şampiyonluk şansını analiz eden, gelecek vadeden spor yorumcularından oluşan bir YouTube ikilisi. Ya da dün geceki belediye meclisi toplantısında neler olduğunu anlatan iki eski gazeteci.

Aynı uygulama eyalet düzeyinde içerik de sunabilir: Halk sağlığı uyarıları, ulaştırma departmanlarından güncellemeler, seçim bilgileri. Hatta, eyalet sınırının hangi tarafında olursanız olun, belirlenen pazarlama alanınızı (DMA) hesaba katarak, büyük lig spor haberlerini, şiddetli hava uyarılarını veya bölge çapındaki etkinlikleri ortaya çıkarabilir.

Teknoloji nihayet bu fikri yakalamaya başladı. Podcast:location etiketi ve OpenStreetMap entegrasyonu ile yeni nesil konum farkındalı podcast’ler için altyapı yerli yerine oturuyor.

Yerel Medya Neden Önemlidir (Çünkü Yerel Medya Önemlidir)

Yerel medyanın çöküşü, topluluk haberlerinde büyük boşluklar yarattı. On yıllardır süren medya konsolidasyonu, muhabirlerin, spikerlerin ve yapımcıların işten çıkarılmasına yol açtı ve kârlılık adına toplulukların önemli hikayelerinin anlatılmasını engelledi.

Ancak günümüzün araçları bu durumu tersine çeviriyor. Mikrofonu ve anlatacak bir hikayesi olan herkes, mahallesi için önemli olan hikayeleri paylaşabilir. Giriş engeli hiç olmadığı kadar düşük olmakla birlikte, deneyimli medya profesyonellerinin rehberliği, bu erişimi güçlü ve değerli yerel içeriğe dönüştürmeye yardımcı olabilir.

Yerel Podcasting’in Gerçek Hayattaki Avantajları

Nişiniz mahalleniz olduğunda, podcasting ile ilgili her şey daha erişilebilir, etkili ve ödüllendirici hale gelir.

1. Konuklarla Her Yerde Röportaj mı yapmanız gerekiyor? Dışarı çıkın yeter. İlgi çekici hikayelerden bolca var ve konuklarla yüz yüze görüşmek genellikle daha doğal ve ilgi çekici sohbetlere yol açar.

2. Gerçek Hayattaki Pazarlama Fırsatları NPR kadar büyük bir reklam bütçesine ihtiyacınız yok. El ilanları dağıtın, şehirde QR kodları asın veya yerel kafede sıra bekleyen insanlarla konuşun. (Conntap Podcast Beacon gibi bir araç, bu yüz yüze bağlantıları daha da kolaylaştırır; dokunarak programınızı anında paylaşın.)

3. Yüz Yüze Etkinlikler Gerçekleşebilir Hale Gelir Bir buluşma, canlı kayıt veya dinleme partisi düzenlemek ister misiniz? Dinleyicileriniz yakındadır. Uçuşlar, lojistik kabusları yok; sadece topluluk var.

4. Yerel İşletmeler Reklam Verebilir Mahallenizdeki pizzacı The Daily’ye sponsor olmuyor. Ancak, teslimat bölgelerindeki dinleyicileri olan bir programı desteklerler. Yerel podcasting, hem içerik oluşturucu hem de reklamveren için mantıklı olan, daha uyumlu ve daha değerli sponsorluklar sağlar.

İçerik Uzmanlarının Şu Anda Yapabilecekleri

Ben bu sözümü yerine getirmeyi planlıyorum. Topluluğumdaki yerel iş liderlerine odaklanan bir podcast başlatıyorum; sadece dinleyicilere hizmet etmek için değil, aynı zamanda müşterileri içerik stüdyomuza çekmek için bir araç olarak. Bu bir kazan-kazan durumu: Ağımı genişletiyorum, değer sunuyorum ve yerel olarak önemli olan hikayeleri yaygınlaştırmaya yardımcı oluyorum.

Mikrofonun arkasına geçmeye hazır değilseniz, ağ oluşturma, pazarlama veya hizmet sunumlarınızda yerel varlığınızı iki katına çıkarmanın yeni fırsatlar yaratabileceğini düşünün.

Gelecek Çok Yakında

Araçlar geliyor. Talep var. Peki ya izleyiciler? Onlar zaten kapınızın önünde.

Artık podcast yayınlarına başlamanın zamanı geldi.

Kaynak: Mathew Passy / PodNews

Okumaya devam et

En son