Haberler
Sesame AI etkileyici sesli asistanını tanıttı
Kaliforniya merkezli start-up Sesame AI, daha gerçekçi diyaloglar oluşturmak için mikro duraklamalar, tonlama ve kahkaha gibi kasıtlı kusurları kullanan bir konuşma modeli geliştirdi.
Yayınlanma tarihi
8 ay önceon
Yazar :
Podcast Turkey
Kaliforniya merkezli bir startup olan Sesame AI, konuşma çıktısına kasıtlı olarak kusurları dahil ederek sesli yapay zekaya alışılmadık bir yaklaşım getiriyor. Yeni modelleri, daha otantik diyaloglara ve yapay zeka sistemlerinde “ses varlığı” olarak adlandırdıkları şeye doğru erken bir adımı temsil ediyor.
İlk testlere göre, Sesame’ın en etkileyici özellikleri, konuşmalar sırasında mikro duraklamalar, vurgu değişimleri ve kahkahalar gibi ince unsurlar. Bir etkileşimde, Sesame’in avatarı Maya, bir kullanıcının ani kıkırdamasına gerçek zamanlı olarak yanıt vererek duygusal farkındalık gösterdi.
Sistem, cümle ortasında kendi kendini düzeltme, kesintiler için özür dileme ve dolgu sözcükleri gibi insan benzeri davranışları kasıtlı olarak içeriyor. Techradar bu kasıtlı kusurları özellikle övdü ve ChatGPT veya Gemini’nin cilalı kurumsal tonundan ne kadar farklı olduklarına dikkat çekti.
İş stresi veya parti planlaması hakkındaki tartışmalar gibi simüle edilmiş senaryolarda, sistem genel ifadelere geri dönmek yerine bağlama uygun yanıtlar ve sorular sağladı.
Sesame AI semantik ve akustik belirteçleri kullanıyor
Henüz resmi bir makale yayınlanmamış olsa da, Sesame’in blog yazısı mimarileri hakkında fikir veriyor. CSM, temel işleme için bir omurga transformatörünü (1-8 milyar parametre) ses üretimi için daha küçük bir kod çözücü (100-300 milyon parametre) ile birleştiren iki parçalı bir transformatör yapısı kullanıyor.
Sistem, perde ve vurgu gibi ses özellikleri için akustik belirteçlerin yanı sıra dilsel özellikler ve fonetik için semantik belirteçler kullanarak konuşmayı işliyor. Eğitimi optimize etmek için, ses kod çözücü ses karelerinin yalnızca on altıda biri üzerinde eğitilirken, anlamsal işleme tüm veri kümesini kullanıyor.
Model, beş dönem boyunca bir milyon saatlik İngilizce ses verisi üzerinde eğitildi. Uçtan uca bir mimaride 2.048 jetona kadar (yaklaşık iki dakikalık ses) dizileri işleyebiliyor. Bu yaklaşım, metin ve sesi entegre bir şekilde işlemesiyle geleneksel metinden sese sistemlerinden ayrılıyor.
Blog yazısında doğrudan belirtilmese de demo ses, Google’ın açık kaynaklı LLM Gemma’sının 27 milyar parametreli bir versiyonunu kullandığını ortaya koyuyor.
Testler insana yakın performans ortaya koyuyor
Sesame ile yapılan kör testlerde, katılımcılar kısa konuşma parçacıkları sırasında CSM ile gerçek insanlar arasında ayrım yapamadı. Bununla birlikte, daha uzun diyaloglar, zaman zaman doğal olmayan duraklamalar ve ses artefaktları gibi sınırlamaları ortaya çıkardı.
Sesame, model performansını ölçmek için özel fonetik kıyaslamalar geliştirdi. Dinleme testlerinde, katılımcılar üretilen konuşmayı bağlam olmadan duyduklarında gerçek kayıtlara eşdeğer olarak değerlendirdiler, ancak bağlam sağlandığında orijinali tercih etmeye devam ettiler.

Deneklerin yapay zeka tarafından üretilen konuşma tercihi neredeyse insani seviyelere ulaşıyor. | Resim: Sesame AI
Gelecekteki gelişmeler ve açık kaynak planları
Sesame, araştırmalarının temel bileşenlerini Apache 2.0 lisansı altında açık kaynak olarak yayınlamayı planlıyor. Önümüzdeki aylarda, hem model boyutunu hem de eğitim kapsamını büyütmeyi ve 20’den fazla dile genişletmeyi planlıyorlar.
Şirket özellikle önceden eğitilmiş dil modellerini entegre etmeye ve konuşmacı geçişleri, duraklamalar ve hızlanma gibi konuşma dinamiklerini doğrudan verilerden öğrenebilen tam çift yönlü yetenekli sistemler geliştirmeye odaklanıyor. Bu gelişme, veri küratörlüğünden eğitim sonrası yöntemlere kadar işleme hattı boyunca temel değişiklikler gerektirecek.
Geliştiriciler, “Sesli varlığa sahip dijital bir yol arkadaşı oluşturmak kolay değil, ancak kişilik, hafıza, ifade ve uygunluk dahil olmak üzere birçok cephede istikrarlı bir ilerleme kaydediyoruz” diyor.
Eski Oculus CTO’su Brendan Iribe ve ekibi tarafından kurulan Sesame AI, Andreessen Horowitz liderliğinde önemli bir A Serisi fon sağladı. Bir demo mevcut.
Doğal yapay zeka seslerinin asistanların benimsenmesi üzerindeki etkisi, ChatGPT’nin Gelişmiş Ses Modu etrafındaki heyecanla kanıtlandı. LLM’ler tarafından desteklenen sesli asistanların, Amazon’un Alexa+’ı piyasaya sürmesinin de gösterdiği gibi, giderek daha yaygın hale gelmesi muhtemel.
Kaynak: The Decoder
Beğenebilirsin
Haberler
YouTube’tan, yapay zeka nedeniyle çalışanlarına gönüllü işten ayrılma teklifi
Youtube CEO’su Neal Mohan, ürün bölümünü üç gruba yeniden yapılandırırken, video platformundan ayrılmak isteyen çalışanların tazminat almaya hak kazanacağını duyurdu.
Yayınlanma tarihi
1 hafta önce=>
1 Kasım 2025
YouTube, reklamcılık ve eğlence sektöründe hâlen baskın bir güç olmaya devam ediyor, ancak yapay zekanın yarattığı dönüşüm hiçbir şirketi es geçmiyor.
YouTube CEO’su Neal Mohan Çarşamba günü çalışanlara gönderdiği bir notta, yapay zekanın yarattığı dönüşüm ve fırsatları video platformunu yeniden yapılandırmak için bir neden olarak gösterdi. Yönetici, şirketin ürün ekipleri için yeni bir raporlama yapısı oluşturdu ve şirketten ayrılmak isteyen YouTuber’lara tazminat ödeyen gönüllü çalışan işten ayrılma programını başlattı.
Bir kaynak, değişiklikler kapsamında hiçbir pozisyonun kaldırılmadığını, ancak gönüllü ayrılma programlarının bazen daha sonra yapılacak kesintilerin habercisi olabileceğini belirtti. İşten ayrılma teklifinde bulunma kararı, Amazon’un yapay zekanın yarattığı yıkıcı etkiyi gerekçe göstererek 14.000 kişilik işgücü azaltma planını açıkladığı hafta alındı.
YouTube bundan sonra üç ürün organizasyonuna sahip olacak ve her birinin üst düzey yöneticisi doğrudan Mohan’a rapor verecek.
Abonelik ürünleri Christian Oestlien tarafından yönetilecek ve YouTube TV, YouTube Premium, YouTube Music, Primetime Channels ve diğer iş kollarının denetimini içerecek; Johanna Voolich tarafından yönetilecek izleyici ürünleri, YouTube mobil ve oturma odası uygulamaları, güven ve güvenlik, YouTube Kids, arama altyapısı ve diğer önemli alanlara odaklanacak; içerik oluşturucu ve topluluk ürünleri ise YouTube Shorts ve üretken AI araçları da dahil olmak üzere içerik oluşturucuları desteklemeye odaklanacak. YouTube’un bu organizasyon için yeni bir lider getirmesi bekleniyor.
Mohan, notunda yapay zekayı YouTube için “yeni sınır” olarak nitelendirdi. Bu ayın YouTube ile ilgili kapak hikayesi için The Hollywood Reporter ile yaptığı röportajda Mohan, yapay zekanın nihayetinde insan içerik üreticilerinin hizmetinde olacağını düşündüğü nedenleri açıkladı.
“Yaratıcılık, AI’nın süreci kolaylaştırarak, daha verimli ve hızlı hale getirerek ve aynı zamanda daha güçlü hale getirerek büyük ölçüde yardımcı olacağı bir alan olduğunu düşünüyorum. Bu anlamda, AI ile ilgili vizyonum, AI’nın insan yaratıcılığına hizmet etmesi, insan yaratıcılığını gerçekten güçlendirmesi yönündedir” diyen Mohan, şunları kaydetti:
“Senaryo yazımı alanında çalışıyorsanız ve belirli bir arka plana ihtiyacınız varsa veya belirli bir sekansınız varsa, yapay zeka size birçok şekilde yardımcı olabilir. Senaryonun nasıl olması gerektiği konusunda fikir üretmenize yardımcı olabilir. Arka planı oluşturmanıza yardımcı olabilir. Geçen hafta gördüğünüz gibi, kamerayla çektiğiniz videoya içerik eklemenize yardımcı olabilir.”
YouTube başkanı, “Bence bu tür olasılıkların henüz çok başındayız ve umarım bu, sadece en üstteki yaratıcılar için değil, yaratıcılığın tüm tedarik zinciri için çok daha fazla fırsat yaratır” diye ekledi.
Kaynak: The Hollywood Reporter
Haberler
Spotify, Apple TV uygulamasına nihayet video podcast’leri ekledi
Spotify’ın Apple TV’deki uygulaması, şaşırtıcı bir şekilde, video podcast’lere erişim imkanı sunmuyordu. Spotify uygulamasının tvOS sürümü yeniden tasarlandı ve şarkı sözleri ve sıra yönetimi gibi özellikler eklendi.
Yayınlanma tarihi
1 hafta önce=>
1 Kasım 2025
Spotify, Apple TV uygulamasının yeniden tasarlanmış bir sürümünü duyurdu. Şirket, bu sürümün “daha hızlı, daha akıllı ve daha görsel bir deneyim sunmak için baştan aşağı yeniden tasarlandığını” belirtiyor. Spotify uygulamasının tvOS sürümü, mobil sürümden de birkaç hoş özelliği bünyesine katıyor, ancak en büyük güncellemeler arasında video podcast’lerin ve müzik videolarının eklenmesi yer alıyor.
Bazı kullanıcılar birkaç gündür bu güncellemeye erişebiliyordu, ancak yeni sürüm artık Apple’ın App Store’undan herkes tarafından indirilebilirken, otomatik güncelleme kullanan cihazlar yeni deneyimi Kasım ortasına kadar elde etmelidir. Spotify’ın tvOS uygulamasının eski sürümünü kullananlar, daha önce Reddit dahil olmak üzere çevrimiçi forumlara girerek, sinir bozucu navigasyondan, uygulamanın Google TV sürümünde uzun süredir bulunan eksik özelliklere kadar her şeyden şikayet etmişlerdi, ancak bu sürümde bu sorunların çözülmüş olduğu görülüyor.
Spotify’da müzik videoları izlemek henüz ABD ve Kanada’da mümkün değil, ancak bu özellik Spotify Premium aboneleri için sınırlı bir katalogla birlikte dünya çapında 97 farklı pazara yayıldı. Dinlediğiniz şarkının Spotify kataloğunda eşlik eden bir müzik videosu varsa, “videoya geç” komutunu kullanarak bu videolara kolayca erişebilirsiniz.
Video versiyonu sunan podcast’ler, yeni Spotify tvOS uygulamasında da benzer şekilde çalışacak ve oynatma hızını ayarlama seçeneği içerecek. Bu ayın başlarında, şirketin podcast stüdyosu, Netflix ve The Ringer ile bir ortaklık kurduğunu duyurdu. Bu ortaklık kapsamında, 2026’dan itibaren The Bill Simmons Podcast ve NFL, NBA, Fantasy Football ve F1’e dayalı programlar da dahil olmak üzere 16 video podcast serisi ABD’deki video akış platformuna getirilecek.
Güncellenen Spotify Apple TV uygulaması, sıra yönetimi, kesintisiz oynatma, şarkı sözleri ve AI kullanarak bir sonraki dinleyecekleri öneren Spotify DJ’e erişim gibi yeni mobil özellikler de ekliyor. Ayrıca, Spotify Connect aracılığıyla akıllı telefonunuzu veya tabletinizi ve mobil uygulamayı kullanarak Apple TV’deki oynatmayı kontrol edebileceksiniz.
Haberler
Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ı duyurdu
Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ın lansmanını duyurdu. Fountain for Podcasters, desteklenen uygulamalara (podcast uygulaması Fountain dahil) video dağıtımı yapıyor ve ayrıca RSS, Lightning ve Nostr gibi açık standartları kullanarak akış ödemelerini ve ücretli abonelikleri destekliyor.
Yayınlanma tarihi
1 hafta önce=>
1 Kasım 2025
Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ın lansmanını duyurdu. Fountain for Podcasters, desteklenen uygulamalara (podcast uygulaması Fountain dahil) video dağıtımı yapıyor ve ayrıca RSS, Lightning ve Nostr gibi açık standartları kullanarak akış ödemelerini ve ücretli abonelikleri destekliyor.
Fountain’in resmi bloğundaki dtuyuruda şunlar kaydedildi:
En iyi 500 podcast, ABD reklam gelirinin neredeyse yarısını elde ediyor ve geri kalan %99,9’luk kısım para kazanma açısından dezavantajlı durumda kalıyor.
Mevcut platformlar bunu kolaylaştırmıyor. Yüksek ücretler alıyorlar, kötü bir kullanıcı deneyimi sunuyorlar ve hedef kitlenizle olan ilişkilerinizi kontrol altında tutuyorlar.
Podcasts for Fountain’ı, aylık indirmelerinizden bağımsız olarak güvenilir bir gelir akışı oluşturmanıza ve gelişen bir topluluk oluşturmanıza yardımcı olmak için başlattık.
Fountain, RSS, Lightning ve Nostr gibi açık protokoller üzerine kuruludur; böylece içeriğinizin, kitlenizin ve ödemelerinizin her zaman size ait olmasını sağlar.
Fountain ile artık şunları yapabilirsiniz:
- Podcast’inizi her platformda sorunsuz bir şekilde barındırın ve dağıtın
- Dinleyici deneyiminizi video, bölümler ve transkriptlerle geliştirin
- Ücretli bir abonelik başlatın ve üyelere özel avantajlar sunun
- Abonelikler ve bağışlar için kart ödemeleri alın
- Birden fazla uygulamada dinleyicilerle etkileşim kurun
- Hedef kitleniz ve geliriniz için gelişmiş analizlere erişin
Daha fazla ayrıntı için BURAYI ziyaret edebilirsiniz.

YouTube’tan, yapay zeka nedeniyle çalışanlarına gönüllü işten ayrılma teklifi

Spotify, Apple TV uygulamasına nihayet video podcast’leri ekledi

Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ı duyurdu
En son
- Haberler4 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Araştırma1 yıl önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Haberler3 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik2 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Haberler3 yıl önce
Video podcast nedir?
- Araştırma4 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı












