Haberler
OpenAI bir yıl önce duyurduğu ses klonlama aracı ‘Voice Engine’i hala yayınlamadı
OpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir önizlemesini” duyurdu. Yaklaşık bir yıl sonra, araç önizleme aşamasında kalmaya devam ediyor ve OpenAI ne zaman piyasaya sürülebileceğine ya da hiç piyasaya sürülüp sürülmeyeceğine dair hiçbir belirti vermedi.
Yayınlanma tarihi
1 yıl önceon
Yazar :
Podcast Turkey
OpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir önizlemesini” duyurdu. Yaklaşık bir yıl sonra, araç önizleme aşamasında kalmaya devam ediyor ve OpenAI ne zaman piyasaya sürülebileceğine ya da hiç piyasaya sürülüp sürülmeyeceğine dair hiçbir belirti vermedi.
Şirketin hizmeti yaygınlaştırma konusundaki isteksizliği, kötüye kullanım korkusuna işaret ediyor olabilir, ancak aynı zamanda düzenleyici incelemeyi davet etmekten kaçınma çabasını da yansıtabilir. OpenAI geçmişte güvenlik pahasına “parlak ürünlere” öncelik vermekle ve rakip firmaları pazara sürmek için acele etmekle suçlanmıştı.
Bir OpenAI sözcüsü yaptığı açıklamada, şirketin Voice Engine’i sınırlı sayıda “güvenilir ortak” ile test etmeye devam ettiğini söyledi.
Sözcü, “[Ortaklarımızın] teknolojiyi nasıl kullandıklarını öğreniyoruz, böylece modelin kullanışlılığını ve güvenliğini geliştirebiliriz” dedi. “Konuşma terapisinden dil öğrenimine, müşteri desteğine, video oyunu karakterlerine ve yapay zeka avatarlarına kadar farklı kullanım şekillerini görmek bizi heyecanlandırdı.”
Geri itildi
OpenAI’nin metinden konuşmaya API’sinde ve ChatGPT’nin Ses Modunda bulunan seslere güç veren Voice Engine, orijinal konuşmacıya çok benzeyen doğal sesli konuşma üretir. Araç, yazılı karakterleri konuşmaya dönüştürüyor ve yalnızca içerikle ilgili belirli korkuluklarla sınırlı. Ancak en başından beri gecikmelere ve değişen sürüm pencerelerine maruz kaldı.
OpenAI’nin Haziran 2024 tarihli bir blog yazısında açıkladığı gibi, Ses Motoru modeli, farklı sesleri, aksanları ve konuşma tarzlarını dikkate alarak, bir konuşmacının belirli bir metin transkripti için çıkaracağı en olası sesleri tahmin etmeyi öğreniyor. Bundan sonra, model yalnızca metnin sözlü versiyonlarını değil, aynı zamanda farklı konuşmacı türlerinin metni yüksek sesle nasıl okuyacağını yansıtan “sözlü ifadeler” de üretebilir.
TechCrunch tarafından görülen taslak bir blog yazısına göre OpenAI başlangıçta Özel Sesler olarak adlandırılan Ses Motorunu 7 Mart 2024’te API’sine getirmeyi amaçlıyordu. Plan, “sosyal fayda” sağlayan veya teknolojinin “yenilikçi ve sorumlu” kullanımlarını gösteren uygulamalar geliştiren geliştiricilere öncelik verilerek, daha geniş bir çıkıştan önce 100’e kadar “güvenilir geliştirici” grubuna erişim sağlamaktı. OpenAI bu teknolojiyi markalaştırmış ve fiyatlandırmıştı bile: “standart” sesler için milyon karakter başına 15 dolar ve “HD kalitesinde” sesler için milyon karakter başına 30 dolar.
Ardından, on birinci saatte şirket duyuruyu erteledi. OpenAI, Voice Engine’i birkaç hafta sonra herhangi bir kayıt seçeneği olmadan tanıttı. OpenAI, araca erişimin şirketin 2023’ün sonlarında birlikte çalışmaya başladığı yaklaşık 10 geliştiriciden oluşan bir kohortla sınırlı kalacağını söyledi.
OpenAI, Voice Engine’in Mart 2024 sonundaki duyuru blog yazısında “Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz” diye yazdı. “Bu konuşmalara ve küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte kullanılıp kullanılmayacağı ve nasıl kullanılacağı konusunda daha bilinçli bir karar vereceğiz.”
Uzun süredir üzerinde çalışılıyor
OpenAI’ye göre Voice Engine 2022’den beri üzerinde çalışılan bir araç. Şirket, aracın potansiyelini ve risklerini göstermek için 2023 yazında “en üst düzeydeki küresel politika yapıcılara” demo yaptığını iddia ediyor.
Bugün aralarında engelli insanların daha doğal iletişim kurmasını sağlayan cihazlar geliştiren Livox’un da bulunduğu çok sayıda iş ortağı Voice Engine’e erişebiliyor. Livox’un CEO’su Carlos Pereira TechCrunch’a verdiği demeçte, aracın çevrimiçi olması gerekliliği nedeniyle (Livox’un müşterilerinin çoğunun interneti yok) Voice Engine’i bir ürün haline getiremediklerini, ancak teknolojiyi “gerçekten etkileyici” bulduğunu söyledi.
Pereira TechCrunch’a e-posta yoluyla yaptığı açıklamada, “Sesin kalitesi ve seslerin farklı dillerde konuşması imkanı benzersiz – özellikle de müşterilerimiz olan engelli insanlar için” dedi. “Gerçekten de gördüğüm en etkileyici ve kullanımı kolay ses oluşturma [aracı] […] OpenAI’nin yakında çevrimdışı bir sürüm geliştirmesini umuyoruz.”
Pereira, OpenAI’den olası bir Voice Engine lansmanı konusunda rehberlik almadığını ve şirketin hizmet için ücret almaya başlamayı planladığına dair herhangi bir işaret görmediğini söylüyor. Livox şimdiye kadar kullanımı için ödeme yapmak zorunda kalmadı.
Yukarıda bahsedilen Haziran 2024 tarihli gönderide OpenAI, Voice Engine’i geciktirirken göz önünde bulundurduğu hususlardan birinin geçen yılki ABD seçim döngüsü sırasında kötüye kullanım potansiyeli olduğunu ima etti. Paydaşlarla yapılan görüşmeler sonucunda Voice Engine, üretilen sesin kaynağını izlemek için filigran da dahil olmak üzere çeşitli hafifletici güvenlik önlemlerine sahiptir.
OpenAI’ye göre, geliştiriciler Voice Engine’i kullanmadan önce orijinal konuşmacıdan “açık onay” almalı ve izleyicilerine seslerin yapay zeka tarafından üretildiğine dair “açık açıklamalar” yapmalıdır. Ancak şirket bu politikaları nasıl uygulayacağını açıklamadı. OpenAI’nin kaynaklarına sahip bir şirket için bile bunu geniş ölçekte yapmak son derece zor olabilir.
OpenAI blog yazılarında ayrıca hoparlörleri doğrulamak için bir “ses kimlik doğrulama deneyimi” ve tanınmış kişilere çok benzeyen seslerin oluşturulmasını engelleyen bir “gidilmeyecekler” listesi oluşturmayı umduğunu ima etti. Her ikisi de teknolojik açıdan iddialı projeler ve bunları yanlış yapmak, sık sık güvenlik girişimlerini bir kenara bırakmakla suçlanan bir şirkete kötü yansıyacaktır.
Etkili filtreleme ve kimlik doğrulama, sorumlu ses klonlama teknolojisi sürümleri için hızla temel gereksinimler haline geliyor. Bir kaynağa göre yapay zeka ses klonlama, 2024’ün en hızlı büyüyen üçüncü dolandırıcılığı oldu. Gizlilik ve telif hakkı yasaları ayak uydurmakta zorlanırken, dolandırıcılık ve banka güvenlik kontrollerinin atlanmasına yol açtı. Kötü niyetli aktörler, ünlülerin ve politikacıların kışkırtıcı deepfake’lerini yaratmak için ses klonlamayı kullandı ve bu deepfake’ler sosyal medyada orman yangını gibi yayıldı.
OpenAI Voice Engine’i önümüzdeki hafta yayınlayabilir ya da hiç yayınlamayabilir. Şirket defalarca bu hizmetin kapsamını küçük tutmayı düşündüğünü söyledi. Ancak net olan bir şey var: Optik nedenlerden, güvenlik nedenlerinden ya da her ikisinden dolayı, Voice Engine’in sınırlı önizlemesi OpenAI’nin tarihindeki en uzun önizlemelerden biri haline geldi.
Kaynak: TechCrunch
Beğenebilirsin
Haberler
Spotify yapay zeka destekli kişiselleştirilmiş podcast’leri tanıttı
Spotify, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre yapay zeka desteğiyle doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Yeni özellik kapsamında Spotify, “Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserleri hakkında bilgi ver” gibi istemlere dayanarak sesli içerik oluşturacak.
Yayınlanma tarihi
2 gün önce=>
23 Mayıs 2026
Spotify, platformuna daha fazla yapay zeka özelliği eklerken, yakında kullanıcıların kendi podcast’lerini oluşturmalarına olanak tanıyacağını duyurdu.
Spotify, Perşembe günü düzenlediği yatırımcı gününde, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Bu özellik, kullanıcıların Spotify’a bir istek yazması ve Spotify’ın da bu isteğe göre ses dosyaları oluşturması prensibine dayanan mevcut “İstekli Çalma Listeleri” bölümüne benzer bir mekanizma izliyecek.
Spotify şu örneği verdi:
“Günlük bir özet, merak ettiğiniz bir konu hakkında derinlemesine bir inceleme veya aklınızdaki her şeyin haftalık bir özetini oluşturabilirsiniz. ‘Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserlerinden bahset’ veya ‘Ekonomiyi beş dakikada anlamama yardımcı ol’ gibi isteklerde bulunun ve Spotify, size özel bir sesli özet oluştururken, daha fazlasını keşfedebileceğiniz ilgili bölümlere, programlara ve içerik oluşturuculara da bağlantı verecektir.”
Kullanıcılar daha sonra bu podcast’leri günlük veya haftalık olarak tekrar edecek şekilde planlayabilir, bir ses seçebilir ve ek metin, PDF veya bağlantılar aracılığıyla daha fazla bağlam ekleyebilirler. Bölümler yalnızca her bireyin kendi kütüphanesi aracılığıyla erişilebilir durumda.
Kişisel podcast’ler, önümüzdeki aydan itibaren ABD’deki uygun premium kullanıcılara sunulacak ve belirli sayıda aylık kredi içerecek, ayrıca daha fazla kredi satın alma seçeneği de sunulacak. Spotify ayrıca Perşembe günü, kullanıcıların dinledikleri podcast’ler hakkında Spotify’a sorular sormasına ve yanıt almasına olanak tanıyan yeni bir özellik yayınlayacağını duyurdu.
Spotify’ın eş CEO’su Gustav Söderström, yatırımcı sunumunda şunları söyledi:
“Deneyimin sadece bir katalogdan seçilmediği, her bir kullanıcımız tarafından gerçek zamanlı olarak, zevklerine, bağlamlarına ve niyetlerine göre şekillendirildiği bir Nesil Çağına giriyoruz… Bugün, hem kamuya açık hem de özel içerik için (veya başka bir deyişle) üretken çağ için bir medya oynatıcı yok. Spotify’ın bunu başaracağına inanıyoruz.”
Ayrıca Spotify, podcast içerik üreticilerinin Spotify’daki en ilgili hayranlarından doğrudan düzenli gelir elde etmelerini sağlayan bir yol olarak içerik üretici sponsorluklarını da tanıttı. Şirket ayrıca, podcast ses dosyaları oluşturmak ve kullanıcının takvimine, gelen kutusuna ve notlarına bağlanmak için kullanılabilen bağımsız bir masaüstü uygulaması olan Studio by Spotify Labs‘ı da tanıttı.
Bu özelliklere ek olarak Spotify, biletler satışa çıkmadan önce Spotify Premium sahibi sadık hayranları için iki konser biletini ayıracağını ve premium abonelerin şarkıların yapay zeka tarafından oluşturulmuş cover ve remixlerini yapmasına izin vereceğini duyurdu.
Haberler
Spotify, Apple Podcasts için HLS video desteği sunacak
Spotify’ın Megaphone ve Spotify for Creators hizmetleri, Apple Podcasts’te yayınlanan podcast’ler için video desteğini sunacak.
Yayınlanma tarihi
2 gün önce=>
23 Mayıs 2026
Spotify’ın Megaphone ve Spotify for Creators hizmetleri, Apple Podcasts’te yayınlanan podcast’ler için video desteğini sunacak. Apple bu yılın başlarında HLS video desteğini duyurduğunda, bu iki şirket HLS video desteğini açıklamayan tek büyük podcast barındırma platformuydu. Henüz bir fiyatlandırma açıklanmadı. Ancak bu, Spotify’da videoların işleyişini değiştirmiyor: Şirket, videoların Spotify uygulamasında oynatılabilmesi için hâlâ doğrudan yüklenmesini şart koşuyor.
Şirket ayrıca Spotify Video Distribution (podcast barındırma hizmetinizin sizin adınıza videoları doğrudan Spotify’a yüklemesini sağlayan hizmet) için canlı ortaklarını da duyurdu. Libsyn, Podigee, Audioboom, Audiomeans ve Podspace bu özelliği kullanıma sundu. Spotify Video Distribution, Ocak ayında duyurulmuştu; o zaman Acast ve Omny Studio, lansman ortakları olarak öne çıkarılmıştı, ancak henüz yayında değiller. Spotify, SSS bölümünde artık, fikrinizi değiştirirseniz programınızı tekrar sadece ses içeren bir RSS beslemesine geçirebileceğinizi açıkça belirtiyor; ancak şirket, tüm video yüklemelerinizi kaybedeceğinizi uyarıyor.
Haberler
Spotify, yapay zeka tarafından üretilen kişiselleştirilmiş ses içeriklerinin merkezi olmayı hedefliyor
Spotify, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanılarak ve yine Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturulabileceğini ve daha sonra dinlemek üzere Spotify’a aktarılabileceğini duyurdu.
Yayınlanma tarihi
1 hafta önce=>
16 Mayıs 2026
Son birkaç yıldır, Google’ın NotebookLM, Hero ve son zamanlarda Adobe Acrobat gibi uygulamaları, kullanıcılara belgeler, günlük programlar ve makaleler gibi mevcut materyallere dayalı podcast’ler oluşturma olanağı sağladı. Şimdi Spotify da bu podcast’lere uygulaması içinden erişmenize izin veriyor, ancak bunu yapmak için bazı programlama araçlarına ihtiyacınız olacak.
Şirket, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanıyorsanız, Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturabileceğinizi ve daha sonra dinlemek üzere Spotify’a aktarabileceğinizi belirtti.
Şirket bir blog yazısında, “İnsanlar şimdiden asistanlarını kullanarak günlerini yönlendiren kişisel ses kayıtları oluşturmaya başladılar: sınav öncesi ders notlarının özetlerinden takvimlerindeki etkinliklerin bilgilendirmelerine kadar. Ve zaten her şeyi dinledikleri Spotify’da bunları da dinlemenin bir yolunu istiyorlar” dedi .
Podcast’ler, kolay erişim için kullanıcının Spotify kütüphanesinde görünecek ancak diğer Spotify kullanıcıları tarafından erişilemeyecek.
Yeni özellikten yararlanmak için kullanıcılar aracın GitHub sayfasına gidip oradaki talimatları takip edebilirler. Ardından, bir tarayıcı aracılığıyla Spotify hesaplarına giriş yapmaları istenecektir.
Bundan sonra, “Bana Dünya Kupası’nın tarihine derinlemesine inen, önemli oyuncular, nerede düzenlendiği ve bu yılki maçlar hakkında bilmem gerekenler hakkında detaylar içeren bir ses kaydı oluşturun” gibi bir istek yazabilir ve ajansdan bir podcast oluşturmasını ve Spotify’a kaydetmesini isteyebilirler. Kullanıcılar ayrıca podcast’lerinin Spotify listesine bir bağlantı da alacaklardır.
Kaynak: Ivan Mehta / TechCrunch

Spotify yapay zeka destekli kişiselleştirilmiş podcast’leri tanıttı

Spotify, Apple Podcasts için HLS video desteği sunacak

Spotify, yapay zeka tarafından üretilen kişiselleştirilmiş ses içeriklerinin merkezi olmayı hedefliyor
En son
- Araştırma2 yıl önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Haberler4 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Etkinlik3 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Haberler3 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Haberler4 yıl önce
Video podcast nedir?
- Araştırma4 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler4 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler4 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı












