Haberler
OpenAI bir yıl önce duyurduğu ses klonlama aracı ‘Voice Engine’i hala yayınlamadı
OpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir önizlemesini” duyurdu. Yaklaşık bir yıl sonra, araç önizleme aşamasında kalmaya devam ediyor ve OpenAI ne zaman piyasaya sürülebileceğine ya da hiç piyasaya sürülüp sürülmeyeceğine dair hiçbir belirti vermedi.
Yayınlanma tarihi
8 ay önceon
Yazar :
Podcast TurkeyOpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir önizlemesini” duyurdu. Yaklaşık bir yıl sonra, araç önizleme aşamasında kalmaya devam ediyor ve OpenAI ne zaman piyasaya sürülebileceğine ya da hiç piyasaya sürülüp sürülmeyeceğine dair hiçbir belirti vermedi.
Şirketin hizmeti yaygınlaştırma konusundaki isteksizliği, kötüye kullanım korkusuna işaret ediyor olabilir, ancak aynı zamanda düzenleyici incelemeyi davet etmekten kaçınma çabasını da yansıtabilir. OpenAI geçmişte güvenlik pahasına “parlak ürünlere” öncelik vermekle ve rakip firmaları pazara sürmek için acele etmekle suçlanmıştı.
Bir OpenAI sözcüsü yaptığı açıklamada, şirketin Voice Engine’i sınırlı sayıda “güvenilir ortak” ile test etmeye devam ettiğini söyledi.
Sözcü, “[Ortaklarımızın] teknolojiyi nasıl kullandıklarını öğreniyoruz, böylece modelin kullanışlılığını ve güvenliğini geliştirebiliriz” dedi. “Konuşma terapisinden dil öğrenimine, müşteri desteğine, video oyunu karakterlerine ve yapay zeka avatarlarına kadar farklı kullanım şekillerini görmek bizi heyecanlandırdı.”
Geri itildi
OpenAI’nin metinden konuşmaya API’sinde ve ChatGPT’nin Ses Modunda bulunan seslere güç veren Voice Engine, orijinal konuşmacıya çok benzeyen doğal sesli konuşma üretir. Araç, yazılı karakterleri konuşmaya dönüştürüyor ve yalnızca içerikle ilgili belirli korkuluklarla sınırlı. Ancak en başından beri gecikmelere ve değişen sürüm pencerelerine maruz kaldı.
OpenAI’nin Haziran 2024 tarihli bir blog yazısında açıkladığı gibi, Ses Motoru modeli, farklı sesleri, aksanları ve konuşma tarzlarını dikkate alarak, bir konuşmacının belirli bir metin transkripti için çıkaracağı en olası sesleri tahmin etmeyi öğreniyor. Bundan sonra, model yalnızca metnin sözlü versiyonlarını değil, aynı zamanda farklı konuşmacı türlerinin metni yüksek sesle nasıl okuyacağını yansıtan “sözlü ifadeler” de üretebilir.
TechCrunch tarafından görülen taslak bir blog yazısına göre OpenAI başlangıçta Özel Sesler olarak adlandırılan Ses Motorunu 7 Mart 2024’te API’sine getirmeyi amaçlıyordu. Plan, “sosyal fayda” sağlayan veya teknolojinin “yenilikçi ve sorumlu” kullanımlarını gösteren uygulamalar geliştiren geliştiricilere öncelik verilerek, daha geniş bir çıkıştan önce 100’e kadar “güvenilir geliştirici” grubuna erişim sağlamaktı. OpenAI bu teknolojiyi markalaştırmış ve fiyatlandırmıştı bile: “standart” sesler için milyon karakter başına 15 dolar ve “HD kalitesinde” sesler için milyon karakter başına 30 dolar.
Ardından, on birinci saatte şirket duyuruyu erteledi. OpenAI, Voice Engine’i birkaç hafta sonra herhangi bir kayıt seçeneği olmadan tanıttı. OpenAI, araca erişimin şirketin 2023’ün sonlarında birlikte çalışmaya başladığı yaklaşık 10 geliştiriciden oluşan bir kohortla sınırlı kalacağını söyledi.
OpenAI, Voice Engine’in Mart 2024 sonundaki duyuru blog yazısında “Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz” diye yazdı. “Bu konuşmalara ve küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte kullanılıp kullanılmayacağı ve nasıl kullanılacağı konusunda daha bilinçli bir karar vereceğiz.”
Uzun süredir üzerinde çalışılıyor
OpenAI’ye göre Voice Engine 2022’den beri üzerinde çalışılan bir araç. Şirket, aracın potansiyelini ve risklerini göstermek için 2023 yazında “en üst düzeydeki küresel politika yapıcılara” demo yaptığını iddia ediyor.
Bugün aralarında engelli insanların daha doğal iletişim kurmasını sağlayan cihazlar geliştiren Livox’un da bulunduğu çok sayıda iş ortağı Voice Engine’e erişebiliyor. Livox’un CEO’su Carlos Pereira TechCrunch’a verdiği demeçte, aracın çevrimiçi olması gerekliliği nedeniyle (Livox’un müşterilerinin çoğunun interneti yok) Voice Engine’i bir ürün haline getiremediklerini, ancak teknolojiyi “gerçekten etkileyici” bulduğunu söyledi.
Pereira TechCrunch’a e-posta yoluyla yaptığı açıklamada, “Sesin kalitesi ve seslerin farklı dillerde konuşması imkanı benzersiz – özellikle de müşterilerimiz olan engelli insanlar için” dedi. “Gerçekten de gördüğüm en etkileyici ve kullanımı kolay ses oluşturma [aracı] […] OpenAI’nin yakında çevrimdışı bir sürüm geliştirmesini umuyoruz.”
Pereira, OpenAI’den olası bir Voice Engine lansmanı konusunda rehberlik almadığını ve şirketin hizmet için ücret almaya başlamayı planladığına dair herhangi bir işaret görmediğini söylüyor. Livox şimdiye kadar kullanımı için ödeme yapmak zorunda kalmadı.
Yukarıda bahsedilen Haziran 2024 tarihli gönderide OpenAI, Voice Engine’i geciktirirken göz önünde bulundurduğu hususlardan birinin geçen yılki ABD seçim döngüsü sırasında kötüye kullanım potansiyeli olduğunu ima etti. Paydaşlarla yapılan görüşmeler sonucunda Voice Engine, üretilen sesin kaynağını izlemek için filigran da dahil olmak üzere çeşitli hafifletici güvenlik önlemlerine sahiptir.
OpenAI’ye göre, geliştiriciler Voice Engine’i kullanmadan önce orijinal konuşmacıdan “açık onay” almalı ve izleyicilerine seslerin yapay zeka tarafından üretildiğine dair “açık açıklamalar” yapmalıdır. Ancak şirket bu politikaları nasıl uygulayacağını açıklamadı. OpenAI’nin kaynaklarına sahip bir şirket için bile bunu geniş ölçekte yapmak son derece zor olabilir.
OpenAI blog yazılarında ayrıca hoparlörleri doğrulamak için bir “ses kimlik doğrulama deneyimi” ve tanınmış kişilere çok benzeyen seslerin oluşturulmasını engelleyen bir “gidilmeyecekler” listesi oluşturmayı umduğunu ima etti. Her ikisi de teknolojik açıdan iddialı projeler ve bunları yanlış yapmak, sık sık güvenlik girişimlerini bir kenara bırakmakla suçlanan bir şirkete kötü yansıyacaktır.
Etkili filtreleme ve kimlik doğrulama, sorumlu ses klonlama teknolojisi sürümleri için hızla temel gereksinimler haline geliyor. Bir kaynağa göre yapay zeka ses klonlama, 2024’ün en hızlı büyüyen üçüncü dolandırıcılığı oldu. Gizlilik ve telif hakkı yasaları ayak uydurmakta zorlanırken, dolandırıcılık ve banka güvenlik kontrollerinin atlanmasına yol açtı. Kötü niyetli aktörler, ünlülerin ve politikacıların kışkırtıcı deepfake’lerini yaratmak için ses klonlamayı kullandı ve bu deepfake’ler sosyal medyada orman yangını gibi yayıldı.
OpenAI Voice Engine’i önümüzdeki hafta yayınlayabilir ya da hiç yayınlamayabilir. Şirket defalarca bu hizmetin kapsamını küçük tutmayı düşündüğünü söyledi. Ancak net olan bir şey var: Optik nedenlerden, güvenlik nedenlerinden ya da her ikisinden dolayı, Voice Engine’in sınırlı önizlemesi OpenAI’nin tarihindeki en uzun önizlemelerden biri haline geldi.
Kaynak: TechCrunch
Beğenebilirsin
Haberler
Podcast’iniz için “Yapay Zeka Görünürlüğü” kontrol listesi
Rob Greenlee, podcast’iniz için bir klavuz niteliğinde “Yapay Zeka Görünürlüğü” kontrol listesi hazırladı.
Yayınlanma tarihi
18 saat önce=>
18 Ekim 2025Podcast, video veya blog içeriğinizi yapay zeka ve yeni kitlelere görünür kılmanıza yardımcı olacak basit, adım adım bir kılavuz.
- Gösterinizi kaydedin. Hedef kitlenizin önemsediği gerçek soruları yanıtlamaya odaklanın.
- Bir transkript alın. Bölümünüzün yazılı bir versiyonunu oluşturmak için Descript, YouTube altyazıları veya CapCut gibi araçları kullanın.
- Her bölüm için bir ana sayfa oluşturun. Bu, insanların ve yapay zekanın her şeyi bulduğu gösterinizin ana üssüdür.
- İçeriğinizi bu sayfaya ekleyin. Video veya ses oynatıcınızı, kısa bir özeti, transkripti ve konuklara veya sosyal medyaya bağlantılar ekleyin.
- Soru-Cevap tarzında yazın. Örnek: Soru: ‘Podcast’imi nasıl hızlı büyütebilirim?’ Cevap: ‘Tutarlı olun, kısa klipler kullanın ve haftalık olarak yayınlayın.’ Mümkünse bir örnek veya istatistik ekleyin.
- Sayfanızı okunması kolay hale getirin. Kısa paragraflar, madde işaretleri ve net başlıklar kullanın. Önemli Noktalar listesiyle bitirin.
- Videolarınıza altyazılar ve bölümler ekleyin. Altyazılar ve zaman damgaları yükleyin, böylece yapay zeka ve insanlar önemli kısımları bulabilir.
- Her şeyi birbirine bağlayın. YouTube, podcast şov notları ve blog sayfalarının birbirine bağlandığından emin olun.
- Doğal yazın, bir arkadaşınızla konuşur gibi konuşun. Moda sözcükleri ve ekstra anahtar kelimeleri atlayın.
- Odaklanın. Sayfa başına bir konu veya soruyu ele alın. Spesifik olmak, genel olmaktan daha iyidir.
- Yayınlayın ve paylaşın. Herkese açık olarak yayınlayın, ardından yapay zekanın bulmasını sağlamak için Google Search Console veya Bing Web Yöneticisi Araçları’nı kullanın.
- Güncel tutun. Eski gönderileri birkaç ayda bir yeni bilgiler veya düzenlemelerle güncelleyin, böylece yapay zeka güncel olarak görsün.
Hızlı İpuçları
- Tüm bölümlerinize ve blog yazılarınıza bağlantılar içeren bir ‘Kaynaklar’ sayfası oluşturun.
- Konuklarınızdan bölüm sayfanıza bağlantı vermelerini isteyin; bu, güven ve görünürlük oluşturur.
- Daha güçlü arama tanınırlığı için açıklamalarınızda gösteri adınızı ve adınızı tekrarlayın.
- Gösteri sayfanızın bağlantısını her zaman YouTube video açıklamalarına ve podcast gösteri notlarına ekleyin.
Kaynakça: Rob Greenlee
Haberler
Hoşça kal ana akım medya, merhaba siyasi podcast’ler
Wall Street Journal öğrencilere podcast’ler hakkında sorular sordu ve bunların artık geleneksel medyadan daha iyi bir haber kaynağı olup olmadığını araştırdı. Öğrenciler, geleneksel kaynaklara bağımlı kalmak yerine alternatif haber kaynaklarına yönelmeyi tercih ediyor.
Yayınlanma tarihi
18 saat önce=>
18 Ekim 2025Gerçek ama Gerçek Değil
Podcast’lerin Z Kuşağı için en büyük cazibesi, sunucuların ve konuklarının özgünlüğüdür. Podcast’ler, medyadaki benzersiz konumlarını kullanarak dinleyicilerinde güven ve inanç oluştururlar. Dinleyiciler, olumlu habercilikten kimin faydalandığı veya hangi haberlerin öfkeyi körükleyip reytingleri artırmak için seçildiği konusunda spekülasyon yapmak zorunda kalmamalıdır. Aksine, podcast sunucuları samimi davranarak ve siyasi görüşlerini açıkça ifade ederek para kazanırlar; bu da, olayları olduğu gibi duymayı seven dinleyicilerde yankı bulur.
Bu değişim harika olsa da, doğru habercilik ve profesyonel gazetecilik ilkelerinin eksikliği, çoğu dinleyicinin farkında olmadığı podcast’lerin bariz bir zayıflığıdır. İvermektinin Covid’i iyileştirdiği veya Sandy Hook katliamının sahte bir saldırı olduğu söylendiğinde ve bu iddiaları çürütecek hiçbir somut kanıt olmadığında, samimiyet ancak bir yere kadar geçerlidir. Bu ortamda profesyonel haberciliğe ihtiyaç var.
Mirasçı medya, siyasi podcast’lerin başarısından uzun zamandır unutulmuş bir şey öğrenebilir: Görevi partiye veya başkana değil, halka karşıdır. Mirasçı medya tekrar güven kazanmak istiyorsa, bir zamanlar onu her Amerikalı için başvurulacak kaynak haline getiren profesyonellik ve ilkelere geri dönmelidir.
Seth Winigrad (Villanova Üniversitesi, Hukuk)
Bir Konuşma Uzun Bir Yol Alır
Siyasi haberler için podcast’lere yönelmek, Z Kuşağı için bir tercihin yan ürünü değil, aşırı basitleştirmelerin hakim olduğu ana akım medya ortamında gerçeğe aç bir neslin sonucudur. 24 saatlik haber döngüsünün derin ve çeşitli konuları anlamlı bir ayırt etme becerisi olmadan hızla aktarması, gençleri gerçeği başka yerlerde aramaya itmiştir.
Derin ve düşündürücü bir sohbet aracılığıyla hakikati gerçekten arayan biriyle röportaj yaparken, üç saat boyunca yalan söylemek zordur. Podcast’ler yalnızca medya önyargılarını kırmak için bir kazanım değil, aynı zamanda bir çözümdür. Podcast yayıncılarının bağımsızlığı, izleyicileriyle sürekli iletişim kurmayı gerektirir ve bu da bu ortamı siyasi süreçte vatandaş katılımının güçlü bir biçimi haline getirir.
Bu, podcast dünyasında önyargıların olmadığı anlamına gelmez. Aslında, podcast yayıncıları dinleyicilerinin entelektüel güvenini korumak için siyasi önyargılarını açıkça dile getirirler. Kutuplaşmış bir toplumda yankı odaları her zaman bir sorun olacaktır. Aradaki fark, tarafsızlığın arkasına saklanan medya önyargısının, siyasi inançlarının gerçeği ortaya çıkarmanın önüne geçmesine izin vermeyen iki kişi arasındaki dürüst bir sohbetten her zaman daha az ilgi çekici olmasıdır.
Gabriele Grant (Rutgers Üniversitesi, Ekonomi ve Felsefe)
Bütün Sesler Yardımcı Oluyor mu?
Podcast’ler, tarz, mecra veya içerik açısından radyodan çok da farklı değildir. Bununla birlikte, onları benzersiz ve popüler kılan özellikler, aynı zamanda sorunlu da olabilir. Günümüzün hızlı tempolu medya ortamının trendini takip eden podcast’ler, bilginin neredeyse herkes tarafından dağıtılmasına olanak tanır.
Bu ayrım, dünya çapında yaklaşık 44.000 radyo istasyonuna kıyasla 4,5 milyondan fazla podcast’te açıkça görülmektedir. Radyonun aksine, podcast’ler sinyal erişimi veya yayın süresi sağlama maliyetleriyle sınırlı değildir. Dahası, ABD’deki podcast’ler Federal İletişim Komisyonu tarafından düzenlenmediğinden, podcast yayıncıları istedikleri her türlü söylemi, ne kadar küfürlü olursa olsun, kullanabilirler.
Belki de podcast’leri ayda en az bir kez dinlediklerini bildiren Z kuşağının yaklaşık yarısı ila üçte ikisi için bu kadar çekici kılan özelliklerdir. Sonuçta, podcast sunucuları daha fazla içerik çeşitliliği sunar, niş ilgi alanlarına ulaşmada daha verimlidir ve dillerine dikkat etme konusunda daha az baskı altındadır.
Daha az engel, her iki tarafı da etkiler. Podcast’ler, ulusal tartışmaya katkıda bulunan birçok yeni sesin ortaya çıkmasını sağladı. Ancak kişiselleştirilmiş podcast’lerin bolluğu, dengeli kaynaklar arama konusunda daha az teşvik anlamına gelirken, podcast içeriğinin kalitesi ve doğruluğu da değişkenlik gösterebilir. Dinleyiciler eleştirel bir şekilde etkileşimde bulunup duyduklarını doğrulamazlarsa, podcast içeriğine kolay erişim faydadan çok zarar verebilir.
Kevin Murphy (Loyola Üniversitesi Chicago, Tıp)
Podcast Bireyselciliğini Anlamak
İnsanlar yakınlık ister. Sabah haberlerini veren kişiyi tanıyormuş gibi hissetmek isterler. Bir figüran değil, bir arkadaş isterler. Gençler, daha kişisel oldukları için podcast’lere akın ediyor. Sunucuların konu dışı konuşmaları, kendilerine özgü halleri ve özel hayata dair kesitler, dinleyicilerde bağ hissi yaratıyor. İnsanlar internette siyasi görüşleri kendileriyle en uyumlu kişiyi arayabilir. Bir sunucuya bağımlı hale gelebilirler ve haberlerin bilgilendirici yönü ikincil hale gelebilir.
Podcast’lerin siyasi haberlerin kalitesini tehdit eden şey, tam da bu özgün ve kişiselleştirilmiş yönüdür. Z Kuşağı, “mükemmel” podcast’i arayarak kendini sınırlandırıyor, tek bir kişinin görüşlerine güveniyor ve farkında olmasalar da, hangi konuların ele alınmaya değer olduğuna dair o kişinin yargısını kabul ediyor.
Sunucunun ideolojisi, muhtemelen bu görüşlere meydan okuyabilecek başka siyasi medyayı çok az takip eden veya hiç takip etmeyen dinleyicilere dayatılıyor. Dengeli bir yayın umudunu ve çoğu siyasi görüşlerini destekleyen bir podcast’i tercih ettiği için bakış açılarını yeniden değerlendirme şansını kaybediyorlar. Siyasi görüşler ise geçmiş inançlar tarafından şekillendiriliyor ve sorgulanmıyor.
Yazdığım kişiler bunu asla görmeyecekler ve sorun da burada yatıyor.
Dilan Shingadia (Brown Üniversitesi, Uygulamalı Matematik ve Ekonomi)
Kaynak: Wall Street Journal
Haberler
Netflix ve Spotify video podcast ortaklığı kurdu
Netflix ve Spotify, Spotify’ın en iyi video podcast’lerinden oluşan özel bir seçkiyi Netflix’e sunmak için yeni bir ortaklık duyurdu. Bu ortaklık, Spotify Studios ve The Ringer’dan spor, kültür, yaşam tarzı ve gerçek suç içerikli podcast’ler sunarak Netflix’in mevcut programlarını tamamlayacak ve diziler için yeni kitlelere ve daha geniş bir dağıtım ağına ulaşacak.
Yayınlanma tarihi
20 saat önce=>
18 Ekim 2025Netflix ve Spotify, Spotify’ın en iyi video podcast’lerinden oluşan özel bir seçkiyi Netflix’e sunmak için yeni bir ortaklık duyurdu.
Bu ortaklık, Spotify Studios ve The Ringer’dan spor, kültür, yaşam tarzı ve gerçek suç içerikli podcast’ler sunarak Netflix’in mevcut programlarını tamamlayacak ve diziler için yeni kitlelere ve daha geniş bir dağıtım ağına ulaşacak.
Bu ilk seçki, Netflix ve Spotify arasındaki ortaklığın sadece başlangıcı. Spotify, farklı türlerden ve stüdyolardan daha fazla podcast eklemeye devam edecek.
Video sadece popüler değil, aynı zamanda hayranların da istediği bir şey: Cumulus Media araştırmasına göre, podcast dinleyicilerinin %72’si videolu programları tercih ettiğini söyledi.
Video podcast’ler 2026’nın başlarında ABD’de Netflix’te, ardından diğer pazarlarda da yayınlanmaya başlayacak.
Netflix İçerik Lisanslama ve Programlama Stratejisi Başkan Yardımcısı Lauren Smith, “Netflix’te, üyelerimizi istedikleri yerde ve istedikleri şekilde eğlendirmenin yeni yollarını sürekli arıyoruz,” dedi ve şöyle devam etti:
“Video podcast’lerin yükselişte olduğu bir dönemde, Spotify ile ortaklığımız sayesinde bu en iyi programların tam video versiyonlarını Netflix ve Spotify’a getiriyoruz. Popüler kültürden yaşam tarzına, gerçek suçlardan spora kadar, özenle seçilmiş bu video podcast seçkisi Netflix’e yeni sesler ve yeni bakış açıları katarak eğlence programlarımızı her zamankinden daha heyecan verici hale getiriyor. Bu, içerik üreticilere daha fazla seçenek sunuyor ve yepyeni bir dağıtım fırsatı sunuyor.”
Spotify Podcast’lerden Sorumlu Başkan Yardımcısı Roman Wasenmüller de, “Bu ortaklık, podcast yayıncılığında yeni bir dönemin başlangıcını işaret ediyor” dedi ve sözlerine şunları ekledi:
“Netflix ile birlikte keşfi genişletiyor, içerik üreticilerinin yeni kitlelere ulaşmasına yardımcı oluyor ve dünyanın dört bir yanındaki hayranlara sevdikleri hikayeleri deneyimleme ve hiç beklemedikleri favorilerini keşfetme şansı veriyoruz. Bu, içerik üreticilere daha fazla seçenek sunuyor ve yepyeni bir dağıtım fırsatının kapısını açıyor.”
Aşağıda başlangıçta yayınlanacak podcast’lerin seçilmiş bir listesi bulunmaktadır:
Spor
- The Bill Simmons Podcast
- The Zach Lowe Show
- The McShay Show
- Fairway Rollin’
- The Mismatch
- The Ringer F1 Show
- The Ringer Fantasy Football Show
- The Ringer NFL Show
- The Ringer NBA Show
Kültür/Yaşam tarzı
Gerçek Suç
Kaynak: Spotify Newsroom
Podcast’iniz için “Yapay Zeka Görünürlüğü” kontrol listesi
Hoşça kal ana akım medya, merhaba siyasi podcast’ler
Netflix ve Spotify video podcast ortaklığı kurdu
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Araştırma1 yıl önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Haberler3 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik2 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Haberler3 yıl önce
Video podcast nedir?
- Araştırma4 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı