Haberler

OpenAI bir yıl önce duyurduğu ses klonlama aracı ‘Voice Engine’i hala yayınlamadı

OpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir önizlemesini” duyurdu. Yaklaşık bir yıl sonra, araç önizleme aşamasında kalmaya devam ediyor ve OpenAI ne zaman piyasaya sürülebileceğine ya da hiç piyasaya sürülüp sürülmeyeceğine dair hiçbir belirti vermedi.

Yayınlanma tarihi

1 yıl önce

7 Mart 2025

Yazar :

Podcast Turkey

Şirketin hizmeti yaygınlaştırma konusundaki isteksizliği, kötüye kullanım korkusuna işaret ediyor olabilir, ancak aynı zamanda düzenleyici incelemeyi davet etmekten kaçınma çabasını da yansıtabilir. OpenAI geçmişte güvenlik pahasına “parlak ürünlere” öncelik vermekle ve rakip firmaları pazara sürmek için acele etmekle suçlanmıştı.

Bir OpenAI sözcüsü yaptığı açıklamada, şirketin Voice Engine’i sınırlı sayıda “güvenilir ortak” ile test etmeye devam ettiğini söyledi.

Sözcü, “[Ortaklarımızın] teknolojiyi nasıl kullandıklarını öğreniyoruz, böylece modelin kullanışlılığını ve güvenliğini geliştirebiliriz” dedi. “Konuşma terapisinden dil öğrenimine, müşteri desteğine, video oyunu karakterlerine ve yapay zeka avatarlarına kadar farklı kullanım şekillerini görmek bizi heyecanlandırdı.”

Geri itildi

OpenAI’nin metinden konuşmaya API’sinde ve ChatGPT’nin Ses Modunda bulunan seslere güç veren Voice Engine, orijinal konuşmacıya çok benzeyen doğal sesli konuşma üretir. Araç, yazılı karakterleri konuşmaya dönüştürüyor ve yalnızca içerikle ilgili belirli korkuluklarla sınırlı. Ancak en başından beri gecikmelere ve değişen sürüm pencerelerine maruz kaldı.

OpenAI’nin Haziran 2024 tarihli bir blog yazısında açıkladığı gibi, Ses Motoru modeli, farklı sesleri, aksanları ve konuşma tarzlarını dikkate alarak, bir konuşmacının belirli bir metin transkripti için çıkaracağı en olası sesleri tahmin etmeyi öğreniyor. Bundan sonra, model yalnızca metnin sözlü versiyonlarını değil, aynı zamanda farklı konuşmacı türlerinin metni yüksek sesle nasıl okuyacağını yansıtan “sözlü ifadeler” de üretebilir.

TechCrunch tarafından görülen taslak bir blog yazısına göre OpenAI başlangıçta Özel Sesler olarak adlandırılan Ses Motorunu 7 Mart 2024’te API’sine getirmeyi amaçlıyordu. Plan, “sosyal fayda” sağlayan veya teknolojinin “yenilikçi ve sorumlu” kullanımlarını gösteren uygulamalar geliştiren geliştiricilere öncelik verilerek, daha geniş bir çıkıştan önce 100’e kadar “güvenilir geliştirici” grubuna erişim sağlamaktı. OpenAI bu teknolojiyi markalaştırmış ve fiyatlandırmıştı bile: “standart” sesler için milyon karakter başına 15 dolar ve “HD kalitesinde” sesler için milyon karakter başına 30 dolar.

Ardından, on birinci saatte şirket duyuruyu erteledi. OpenAI, Voice Engine’i birkaç hafta sonra herhangi bir kayıt seçeneği olmadan tanıttı. OpenAI, araca erişimin şirketin 2023’ün sonlarında birlikte çalışmaya başladığı yaklaşık 10 geliştiriciden oluşan bir kohortla sınırlı kalacağını söyledi.

OpenAI, Voice Engine’in Mart 2024 sonundaki duyuru blog yazısında “Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz” diye yazdı. “Bu konuşmalara ve küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte kullanılıp kullanılmayacağı ve nasıl kullanılacağı konusunda daha bilinçli bir karar vereceğiz.”

Uzun süredir üzerinde çalışılıyor

OpenAI’ye göre Voice Engine 2022’den beri üzerinde çalışılan bir araç. Şirket, aracın potansiyelini ve risklerini göstermek için 2023 yazında “en üst düzeydeki küresel politika yapıcılara” demo yaptığını iddia ediyor.

Bugün aralarında engelli insanların daha doğal iletişim kurmasını sağlayan cihazlar geliştiren Livox’un da bulunduğu çok sayıda iş ortağı Voice Engine’e erişebiliyor. Livox’un CEO’su Carlos Pereira TechCrunch’a verdiği demeçte, aracın çevrimiçi olması gerekliliği nedeniyle (Livox’un müşterilerinin çoğunun interneti yok) Voice Engine’i bir ürün haline getiremediklerini, ancak teknolojiyi “gerçekten etkileyici” bulduğunu söyledi.

Pereira TechCrunch’a e-posta yoluyla yaptığı açıklamada, “Sesin kalitesi ve seslerin farklı dillerde konuşması imkanı benzersiz – özellikle de müşterilerimiz olan engelli insanlar için” dedi. “Gerçekten de gördüğüm en etkileyici ve kullanımı kolay ses oluşturma [aracı] […] OpenAI’nin yakında çevrimdışı bir sürüm geliştirmesini umuyoruz.”

Pereira, OpenAI’den olası bir Voice Engine lansmanı konusunda rehberlik almadığını ve şirketin hizmet için ücret almaya başlamayı planladığına dair herhangi bir işaret görmediğini söylüyor. Livox şimdiye kadar kullanımı için ödeme yapmak zorunda kalmadı.

Yukarıda bahsedilen Haziran 2024 tarihli gönderide OpenAI, Voice Engine’i geciktirirken göz önünde bulundurduğu hususlardan birinin geçen yılki ABD seçim döngüsü sırasında kötüye kullanım potansiyeli olduğunu ima etti. Paydaşlarla yapılan görüşmeler sonucunda Voice Engine, üretilen sesin kaynağını izlemek için filigran da dahil olmak üzere çeşitli hafifletici güvenlik önlemlerine sahiptir.

OpenAI’ye göre, geliştiriciler Voice Engine’i kullanmadan önce orijinal konuşmacıdan “açık onay” almalı ve izleyicilerine seslerin yapay zeka tarafından üretildiğine dair “açık açıklamalar” yapmalıdır. Ancak şirket bu politikaları nasıl uygulayacağını açıklamadı. OpenAI’nin kaynaklarına sahip bir şirket için bile bunu geniş ölçekte yapmak son derece zor olabilir.

OpenAI blog yazılarında ayrıca hoparlörleri doğrulamak için bir “ses kimlik doğrulama deneyimi” ve tanınmış kişilere çok benzeyen seslerin oluşturulmasını engelleyen bir “gidilmeyecekler” listesi oluşturmayı umduğunu ima etti. Her ikisi de teknolojik açıdan iddialı projeler ve bunları yanlış yapmak, sık sık güvenlik girişimlerini bir kenara bırakmakla suçlanan bir şirkete kötü yansıyacaktır.

Etkili filtreleme ve kimlik doğrulama, sorumlu ses klonlama teknolojisi sürümleri için hızla temel gereksinimler haline geliyor. Bir kaynağa göre yapay zeka ses klonlama, 2024’ün en hızlı büyüyen üçüncü dolandırıcılığı oldu. Gizlilik ve telif hakkı yasaları ayak uydurmakta zorlanırken, dolandırıcılık ve banka güvenlik kontrollerinin atlanmasına yol açtı. Kötü niyetli aktörler, ünlülerin ve politikacıların kışkırtıcı deepfake’lerini yaratmak için ses klonlamayı kullandı ve bu deepfake’ler sosyal medyada orman yangını gibi yayıldı.

OpenAI Voice Engine’i önümüzdeki hafta yayınlayabilir ya da hiç yayınlamayabilir. Şirket defalarca bu hizmetin kapsamını küçük tutmayı düşündüğünü söyledi. Ancak net olan bir şey var: Optik nedenlerden, güvenlik nedenlerinden ya da her ikisinden dolayı, Voice Engine’in sınırlı önizlemesi OpenAI’nin tarihindeki en uzun önizlemelerden biri haline geldi.

Kaynak: TechCrunch

Benzer konular:

Bir sonraki

YouTube podcasting’i nasıl görüyor?

Kaçırmayın

Sesame AI etkileyici sesli asistanını tanıttı

Okumaya devam et

Yorum yapmak için tıklayın

Haberler

Spotify, podcast dinleme deneyimini yeniden tanımlıyor

Spotify, podcast “dinleme” kavramına yeni bir tanım getirerek, zamana dayalı bir ölçüt belirledi. Spotify, podcast “dinleme” kavramına yeni bir tanım getirerek, zamana dayalı bir ölçüt belirledi.

Yayınlanma tarihi

2 hafta önce

13 Haziran 2026

Podcast Turkey

Spotify, podcast “dinleme” kavramına yeni bir tanım getirerek, zamana dayalı bir ölçüt belirledi. Bu değişiklik, Spotify’ın bakış açısına göre toplam dinleme sayılarını düşürürken, potansiyel reklamverenlere tüketim konusunda daha doğru raporlar sunacak.

Bundan böyle, Spotify’ın podcast dinleme tanımı en az 30 saniye olacak. Bu standart, hem sesli hem de görüntülü içeriklerin dinlenmeleri için geçerli olacak.

Buradaki amaç, podcast oynatmanın yanlışlıkla başlatılması veya kullanıcının hızlıca ileri sarması gibi kazaları önleyerek netlik sağlamak. Amaç, podcast yayıncıları ve ağlar için temel bir başarı ölçütü oluşturmak.

Şimdi podcast yayıncıları için zorluk, dinleyicilerin ilgisini canlı tutmak ve her tıklamanın atfedilebilir bir oynatma haline gelmesi için bölüm başlangıçlarını optimize etmek olacak. Bu, zaten podcast yayıncılarının oynatma metriklerini ifşa ettiği için şikayetlerine maruz kalan Spotify için zorlu bir halkla ilişkiler durumu.

Okumaya devam et

Haberler

4 Temmuz, Bağımsız Podcast Yayıncıları Günü ilan edildi

4 Temmuz, Bağımsız Podcast Yayıncıları Günü olarak ilan edildi. Bu günde bağımsız podcast yayıncılığının en iyi örneklerini ve neden sektörümüzün temeli olmaya devam ettiğini gösteren vaka çalışmaları ve içerik oluşturucu hikayeleri sergilenecek. Orbit ve Mercury tarafından organize edilen etkinliğe, web sitesi üzerinden destek verebilirsiniz.

Yayınlanma tarihi

3 hafta önce

6 Haziran 2026

Podcast Turkey

Mercury ve Orbit, 4 Temmuz’u bağımsız podcast yaratıcıları için yeni bir yıllık kutlama günü haline getiriyor.

İki şirket, büyük yayın ağlarının dışında dinleyici kitlesi oluşturan podcast’leri ve kişileri tanımak amacıyla düzenlenen küresel bir etkinlik olan Bağımsız Podcast Yayıncıları Günü’nü bu tarih olarak ilan etti.

IndependentPodcastersDay.com adlı yeni bir web sitesi, bağımsız podcast yayıncılarının sektördeki rolünü vurgulayan içerik oluşturucu öyküleri ve örnek olay incelemelerine yer verecek.

Mercury ve Orbit 4 Temmuz’u, Bağımsız Podcast Yayıncıları Günü olarak ilan etti ve tüm bağımsız podcast yayıncılarını bu günü desteklemeye çağırdı.

Yapılan açıklamada şunlar kaydedildi:

4 Temmuz, Mercury ve Orbit’ten, sizin gücünüzle, kendi tarzlarında podcast yapanların ve podcast’lerin küresel bir kutlamasıdır.

IndependentPodcastersDay.com, bağımsız podcast yayıncılığının sunduğu en iyi örnekleri ve sektörümüzün temeli olmaya devam etmesinin nedenlerini sergileyen vaka çalışmaları ve içerik üretici öykülerine yer verecek.

Bugünden itibaren Mercury, herkesi (içerik oluşturucuları, ajansları, yöneticileri ve takipçi ağlarını) web sitesi aracılığıyla Bağımsız Podcast Yayıncıları Günü’ne bağlılıklarını bildirmeye davet ediyor. Bu, bağımsız içeriği sevdiğinizi ve desteklediğinizi ilan etme şansınız. Katılımcı listesi yakında yayınlanacak.

Mercury ve Orbit CEO’su Liam Heffernan, “Bağımsız Podcast Yayıncıları Günü, Mercury ve Orbit’in temsil ettiği her şeyi yansıtıyor. Bağımsız içerik üreticilerini desteklemek, temsil etmek ve güçlendirmek için varız, bu yüzden #IndiePodDay’i başlatmamız mantıklı. Bağımsız yayıncıları yeterince kutlayamıyoruz, bu yüzden takvimde başka bir gün istemeyenlere ‘hatırlamayalım!’ diyoruz! Ve tüm çalışkan, çığır açan içerik üreticilerine, arkanızdayız!” dedi.

Bağımsız Podcast Yayıncıları Günü, her yıl bir önceki yıla dayanarak gelişen, organik ve kullanıcı tarafından oluşturulan yıllık bir etkinlik olarak tasarlanmıştır; bu etkinlikte küresel içerik üretici ekosistemini bir kutlama ve takdir günü için harekete geçiriyoruz. Bu, rekabet etmek veya karşılaştırmakla ilgili değil, bağımsız podcast yayıncılığının benzersiz zorluklarını tanımlayan iyi, kötü ve kaotik durumları paylaşmakla ilgilidir.

Öyleyse hep birlikte bir araya gelelim, çünkü 4 Temmuz artık sonsuza dek Bağımsızlar Günü olarak bilinecek!

Kaynak: PodNews

Okumaya devam et

Haberler

Spotify yapay zeka destekli kişiselleştirilmiş podcast’leri tanıttı

Spotify, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre yapay zeka desteğiyle doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Yeni özellik kapsamında Spotify, “Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserleri hakkında bilgi ver” gibi istemlere dayanarak sesli içerik oluşturacak.

Yayınlanma tarihi

1 ay önce

23 Mayıs 2026

Podcast Turkey

Spotify, platformuna daha fazla yapay zeka özelliği eklerken, yakında kullanıcıların kendi podcast’lerini oluşturmalarına olanak tanıyacağını duyurdu.

Spotify, Perşembe günü düzenlediği yatırımcı gününde, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Bu özellik, kullanıcıların Spotify’a bir istek yazması ve Spotify’ın da bu isteğe göre ses dosyaları oluşturması prensibine dayanan mevcut “İstekli Çalma Listeleri” bölümüne benzer bir mekanizma izliyecek.

Spotify şu örneği verdi:

“Günlük bir özet, merak ettiğiniz bir konu hakkında derinlemesine bir inceleme veya aklınızdaki her şeyin haftalık bir özetini oluşturabilirsiniz. ‘Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserlerinden bahset’ veya ‘Ekonomiyi beş dakikada anlamama yardımcı ol’ gibi isteklerde bulunun ve Spotify, size özel bir sesli özet oluştururken, daha fazlasını keşfedebileceğiniz ilgili bölümlere, programlara ve içerik oluşturuculara da bağlantı verecektir.”

Kullanıcılar daha sonra bu podcast’leri günlük veya haftalık olarak tekrar edecek şekilde planlayabilir, bir ses seçebilir ve ek metin, PDF veya bağlantılar aracılığıyla daha fazla bağlam ekleyebilirler. Bölümler yalnızca her bireyin kendi kütüphanesi aracılığıyla erişilebilir durumda.

Kişisel podcast’ler, önümüzdeki aydan itibaren ABD’deki uygun premium kullanıcılara sunulacak ve belirli sayıda aylık kredi içerecek, ayrıca daha fazla kredi satın alma seçeneği de sunulacak. Spotify ayrıca Perşembe günü, kullanıcıların dinledikleri podcast’ler hakkında Spotify’a sorular sormasına ve yanıt almasına olanak tanıyan yeni bir özellik yayınlayacağını duyurdu.

Spotify’ın eş CEO’su Gustav Söderström, yatırımcı sunumunda şunları söyledi:

“Deneyimin sadece bir katalogdan seçilmediği, her bir kullanıcımız tarafından gerçek zamanlı olarak, zevklerine, bağlamlarına ve niyetlerine göre şekillendirildiği bir Nesil Çağına giriyoruz… Bugün, hem kamuya açık hem de özel içerik için (veya başka bir deyişle) üretken çağ için bir medya oynatıcı yok. Spotify’ın bunu başaracağına inanıyoruz.”

Ayrıca Spotify, podcast içerik üreticilerinin Spotify’daki en ilgili hayranlarından doğrudan düzenli gelir elde etmelerini sağlayan bir yol olarak içerik üretici sponsorluklarını da tanıttı. Şirket ayrıca, podcast ses dosyaları oluşturmak ve kullanıcının takvimine, gelen kutusuna ve notlarına bağlanmak için kullanılabilen bağımsız bir masaüstü uygulaması olan Studio by Spotify Labs‘ı da tanıttı.

Bu özelliklere ek olarak Spotify, biletler satışa çıkmadan önce Spotify Premium sahibi sadık hayranları için iki konser biletini ayıracağını ve premium abonelerin şarkıların yapay zeka tarafından oluşturulmuş cover ve remixlerini yapmasına izin vereceğini duyurdu.

Okumaya devam et