Haberler

Amazon Alexa ölen yakınlarınızın sesini öğrenerek taklit edebiliyor

Amazon, yapay zeka destekli akıllı hoparlörü Echo Dot cihazlarına sahibinin sesini öğrenerek taklit edebilme yeteneği ekledi. Bu sayede istenirse hayatını kaybeden eski kullanıcıların sesleri cihazda “bir şekilde” yaşamaya devam edebilecek.

Yayınlanma tarihi

3 yıl önce

4 Temmuz 2022

Yazar :

Podcast Turkey

Amazon teknoloji zirvesi sırasında bir komodinin üzerine yerleştirilmiş bir Echo Dot’tan bir görevi tamamlaması istendi: “Alexa, Büyükannem bana ‘Oz Büyücüsü’nü okumayı bitirebilir mi?”

Alexa’nın tipik neşeli sesi, panda tasarımlı çocuk temalı akıllı hoparlörden gürledi: “Tamam!”

Ardından, cihaz Korkak Aslan’ın cesaret için yalvardığı bir sahneyi anlatmaya başladığında, Alexa’nın robotik tıngırtısının yerini daha insani bir anlatıcı aldı.

Alexa Yapay Zeka Kıdemli Başkan Yardımcısı ve Baş Bilim Adamı Rohit Prasad, Çarşamba günü Las Vegas’taki bir açılış konuşmasında heyecanla “Kitabı okurken Alexa’nın sesi yerine, çocuğun büyükannesinin sesi” dedi. (Amazon’un kurucusu Jeff Bezos, The Washington Post’un sahibidir.)

Demo, Alexa’nın en yeni özelliğine ilk bakıştı ve bu özellik – hala geliştirilme aşamasında olsa da – sesli asistanın insanların seslerini kısa ses kliplerinden kopyalamasına izin verecek. Prasad’ın dediğine göre amaç, yapay zekayı “insanın empati ve duygulanım özellikleri” ile aşılayarak kullanıcılar arasında daha fazla güven oluşturmak.

Prasad, yeni özelliğin “[sevilenlerin] anılarını kalıcı hale getirebileceğini” söyledi. Ancak uzmanlar, ölü bir akrabanın sesini duyma ihtimalinin yürekleri sızlatsa da, sayısız güvenlik ve etik kaygıyı da beraberinde getirdiğini söyledi.

San Francisco merkezli SocialProof Security’nin CEO’su Rachel Tobac, Washington Post’a “Dünyamızın kullanıcı dostu ses klonlama teknolojisine hazır olduğunu hissetmiyorum” dedi. Böyle bir teknolojinin, sahte ses veya video klipler aracılığıyla halkı manipüle etmek için kullanılabileceğini de sözlerine ekledi.

Siber güvenlik uzmanı Tobac, “Bir siber suçlu, başka bir kişinin sesini küçük bir ses örneğiyle kolayca ve güvenilir bir şekilde kopyalayabiliyorsa, bu ses örneğini diğer bireylerin kimliğine bürünmek için kullanabilir. Bu kötü oyuncu daha sonra başkalarını taklit ettikleri kişi olduklarına inandırabilir ve bu da dolandırıcılığa, veri kaybına, hesabın ele geçirilmesine ve daha fazlasına yol açabilir” diye ekledi.

Avustralya’daki Curtin Üniversitesi’nde internet çalışmaları profesörü Tama Leaver, o zaman insani olanla mekanik olan arasındaki çizgiyi bulanıklaştırma riski olduğunu söyledi.

“Eğer büyükanneniz veya büyükbabanızın sesiyle veya kayıp bir yakınınızın sesiyle konuşuyorsa, Amazon’un derinlikleriyle ve veri toplama hizmetleriyle konuştuğunuzu hatırlamayacaksınız.”

Leaver, teknoloji temalı bir gelecek öngören bilim kurgu dizisine atıfta bulunarak, “Bazı yönlerden ‘Black Mirror’ bir bölümü gibi” dedi .

“Yeni Alexa özelliği ayrıca rıza hakkında soruları da gündeme getiriyor” diye konuşan Leaver, “Özellikle seslerinin öldükten sonra robotik bir kişisel asistan tarafından duyulacağını asla hayal etmemiş insanlar için. Ölen kişilerin verilerini hem bir yandan ürkütücü, bir yandan da son derece etik olmayan bir şekilde kullanmanın gerçek bir kaygan eğimi var, çünkü bu izlerin bu şekilde kullanıldığını asla düşünmediler” dedi.

Yakın zamanda büyükbabasını kaybetmiş olan Leaver, sevilen birinin sesini duymak istemenin “cazibesi” ile empati kurduğunu söyledi. “Ancak olasılık, toplumun üstlenmeye hazır olmayabileceği bir dizi çıkarım kapısını açar” diyen Leaver, “Örneğin, insanların World Wide Web’in eterlerine bıraktığı küçük parçacıkların haklarına kim sahip? Dedem bana 100 mesaj göndermiş olsaydı, bunu sisteme aktarma hakkım var mıydı? Ve eğer yaparsam, sahibi kim? Amazon bu kaydın sahibi mi? Dedemin sesinin haklarından vazgeçtim mi?” diye sordu.

Prasad, Çarşamba günkü konuşmasında bu tür ayrıntılara değinmedi. Bununla birlikte, sesleri taklit etme yeteneğinin “hayallerimizin ve bilim kurgunun gerçeğe dönüştüğü yapay zekânın altın çağında tartışmasız yaşamanın” bir ürünü olduğunu öne sürdü.

Amazon’un demosu gerçek bir özellik haline gelirse, Leaver, insanların öldüklerinde seslerinin ve benzerliklerinin nasıl kullanılabileceğini düşünmeye başlamaları gerekebileceğini söyledi.

Leaver, “Sosyal medyadaki sesim ve resimli geçmişim çocuklarımın malıdır ve benimle sohbette bunu yeniden canlandırmak isteyip istemeyeceklerine karar verebilirler mi demem gerektiğini vasiyetimde düşünmek zorunda mıyım?” diye merak etti.

Leaver, “Bunun şimdi söylenmesi garip bir şey. Ama muhtemelen yarın Alexa benim gibi konuşmaya başlamadan önce cevaplamamız gereken bir soru bu” diye ekledi.

Kaynak: The Washington Post

Benzer konular:

Bir sonraki

Bir podcast için kapak resmi tasarlamak

Kaçırmayın

Harika bir podcast adı nasıl bulunur?

Okumaya devam et

Yorum yapmak için tıklayın

Haberler

Danimarka, insanların kendi özelliklerini telif hakkıyla korumayı planlıyor

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. Bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Yayınlanma tarihi

1 hafta önce

28 Haziran 2025

Podcast Turkey

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. The Guardian’ın haberine göre, bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Danimarka Kültür Bakanlığı, mevcut yasayı değiştirmek için bir öneri sunması gerekse de, kurum şimdiden tüm partilerin desteğini almayı başardı.

Danimarka Kültür Bakanı Jakob Engel-Schmidt, The Guardian gazetesine verdiği demeçte, “Tasarıda, herkesin kendi bedeni, kendi sesi ve kendi yüz özellikleri üzerinde hak sahibi olduğu konusunda hemfikiriz ve bu konuda net bir mesaj veriyoruz. Ancak mevcut yasa, insanları yapay zeka ile üretilen içeriklere karşı bu şekilde korumuyor” dedi.

ABD’de, birkaç eyalet, seçimler sırasında kötüye kullanım ve rıza dışı cinsel içerikle ilgili derin sahtecilik yasalarını kabul etti. Kongre, eyaletlerin yapay zekayı 10 yıl boyunca düzenleme yetkisini elinden alacak yeni bir bütçe uzlaşma tasarısını değerlendirirken, bu yasaların çoğu şu anda risk altında.

Kaynak: TechCrunch

Okumaya devam et

Haberler

Meta, ses klonlama girişimi Play AI’ı satın almaya hazırlanıyor

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Yayınlanma tarihi

1 hafta önce

28 Haziran 2025

Podcast Turkey

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Bloomberg’in haberine göre şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Habere göre teknoloji devi, girişimin teknolojisini satın almayı ve bazı çalışanlarını bünyesine katmayı hedefliyor.

Play AI, web sitesine göre, herkesin müşteri hizmetleri gibi AI destekli kullanım durumları için kullanabileceği farklı türde sesleri klonlamasına olanak tanıyor. Crunchbase’e göre, bu girişim toplamda 23,5 milyon dolar fon topladı ve yatırımcıları arasında 500 Global, Kindred Ventures, Race Capital ve Soma Capital bulunuyor.

Meta şu anda sosyal platformlarındaki içerik oluşturucuların kendi sohbet robotlarını oluşturmalarına izin veriyor ve Meta AI sohbet robotuna video düzenleme özellikleri ekledi. Bir ses girişimini satın almak, şirketin yaratıcı paketine ses özellikleri eklemesine olanak tanıyacak.

Meta ve Play AI haberlere ilişkin yorum yapmadı.

Kaynak: TechCrunch

Okumaya devam et

Haberler

ElevenLabs, yapay zeka özelliklerine sahip mobil uygulamasını başlattı

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android için kullanıcıların hareket halindeyken metinden ses klipleri oluşturmasına olanak tanıyan, etiketler aracılığıyla ifade kontrolü ve popüler içerik oluşturma uygulamalarıyla sorunsuz entegrasyon sağlayan en yeni v3 alfa metinden sese modellerine erişim sunan bağımsız bir mobil uygulama başlattı.

Yayınlanma tarihi

1 hafta önce

26 Haziran 2025

Podcast Turkey

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android kullanıcılarının metinden ses klipleri oluşturmasına olanak tanıyan bağımsız bir mobil uygulama yayınladı.

Şimdiye kadar, ElevenLabs’ın yapay zeka destekli ses kütüphanelerini kullanarak örnekler üretmeniz gerekiyorsa, web uygulamasına güvenmek zorundaydınız. Şimdi hareket halindeyken klipler üretmek için mobil uygulamasını kullanabilirsiniz.

ElevenLabs mobil uygulaması, hareket halindeki içerik üreticiler için tasarlanmış şık ve sezgisel bir arayüzde güçlü AI ses üretme özelliklerini bir araya getiriyor. Kullanıcılar, 70’den fazla dilde binlerce gerçekçi sese erişebilir ve yaş, aksan ve stil filtreleri kullanarak her projeye en uygun sesi bulabilir. Uygulama, stadyum tezahüratlarından ince komedi zamanlamalarına kadar her ses klibini olağanüstü derecede insan sesine benzeten, benzeri görülmemiş bir duygusal aralık ve ifade kontrolü sunan son teknoloji Eleven v3 modelini içeriyor.

Uygulamayı diğerlerinden ayıran özellik, özelleştirme seçenekleri ve sorunsuz iş akışı entegrasyonu. Kullanıcılar, hayal ettikleri sesi tam olarak elde etmek için hız, kararlılık ve stil gibi ses parametrelerini ince ayar yapabilirler. Tek dokunuşla dışa aktarma özelliği sayesinde, oluşturulan sesler CapCut, TikTok, Instagram ve YouTube Shorts gibi popüler içerik oluşturma platformlarında anında paylaşılabilir. Uygulama, kullanıcıların ElevenLabs hesaplarıyla senkronize olarak, kişisel ses klonları, kaydedilmiş favoriler ve web platformundaki önceki içerikler dahil olmak üzere tam ses kitaplığına erişim sağlıyor. Ücretsiz kullanıcılar, mobil ve web uygulamaları arasında paylaşılan kredi limitleri ile ayda yaklaşık 10 dakika ses oluşturma hakkı elde ediyor.

V3 Alpha İfade Kontrolleri

Eleven v3 (alpha), satır içi ses etiketleri aracılığıyla ses ifadesinde benzeri görülmemiş bir kontrol sağlayarak AI konuşma sentezinde devrim yaratıyor. Önceki modellerden farklı olarak, v3 kullanıcıların [fısıldar], [güler], [kızgın], [heyecanlı] ve [iç çeker] gibi duygusal ipuçlarını doğrudan metne yerleştirerek performansları yönlendirmelerine olanak tanıyor ve doğal duygusal geçişlerle olağanüstü insan benzeri bir sunum yaratıyor. Bu etiketler birleştirilebilir (örneğin, “[mutlu][bağırır] Başardık! [güler]”) birleştirilerek, AI ses teknolojisiyle daha önce imkansız olan nüanslı performanslar elde edilebilir.

Modelin gelişmiş mimarisi, tüm duyguları ve ses efektlerini destekleyerek, ince ton değişikliklerinden cümle ortasında dramatik performans değişikliklerine kadar her şeyi mümkün kılıyor. v3, önceki sürümlerden daha fazla hızlı mühendislik gerektirse de, sesli kitaplar, videolar ve etkileşimli medya gibi uygulamalarda olağanüstü gerçekçilik sağlıyor. Gerçek zamanlı üretim ihtiyacı olan kullanıcılar için ElevenLabs, v3’ün gerçek zamanlı sürümü kullanıma sunulana kadar v2.5 Turbo veya Flash modellerini kullanmaya devam etmelerini öneriyor. Şirket, arayüzü üzerinden erişen self servis kullanıcılar için 2025 Haziran sonuna kadar v3 kullanımında %80 indirim sunuyor.

Çapraz Platform Entegrasyon Yetenekleri

ElevenLabs, geliştiricilerin AI ses teknolojisini çeşitli uygulamalara sorunsuz bir şekilde entegre etmelerini sağlayan, birden fazla platformda sağlam entegrasyon yetenekleri sunuyor. Platform, geliştiricilerin ses özelliklerini hızlı bir şekilde uygulamaya koyarken, kurumsal düzeyde güvenlik için GDPR ve SOC II uyumluluğunu koruyan Python ve TypeScript SDK’ları sağliyor. Kodsuz çözümler arayanlar için Albato, Make ve Appy Pie Automate gibi hizmetler, programlama uzmanlığı gerektirmeden ElevenLabs’ı yüzlerce popüler uygulamaya bağlamayı mümkün kılıyor.

Şirketin Konuşma Yapay Zeka teknolojisi, Salesforce, HubSpot ve Gmail gibi hizmetlere bağlanmak için Çok Kanallı Protokolü (MCP) destekleyen 11ai’nin tanıtımıyla entegrasyon olanaklarını daha da genişletti. Mobil uygulama entegrasyonu, geliştiricilerin önceden hazırlanmış sesler arasından seçim yapabileceği veya mobil uygulamalar için kendi seslerini özelleştirebileceği konuşma AI oyun alanı aracılığıyla kolayca gerçekleştirilebilir. Bu entegrasyon seçenekleri, ElevenLabs’ı web, mobil ve telefon kanallarında gerçekçi AI tarafından üretilen seslerle ürünlerini geliştirmek isteyen işletmeler için çok yönlü bir seçim haline getiriyor.

Kaynak: Perplexity

Okumaya devam et