Bizimle iletişime geçin

Haberler

İnsan duygularını anlayabilen yapay zeka ses girişimi WaveForms AI 40 milyon dolar yatırım aldı

Yapay zeka ses girişimi WaveForms AI, Andreessen Horowitz (a16z) liderliğinde 40 milyon dolarlık tohum finansmanını duyurdu ve girişime 200 milyon dolar değer biçildi. WaveForms AI’ın hedefi, insan duygularını benzeri görülmemiş bir nüansla algılayabilen ve bunlara yanıt verebilen yapay zeka modelleri yaratmak.

Yayınlanma tarihi

on

Alexis Conneau, eylül ayında ChatGPT’nin gelişmiş ses özelliklerinin geliştirilmesine liderlik ettiği OpenAI’den ayrıldığında manşetlere çıktı. Proje, yapay zeka tarafından üretilen seslerden birinin aktris Scarlett Johansson’a çarpıcı bir benzerlik göstermesiyle tartışmalara yol açmıştı. Johansson, proje için sesini lisanslamak üzere kendisine başvurulduğunu ve bunu reddettiğini açıkladı. OpenAI, Johansson’un sesini kasıtlı olarak taklit ettiğini reddetse de, 2013 yapımı Her filmindeki rolüyle yapılan karşılaştırmalar kaçınılmaz oldu ve YZ etiği ve taklit konusundaki tartışmaları alevlendirdi.

Şimdi Conneau, stratejist bir mühendis olan Coralie Lamaitre ile birlikte kurduğu WaveForms AI ile yeni bir rota çiziyor. Gizlilikten çıkan WaveForms AI, Andreessen Horowitz (a16z) liderliğindeki 40 milyon dolarlık tohum fonunu duyurdu ve girişime 200 milyon dolar değer biçti. Girişim, Conneau’nun duygusal genel zeka (EGI – Emotional General Intelligence) olarak adlandırdığı şeye öncülük ederek ses yapay zekasını yükseltmeyi amaçlıyor. Nihai hedef: İnsan duygularını benzeri görülmemiş bir nüansla algılayabilen ve bunlara yanıt verebilen yapay zeka modelleri yaratmak.

Tartışmalar ve İlhamla Belirginleşen Bir Ayrılış

Johansson tartışmasını değerlendiren Conneau projeyi savundu. “ChatGPT sesi asla Johansson’ı taklit etmek için tasarlanmadı” dedi. Bununla birlikte, bir adamın Johansson tarafından seslendirilen bir yapay zeka asistanıyla duygusal ilişkisini konu alan Her filmiyle yapılan karşılaştırmaları da kabul etti ve “Teknolojiyi gördüklerinde hemen filmi düşünüyorlar” dedi.

Conneau, X’teki (eski adıyla Twitter) çıkış yazısında Her karşılaştırmalarını küstahça selamladı: “@OpenAI’de #Her’i inşa ederken geçirdiğim inanılmaz bir yolculuğun ardından yeni bir şirket kurmaya karar verdim.”

Filmin kendisine ilham verdiğini kabul etmekle birlikte, distopik tonlarının WaveForms için bir model olmadığını savunan Conneau, “Filmin bir yapay zeka ilişkisinin karmaşık, olumsuz etkilerini tasvir etmesi, muhtemelen kaçınmamız gereken bir şey” dedi. Bunun yerine WaveForms AI, insan etkileşimlerinin yerini almak yerine onları güçlendirmek için sesi kullanmayı amaçlıyor.

AGI’nin “Sosyal-Duygusal Katmanı” Olarak Sesin Oluşturulması

Conneau sesi, yapay genel zekânın (YGZ) “sosyal-duygusal katmanının” kilidini açmanın anahtarı olarak görüyor. Ona göre OpenAI, Google ve Meta gibi şirketler YZ’nin entelektüel yeteneklerine odaklanırken, WaveForms YZ etkileşimlerini derinlemesine insani ve duygusal olarak rezonanslı hale getirmeyi amaçlıyor.

Conneau, “Ses, YZ’nin ilk duygusal, sosyal-duygusal katmanıdır” dedi. WaveForms’un sesli dil modellerinin (audio LLMs) ton, tonlama ve aksan gibi duygusal incelikleri yakalamasını öngörüyor. Bu yetenekler, yapay zekanın konuşmaların duygusal bağlamını yorumlamasını ve empatik bir şekilde yanıt vermesini sağlayabilir.

Örneğin, WaveForms tarafından desteklenen bir yapay zeka öğretmeni, bir öğrencinin hayal kırıklığını tanıyabilir ve ek sabır veya teşvikle yanıt verebilir. Duygusal anlayışa yapılan bu vurgu, insanların eğitim, sağlık ve müşteri hizmetleri alanlarında yapay zeka ile nasıl etkileşim kuracağını yeniden tanımlayabilir.

Facebook’tan OpenAI’a

Conneau’nun ses yapay zekasına duyduğu hayranlık, Facebook’ta araştırmacı olarak çalıştıktan sonra üç yıl önce onu OpenAI’ye yönlendirdi. OpenAI’nin kurucu ortağı ve Baş Bilim İnsanı Ilya Sutskever’e sert bir e-posta gönderdi ve o da bir akıl hocası ve işbirlikçi oldu.

OpenAI’de Conneau, gerçek zamanlı konuşma tanıma ve yanıtlama yeteneğine sahip çığır açan bir özellik olan GPT-4o’nun Gelişmiş Ses Modunun geliştirilmesine öncülük etti. Konuşmayı işlenmek üzere metne dönüştüren önceki sürümlerin aksine, GPT-4o’nun Gelişmiş Ses Modu sesi doğrudan tokenize ederek düşük gecikmeli, doğal sesli konuşmalara olanak sağladı.

OpenAI’deki başarısına rağmen Conneau, daha geniş AGI odağı tarafından kısıtlandığını hissetti ve bu durumu, “Orada geçirdiğim zamandan gerçekten keyif aldım ama OpenAI, Google ve Meta gibi şirketler AGI odaklı. Bizim burada bahsettiğimiz ise farklı bir odak noktası” diye açıkladı.

Sutskever’in Mayıs ayında OpenAI’den ayrılmasının kendi ayrılma kararını etkileyip etkilemediği konusunda yorum yapmaktan kaçındı, ancak Sutskever’i “yapay zekada görebileceğimiz en büyük bilim adamı , yapay zekadaki Einstein’a benzer” olarak övdü.

Duygusal Zeka için Bir Vizyon

WaveForms AI’nın misyonu iddialı: Yapay zeka ile sesli etkileşimleri insan konuşmalarından ayırt edilemez hale getirebilecek temel modelleri eğitmek. Şirket ilk tüketici ürününü 2025 yılında piyasaya sürmeyi planlıyor ve kullanıcılar ile yapay zeka arasındaki duygusal bağlantıları geliştiren sürükleyici deneyimlere odaklanıyor.

Conneau, “platformda geçirilen zaman” gibi ölçütleri optimize eden diğer YZ şirketlerinin aksine, WaveForms’un insan refahına öncelik vereceği konusunda ısrar ediyor ve “Sosyal medyanın hatalarını tekrarlamak istemiyoruz” dedi. Bunun yerine, yapay zekayı insan etkileşimlerini zenginleştirebilen, sosyal yaşamın tamamlayıcı bir yönü olarak öngörüyor.

Andreessen Horowitz ve Ötesinden Destek

Genel ortağı Martin Casado’nun WaveForms yatırımına liderlik ettiği Andreessen Horowitz (a16z), Conneau’nun vizyonunu paylaşıyor. Casado yapay zekayı bazı insan etkileşimlerine potansiyel olarak daha sağlıklı bir alternatif olarak görüyor. “İnternette bana zorbalık yapabilecek rastgele biriyle konuşabilirim ya da bir yapay zekayla konuşabilirim” diyen Casado, yapay zekanın daha güvenli ve yapıcı etkileşimler sağlayabileceğini öne sürüyor.

a16z’nin kurucu ortağı Marc Andreessen, yapay zekanın insan hayatına derinlemesine entegre olması gerektiğine olan inancıyla uyumlu olarak projeye kişisel ilgi duyduğunu ifade etti.

“Her” Distopyasından Kaçınmak

Conneau, duygusal yapay zekanın etik sonuçları konusunda temkinli davranmaya devam ediyor. Character.AI gibi platformlar yapay zeka arkadaşlığına olan talebi ortaya koyarken, bağımlılık ve izolasyon risklerinin de altını çizdi ve “İnsan etkileşiminin yerini alacak mı? Geleceğin böyle olacağını sanmıyorum” dedi.

Bunun yerine Conneau, yapay zekayı ister bir hasta öğretmeni, ister şefkatli bir sağlık asistanı ya da ilgi çekici bir seyahat arkadaşı olarak hareket etsin, ilham ve destek için bir araç olarak görüyor. “Fikir, yapay zeka ile daha keyifli hissettiren yeni, daha sürükleyici deneyimler yaratmak” dedi.

Kaynak: Anshika Mathews / AIM Research

Haberler

Sky News, Trump’ın ilk 100 gününü analiz eden günlük podcast yayınlayacak

Sky News, Trump 100 adıyla, yeni ABD Başkanı Donald Trump’ın göreve başlayacağı 20 Ocak Pazartesi gününden itibaren görevdeki ilk 100 gününü analiz eden yeni bir günlük podcast yayını başlatacak.

Yayınlanma tarihi

=>

Sky News, Trump 100 adıyla, yeni ABD Başkanı Donald Trump’ın göreve başlayacağı 20 Ocak Pazartesi gününden itibaren görevdeki ilk 100 gününü analiz eden yeni bir günlük podcast yayını başlatacak.

Sky News ABD muhabirleri Martha Kelner, Mark Stone ve James Matthews’un sunuculuğunu üstlendiği dizi, Trump’ın başkanlığının bir önceki gününden önemli hikayeleri inceleyecek, uzman yorumları sunacak ve günün gündemine bakacak.

Türkiye saati ile sabah 6’da yayınlanacak olan bölümlerde Sky News’in küresel habercilik ekibi ve uzmanlar Trump’ın kararlarının hem ABD’yi hem de dünyayı nasıl şekillendirdiğini ele alacak.

Podcast, seçilmiş Başkan’ın “İlk Gün”de ele almayı vaat ettiği 59 konunun gerçeğe dönüşüp dönüşmeyeceğini, ne zaman ve nasıl dönüşeceğini ve bunların yaratacağı etkiyi inceleyecek.

Göçmenlik ve sınır dışı etme planlarından Ukrayna ve Orta Doğu’da devam eden savaşları nasıl ele alacağına kadar Sky’ın ABD muhabirleri önemli gelişmeleri takip edecek.

Ayrıca yeni atanan Devlet Verimliliği Dairesi Başkanı Elon Musk’ın bu eylemler gerçekleşirken gösterdiği çabaları da takip edecekler.

Cumartesi günleri yayınlanacak uzun bir programda ise, Trump’ın göreve gelişinin üzerinden dört yıl geçtikten sonra, son gelişmelere nasıl tepki verdiklerini daha iyi anlamak için Amerikan halkına kulak verilecek.

Trump 100, ilk gün olan 20 Ocak’tan Beyaz Saray’daki 100. günü olan 29 Nisan’a kadar tüm podcast platformlarında yayınlanacak.

Kaynak: Podcasting Today

Okumaya devam et

Haberler

Podcast yayıncılarına özel SEO platformu: Podseo

Podcast’lerin büyük arama motorlarında ve podcast dizinlerinde görünürlüğünü ve erişimini artırmak için özel olarak tasarlanmış yeni bir SEO platformu olan Podseo kullanıma sunuldu.

Yayınlanma tarihi

=>

Podcast’lerin büyük arama motorlarında ve podcast dizinlerinde görünürlüğünü ve erişimini artırmak için özel olarak tasarlanmış yeni bir SEO platformu olan Podseo kullanıma sunuldu.

Podcast yayıncılığı ana akım bir medya formatına dönüşürken, en iyi pazarlama uygulamaları şaşırtıcı derecede ilkel kalmakta ve podcast yayıncıları genellikle performansı ölçmek veya büyüme stratejilerini ölçmek için uygun araçlardan yoksun kalıyor. Podseo, podcast pazarlamasına netlik, hassasiyet ve eyleme geçirilebilir içgörüler getiren gelişmiş çözümler sunarak bu boşluğu gidermeyi hedefliyor. Podseo, podcast yayıncılarını ölçülebilir, veriye dayalı araçlarla güçlendirerek, içerik oluşturucuların YouTube da dahil olmak üzere büyük platformlarda podcast’lerini optimize etmelerine ve büyütmelerine yardımcı oluyor.

Podseo’nun kurucusu ve CEO’su ve podcast endüstrisinde 16 yıllık deneyime sahip Andrea de’Marsi, “Podcast yayıncıları günümüzde giderek karmaşıklaşan bir ortamla karşı karşıya ve biz de Podseo’yu onlara başarılı olmalarını sağlayacak araçları sunmak için kurduk” dedi. Daha önce Voxnest’te COO ve Spreaker’da kurucu ortak olan ve son olarak Triton ve iHeartMedia’da çalışan de’Marsi, “Podseo ile içerik oluşturucular, tahminlere veya modası geçmiş yaklaşımlara güvenmek zorunda kalmadan podcast’lerinin görünürlüğünü ve büyümesini kontrol altına alabilirler” dedi.

Podseo’nun temel özellikleri ise şunlar:

  • Anahtar Kelime Takibi ve Optimizasyonu: Podcast keşfedilebilirliğini artırmak için en etkili anahtar kelimeleri belirleyin ve entegre edin.
  • Yapay Zeka Odaklı Meta Veri Analizi: Daha iyi arama motoru performansı için başlıkları, açıklamaları ve etiketleri otomatik olarak optimize edin.
  • Rekabetçi İstihbarat: Podcast stratejisini iyileştirmek ve geliştirmek için rakip sıralamalarını, anahtar kelimeleri ve görünürlüğü analiz edin.

Podseo’nun büyüme araçları platformlar arasıdır ve büyük podcast dizinleri ve YouTube gibi video platformlarıyla sorunsuz çalışacak şekilde tasarlanırken, böylece içerik oluşturucular içeriklerinin barındırıldığı her yerde kitle erişimlerini en üst düzeye çıkarabilirler.

De’Marsi, “Podseo bir SEO aracından çok daha fazlası; podcast pazarlamasına niceliksel hassasiyet getiren kapsamlı bir platform. Veriye dayalı içgörüleri kullanıcı dostu araçlarla birleştirerek, içerik oluşturucuların büyüme için yeni fırsatların kilidini açmasına yardımcı oluyoruz” diye ekledi.

Kaynak: PodNews

 

Okumaya devam et

Haberler

Yapay zeka podcast sunucuları yayıncılığın ruhunu yıkacak mı?

Forbes yazarı Bernard Marr, yapay zekalı podcast sunucularının “yayıncılığın ruhunu yok edip etmeyeceğini” analiz ediyor. Marr, “Yayıncılığın geleceğine baktığımda, yapay zekanın hayati bir destekleyici rol oynadığını, ancak asla insan sohbetinin ham gerçekliğinin yerini alamayacağını görüyorum” diyor.

Yayınlanma tarihi

=>

Ülkenizdeki en sevilen talk show sunucularından birini hayal edin; nesiller boyu ünlülerle röportaj yapmış, benzersiz tarzı ve sıcaklığıyla kültürel bir ikon haline gelmiş biri. Şimdi de bu sunucunun yapay zeka kullanılarak yeniden yaratıldığını, sesinin ve tavırlarının bilgisayarlar tarafından mükemmel bir şekilde taklit edildiğini hayal edin. İngiltere’de efsanevi röportajcı Michael Parkinson’ın 2023’te vefat etmesine rağmen yapay zeka destekli dijital ikizi ünlülerle röportajlar yapıyor. Bu çığır açan gelişme, yayıncılıkta insani bağın geleceği hakkında derin soruları gündeme getiriyor.

Dijital Çağda İnsani Dokunuş

Kısa bir süre önce BCG’nin yapay zeka sunucusu GENE ile kendi podcast’imde röportaj yaptıktan sonra, bu yapay zekaların nasıl ilgi çekici sohbetler yaratabileceğini ilk elden deneyimledim. GENE, insan sunucuları tamamlayan etkili bir yardımcı sunucu olarak hizmet verirken, kasıtlı olarak robotik bir ses tonuyla yapay doğası hakkında şeffaflığını koruyor. BCG’den Paul Michelman’ın açıkladığı gibi, “Teknolojiyi kullanırken tamamen açık olmanın çok önemli olduğunu düşünüyoruz. İkincisi, insanbiçimcilikten gerçekten kaçınmak.”

Bu yaklaşım, yapay zekanın, yeri doldurulamaz insan unsurunun yerini almaya çalışmadan yayıncılığı nasıl geliştirebileceğini gösteriyor.

Teknoloji Çok İleri Gittiğinde

Ancak, Virtually Parkinson’ın lansmanının endişe verici bir eşiği aştığını düşünüyorum. Teknik olarak etkileyici olsa da, sevilen bir yayıncının sesini ve röportaj tarzını vefatından sonra yeniden yaratmak, Parkinson’ın röportajlarını bu kadar özel kılan otantik insan bağlantılarının ihlali gibi geliyor. Muhammed Ali, Billy Connolly ve sayısız diğerleriyle yaptığı ünlü söyleşiler, aralarındaki gerçek insan kimyası nedeniyle yankı uyandırmıştı; ne kadar sofistike olursa olsun algoritmalar tarafından gerçekten kopyalanamayacak bir şey.

Sir Michael’ın oğlu Mike Parkinson, yapay zekanın yeniden yaratılmasını “sorularını tam olarak nasıl soruyorsa, temposu bile aynı. İnsanlar bunu duyduklarında donup kalıyorlar” şeklinde yorumluyor.

Bu mükemmellik, teknik olarak dikkat çekici olsa da, yayıncılıkta özgünlük konusunda endişelere yol açıyor.

Dijital Barındırıcıların Ekonomisi

Yapay zeka ev sahiplerinin finansal cazibesi yadsınamaz. Yorulmadan çalışabiliyorlar ve maaş gerektirmiyorlar. Ancak bu verimliliğin yayıncılık ekosistemine bir maliyeti var. PRX’in işletme müdürü Jason Saldanha, “en düşük düzeyde etkileşim elde etmek için pazarı içerikle doldurmanın”, “uzun vadeli bir strateji” olmadığı konusunda uyarıyor. Podcast’lerin gerçek gücünün “sunucu-izleyici ilişkisinde” yattığını ve en başarılı programların “izleyicileriyle bire bir ilişkiye” sahip olduğunu vurguluyor.

Sektör Perspektifleri ve Etik Hususlar

BCG’nin GENE ile yaşadığı deneyimler, sorumlu yapay zeka dağıtımı konusunda değerli içgörüler sunuyor. BCG Genel Müdürü ve Kıdemli Ortağı Vlad Lukic, YZ’nin “işimizin özüne girdiğini… ve sahip olmamız gereken araç seti ve beceriler için temel olacağını” belirtiyor. Bununla birlikte, Virtually Parkinson AI’nin yaratıcılarından Deep Fusion Films’den Ben Field, etik hususların önemini vurgulayarak, “yalnızca bir kişinin mülkünün rızasıyla ve yakınlarının katılımıyla çalışmaya kararlı olduklarını” belirtiyor.

Doğru Dengeyi Bulmak

Yapay zekayı insan tarafından yönetilen içeriği geliştirmek için bir araç olarak kullanmak ile insan sunucuları tamamen değiştirmeye çalışmak arasında net bir ayrım yapmak önemli. GENE podcast’lere ortak sunuculuk yaptığında, şeffaf bir şekilde yapay kalırken değer katar. Bu yaklaşım, teknolojik yenilikleri benimserken yayıncılığın özgünlüğünü korur. Önemli olan bu dengeyi korumak; yapay zekayı, yayıncılığa ruhunu veren insan unsurunun yerini almak yerine onu güçlendirmek için kullanmak.

İnsan Bağının Geleceği

Bu teknolojiler ilerledikçe, kendimize yayıncılıkta en çok neye değer verdiğimizi sormalıyız. Mükemmel dağıtım ve sınırsız içerik üretimi mi, yoksa nesiller boyunca harika yayıncılığı tanımlayan otantik insan bağlantıları mı? Yapay zeka sunucuları etkileyici bir teknolojik başarıyı temsil etse de, yayıncılığı gerçekten anlamlı kılan insan seslerinin yerini almak yerine onları geliştirmeli.

Yayıncılığın gerçek gücü teknik mükemmellikte değil, gerçek insan etkileşiminin o harika kusurlu anlarında yatıyor; beklenmedik kahkahalar, duygusal ifşalar, hiçbir algoritmanın tahmin edemeyeceği veya kopyalayamayacağı spontane bağlantılar. Yayıncılığın geleceğine baktığımda, yapay zekanın hayati bir destekleyici rol oynadığını, ancak asla insan sohbetinin ham gerçekliğinin yerini alamayacağını görüyorum. Belki de en büyük ironi, mükemmel dijital sunucular yaratma arayışımızda, yayıncılığı son derece insani kılan kusurları kaybetme riskiyle karşı karşıya olmamızdır. Önümüzdeki zorluk sadece teknolojik değil; giderek dijitalleşen bir dünyada iletişimin ruhunu korumakla ilgili.

Kaynak: Bernard Marr / Forbes

Okumaya devam et

En son