Bizimle iletişime geçin

Haberler

Google, Gemini sohbet robotuna Canvas editörü ve yapay zeka podcast’leri ekledi

Gemini’nin yeni “Sesli Genel Bakış” özelliği, belgeleri ve sunumları podcast tarzı özetlere dönüştürüyor ve burada yapay zeka tarafından oluşturulan iki moderatör içeriği tartışıyor ve özetliyor.

Yayınlanma tarihi

on

Google, ChatGPT’nin izinden giderek yapay zeka asistanına işbirliğine dayalı çalışma alanı ve ses özellikleri ekliyor.

Google, Gemini AI asistanına iki önemli özellik ekledi: belge oluşturma için etkileşimli bir çalışma alanı sağlayan Canvas ve yazılı içeriği konuşma ses formatlarına dönüştüren Audio Overviews.

Yeni Canvas çalışma alanı, kullanıcıların belge ve kod oluştururken yapay zeka ile işbirliği yapmasına olanak tanıyor. Değişiklikler gerçek zamanlı olarak görüntüleniyor ve kullanıcılar entegre bir sohbet arayüzü aracılığıyla değişiklikleri tartışabiliyor.

Google’a göre Canvas, HTML ve React kodunun anında önizlemesini oluşturabiliyor ve kullanıcılar bitmiş belgeleri Google Docs’a aktarabiliyor. Bu özellik, ChatGPT’nin geçen sonbaharda sunduğu Canvas özelliğini yakından yansıtıyor gibi görünüyor.

Yapay zeka araştırmalarını yapay zeka konuşmalarına dönüştürme

Sesli Genel Bakış özelliği, belgeler, sunumlar ve araştırma raporları gibi yazılı içerikleri, materyali analiz eden iki yapay zeka sunucusu arasında podcast tarzı konuşmalara dönüştürüyor. Google bunu, güncellenmiş ücretsiz Deep Research işlevinden elde edilen çıktıyı bir yapay zeka sesli podcast’ine dönüştürerek gösteriyor.

Bu sesli özetler ilk olarak geçen yıl NotebookLM’de yayınlandı. Yapay zeka tarafından üretilen diğer içerikler gibi, hem podcast’ler hem de Derin Araştırma özelliği yanlış bilgiler içerebilir. Bu, her iki aracın da yararlı olamayacağı anlamına gelmez, sadece muhtemelen bilmediğiniz bir şeyi öğrenmek için bunları kullanmamalısınız çünkü burada hataları tespit edemezsiniz.

Ses özelliği şu anda yalnızca İngilizce’yi destekliyor ve web ve mobil platformlar üzerinden erişilebiliyor. Kullanıcılar oluşturulan ses dosyalarını indirebilir ve paylaşabilir. Google’a göre, her iki özellik de Gemini ve Gemini Advanced aboneleri için artık dünya çapında kullanılabilir.

Google yeni Gemini yapay zeka özelliklerini kullanıma sunuyor

Google, yılın başından bu yana Gemini ekosistemini büyük ölçüde genişletti. Gemini Live, Samsung Galaxy S24/S25 ve Pixel 9 cihazlarından başlayarak video ve ekran paylaşımı desteği ekliyor ve Google, Samsung uygulamalarıyla entegrasyon da dahil olmak üzere Android’in varsayılan yapay zeka asistanı olarak Google Asistan’ı Gemini ile değiştirmeyi planlıyor.

Buna ek olarak Google üç yeni model çeşidini piyasaya sürdü: Gemini 2.0 Flash temel model olarak hizmet verirken, Flash Lite uygun maliyetli işleme sunuyor ve 2.0 Pro deneysel olarak genişletilmiş bağlam işleme sağlıyor.

AB, İsviçre ve İngiltere dışında, Gemini artık daha bağlamsal yanıtlar için kullanıcıların Google arama geçmişine erişebiliyor. Platform ayrıca görüntü oluşturma ve düzenleme ve YouTube videolarını anlama için yerel çok modlu yetenekler kazandı.

Kaynak: The Decoder

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Podcast yayıncıları için ses klonu iki ucu keskin bir kılıç

Birçok podcast yayıncısı ses klonları kullanmaya başlarken New York Times bunu “iki ucu keskin kılıç” olarak nitelendirdi.

Yayınlanma tarihi

=>

Benjamin Boster’ın planı basitti. 30 dakikalık ses kaydını yükleyecekti ve gerisini yazılım halledecekti.

Bir veya iki saatlik işlemden sonra klon ortaya çıkacaktı; haftada üç bölümden beş bölüme çıkmasını sağlayacağını umduğu bir ses simülasyonu.

Boster, popüler bir yatıştırıcı podcast olan “I Can’t Sleep“in sunucusu ve tek sahibi (Wikipedia’dan kadife ses tonuyla okuyor) ve aylık ortalama 400.000 indirme alıyor.

Utah, Pleasant Grove’da yaşayan 44 yaşındaki eski proje yöneticisi Boster, “İnsanlar bana her zaman sesimin onları uyuttuğunu söylerdi. Bunu yeterince kez duyduğunuzda, sonunda bir anda her şey netleşiyor” diyor.

Arşivinde düzinelerce saatlik ses kaydı bulunan Boster, istediği uzunlukta bir ses örneği buldu, bunu Elevenlabs adlı bir yapay zeka ses üretim platformuna yükledi ve ikizini bulmak için bekledi.

ChatGPT gibi sohbet robotları ve Midjourney gibi görüntü oluşturucuların arkasındaki teknolojiyi kullanan Elevenlabs ve benzeri hizmetler, kullanıcıların sıfırdan gerçekçi sesler oluşturmasına, önceden hazırlanmış seslerden oluşan bir kütüphaneden seçim yapmasına veya kendi seslerini neredeyse mükemmel bir doğrulukla kopyalamasına olanak tanıyor.

İkinci işlev, podcast sunucuları arasında hem endişe hem de hayranlık uyandırdı. Bir podcast sunucusunun sesi aynı zamanda bir imzadır, insanların etrafında toplandığı bir ateş gibidir. Bir kopyası, sahibinin daha hızlı, daha az masrafla ve yabancı dillerde çalışmasına yardımcı olma potansiyeli olan bir yardımcı mıdır, yoksa sadık dinleyicilere ihanet mi?

“Criminal” ve “This Is Love” programlarının sunucusu Phoebe Judge, “İnsanların sesime bağlandıklarını hissetmelerinden çok memnunum ve bunu başkalarına devretmekle ilgilenmiyorum. Podcast’lerin çoğunlukla yapay zeka tarafından seslendirildiği bir döneme geldiğimizde, umarım bu işin içinde olmayacağım” diyor.

Gerçek bir kişiyi temsil etmeyen yapay sesler, diğer alanlarda da yaygınlaşmıştır. Son nesil sesle çalışan asistanlar ve telefonla müşteri hizmetleri sistemleri, milyonlarca tüketiciyi gerçekçi sesli robotlarla tanıştırmıştır. Bazı reklamlar, haber makaleleri ve sesli kitaplar için sentetik sesli anlatım standart hale gelmektedir.

Podcast yayıncılığında, sunucu koltuğuna insan olmayan birini oturtmaya yönelik ilk denemeler tepkiyle karşılandı. 2023 yılında, podcast stüdyosu Wondery, deneme sürümünün eleştirilere yol açmasının ardından, spor podcast’i “The Lead: Starting Five”ın yapay zeka sunucusunu sessizce emekliye ayırdı. Geçen ay, Inception Point AI adlı bir start-up, haftada 3.000’den fazla yapay zeka sunuculu podcast bölümü yayınlama stratejisi nedeniyle büyük bir tepkiyle karşılaştı. LinkedIn’de yayınlanan bir gönderide, şirketin “yarım yamalak yapay zeka saçmalıklarıyla” insan emeğinin değerini düşürdüğü iddia edildi.

Ancak, sunucular, reklamcılar, yazılım geliştiriciler ve yayıncılar dahil olmak üzere sektördeki bir düzineden fazla kişiyle yapılan röportajlar, ses klonlarının giderek yaygınlaştığını gösterdi. Sunucu kopyaları, stüdyo performanslarını geliştirmek, hatta değiştirmek ve bölümleri diğer dillere çevirmek için zaten kullanılıyor. Bu bahar, popüler iş podcast’i “Diary of a CEO”nun sunucusu Steven Bartlett, ses klonunun sunuculuğunu yaptığı bir yan program başlattı.

Klonların okuduğu reklamlar da halihazırda geliştirme aşamasında.

Podcast ağı ve reklam platformu Acast’ın CEO’su Greg Glenday, şirketin klonların okuduğu reklamlarla ilgili iç deneyleri hakkında “Şaşırtıcı derecede iyi. Birlikte çalıştığımız yaratıcılar bu durumdan çok memnun görünüyor” dedi.

Boster’ın klonu hazır olduğunda, Wikipedia makalesinden (“Arkeoloji” başlığını seçti) metni kopyalayıp Elevenlabs uygulamasına yapıştırdı ve bir düğmeye basarak konuşma oluşturdu. Çıkan ses tuhaftı; birkaç tuhaflık dışında neredeyse tamamen ona benziyordu.

“Tınısı biraz farklıydı ve ritimde bazı nüanslar tam olarak yoktu” dedi.

Boster, bazı ayarlarda birkaç düzenleme ve ince ayar yaparak, daha da ikna edici bir yeni model üretti. Test olarak, bunu “I Can’t Sleep” adlı bir bölümde kullandı ve kasıtlı olarak yapay zeka ile oluşturulduğunu belirtmedi.

Boster, “Bir deney yapmak istedim. İnsanlar bunu fark edebilecek mi? Ve eğer fark ederlerse, bu sorun olur mu? Yoksa rahatsız olurlar mı?” dedi.

Elevenlabs ve Speechify, Respeecher ve Resemble.AI gibi rakip programlar en gelişmiş ses klonlama teknolojisini sunsa da, modern podcast düzenleme araçlarında daha temel sürümler yerleşik olarak bulunur. Descript ve Riverside.fm gibi popüler hizmetler, kullanıcıların konuşmacının sesini yapay zeka ile simüle ederek kaydedilmiş konuşmaya ekleme veya değişiklik yapma olanağı sunar.

Podcast düzenleme, hatalar veya düzeltmeler nedeniyle sık sık bölümlerin yeniden kaydedilmesini gerektirir, bu da stüdyoya birden fazla kez gitmek anlamına gelebilir. Ses klonlamaya genel olarak şüpheyle yaklaşan birkaç sunucu, bu gibi durumlarda klonlamanın yararlı olabileceğini kabul etti.

“Snap Judgment” programının sunucusu Glynn Washington, “Diyelim ki, bir şeyleri kaydedebileceğim bir stüdyoya yakın değilim ve biri bana ‘Hey, bunu bir yapay zeka programı kullanarak düzeltmemiz gerekiyor’ diyor. Bunun meşru bir kullanım olduğunu düşünürdüm” diyor.

Birçok sunucu, podcaster Lex Fridman’ın Hindistan Başbakanı Narendra Modi ile yaptığı son röportajda yaptığı gibi, kendilerini başka dillere çevirmek için yapay zeka klonunu kullanmayı onayladı ve hatta bu konuda heyecan duydu. Genellikle, birden fazla dilde mevcut olan az sayıdaki podcast, kendi sesleriyle konuşan insan çevirmenler kullanıyor.

Spotify ve iHeartMedia‘daki pilot programlar şu anda Bill Simmons, Malcolm Gladwell ve Jay Shetty gibi seçkin podcast sunucularının seslerini İspanyolca, Fransızca, Portekizce ve diğer dillere klonlamasına izin veriyor. (Programlarda yapay zeka kullanımı hakkında açıklamalar yer alıyor.)

“Talk Easy” programının sunucusu Sam Fragoso, “Farklı ülkelerdeki insanlara kendi ana dillerinde ulaşabilmek harika olurdu. Bu, herkes için kazan-kazan durumu” diyor.

Klonlar reklamcılıkta da ilerleme kaydetmeye hazırlanıyor. Birçok sunucu, sponsorların bir bölüm sırasında tanıtım materyallerini okumaları için onlara ödeme yaptığı reklam okumalarını biraz tatsız buluyor. Teorik olarak bir klon, bu görevi üstlenmekle kalmayıp, minimum çabayla (örneğin belirli demografik gruplara yönelik) neredeyse sınırsız sayıda reklam varyasyonu üretebilir.

Büyük reklamverenlerin bir kopyayı desteklemek için ödeme yapıp yapmayacağı ve ne kadar ödeyeceği henüz belli değil. Ancak Acast’tan Glenday, ses klonunun kullanılmasıyla reklamın değerinin azalmayacağını savundu.

Glenday, “Bence bunun, sunucunun okuduğu reklamla aynı değerde olduğu çok makul bir argüman. Ödediğiniz şey, yaratıcının sesinin sahip olduğu etki, onu okumak için harcanan emek değil” dedi.

Bazı podcast yayıncıları için, koşullu klon kullanımının faydaları bile potansiyel maliyetlerden daha ağır basmaktadır. Dinleyiciler, söylenen sözler nedeniyle değil, onları söyleyen kişiyle bir bağ hissettikleri için dinlediklerini savunuyorlar.

Dinleyiciler, o kişinin gerçekten orada olup olmadığından şüphe etmeye başladıkları anda, büyü bozulur.

“Memory Palace” programının sunucusu Nate DiMeo, “Bu, sanat formunu tamamen baltalar. Dinlediğiniz şey, başka birinin bilincine açılan bir penceredir. Her şeyin özü budur” diyor.

Şişeden çıktıktan sonra, yapay zeka cini kontrol etmek zor olabilir. Yıllardır, özel efektlerin yoğun olduğu film yapımlarında aktörlerin dijital olarak taranması yaygın bir uygulamadır. Bu sayede film yapımcıları, yapay zeka araçlarını kullanarak aktörlerin performanslarını geliştirebilir veya değiştirebilir. Bu tür kopyaların kullanımının kısıtlanması, 2023 Hollywood aktör grevinde önemli bir tartışma konusu oldu.

Röportajlarda, büyük podcast yayıncılarının yöneticileri, yaratıcılar veya dinleyicilerle ilişkilerini tehlikeye atacak bir ürün veya politika sunmaktan çekindiklerini söylediler. Ancak ses klonlarının yetenekleri konusunda heyecanlarını dile getirdiler.

Spotify’ın podcast ürünleri başkanı Maya Prohvonik, “Bu teknolojinin birçok yaratıcı için daha fazla olanak sağlayacağına dair iyimserim. Bu sadece kendinizi ölçeklendirmek için bir araç. Sizin yerinizi almıyor” dedi.

iHeartPodcasts’in başkanı Will Pearson, bir bölümü sunmak veya bir reklamı baştan sona okumak için klonların kullanımına karşı çıkacağını, ancak düzenlemelerde veya bir insanın performansını özelleştirmek için kullanılabileceğini söyledi.

Pearson, “Bu şeyleri uyarlama yeteneğini keşfetmek ilginç olacak” dedi.

Boster kararsız kalmaya devam ediyor. “I Can’t Sleep” hayranlarının yapay zeka deneyini eleştireceğinden endişelenmesine rağmen, herhangi bir şikayet almadı.

Yine de, podcast’i kendisi kaydetmeye geri döndü ve klonla başka bir bölüm yayınlamadı. Boster, dinleyicilerinin sadece yarı bilinçli olmasına rağmen, belirli bir özen yükümlülüğü hissettiğini söyledi.

Boster, “Muhtemelen bu işten paçayı sıyırabilirim. Ama bu durum bana geri tepebilir” dedi.

Kaynak: Reggie Ugwu / New York Times

Okumaya devam et

Haberler

YouTube’tan, yapay zeka nedeniyle çalışanlarına gönüllü işten ayrılma teklifi

Youtube CEO’su Neal Mohan, ürün bölümünü üç gruba yeniden yapılandırırken, video platformundan ayrılmak isteyen çalışanların tazminat almaya hak kazanacağını duyurdu.

Yayınlanma tarihi

=>

YouTube, reklamcılık ve eğlence sektöründe hâlen baskın bir güç olmaya devam ediyor, ancak yapay zekanın yarattığı dönüşüm hiçbir şirketi es geçmiyor.

YouTube CEO’su Neal Mohan Çarşamba günü çalışanlara gönderdiği bir notta, yapay zekanın yarattığı dönüşüm ve fırsatları video platformunu yeniden yapılandırmak için bir neden olarak gösterdi. Yönetici, şirketin ürün ekipleri için yeni bir raporlama yapısı oluşturdu ve şirketten ayrılmak isteyen YouTuber’lara tazminat ödeyen gönüllü çalışan işten ayrılma programını başlattı.

Bir kaynak, değişiklikler kapsamında hiçbir pozisyonun kaldırılmadığını, ancak gönüllü ayrılma programlarının bazen daha sonra yapılacak kesintilerin habercisi olabileceğini belirtti. İşten ayrılma teklifinde bulunma kararı, Amazon’un yapay zekanın yarattığı yıkıcı etkiyi gerekçe göstererek 14.000 kişilik işgücü azaltma planını açıkladığı hafta alındı.

YouTube bundan sonra üç ürün organizasyonuna sahip olacak ve her birinin üst düzey yöneticisi doğrudan Mohan’a rapor verecek.

Abonelik ürünleri Christian Oestlien tarafından yönetilecek ve YouTube TV, YouTube Premium, YouTube Music, Primetime Channels ve diğer iş kollarının denetimini içerecek; Johanna Voolich tarafından yönetilecek izleyici ürünleri, YouTube mobil ve oturma odası uygulamaları, güven ve güvenlik, YouTube Kids, arama altyapısı ve diğer önemli alanlara odaklanacak; içerik oluşturucu ve topluluk ürünleri ise YouTube Shorts ve üretken AI araçları da dahil olmak üzere içerik oluşturucuları desteklemeye odaklanacak. YouTube’un bu organizasyon için yeni bir lider getirmesi bekleniyor.

Mohan, notunda yapay zekayı YouTube için “yeni sınır” olarak nitelendirdi. Bu ayın YouTube ile ilgili kapak hikayesi için The Hollywood Reporter ile yaptığı röportajda Mohan, yapay zekanın nihayetinde insan içerik üreticilerinin hizmetinde olacağını düşündüğü nedenleri açıkladı.

“Yaratıcılık, AI’nın süreci kolaylaştırarak, daha verimli ve hızlı hale getirerek ve aynı zamanda daha güçlü hale getirerek büyük ölçüde yardımcı olacağı bir alan olduğunu düşünüyorum. Bu anlamda, AI ile ilgili vizyonum, AI’nın insan yaratıcılığına hizmet etmesi, insan yaratıcılığını gerçekten güçlendirmesi yönündedir” diyen Mohan, şunları kaydetti:

“Senaryo yazımı alanında çalışıyorsanız ve belirli bir arka plana ihtiyacınız varsa veya belirli bir sekansınız varsa, yapay zeka size birçok şekilde yardımcı olabilir. Senaryonun nasıl olması gerektiği konusunda fikir üretmenize yardımcı olabilir. Arka planı oluşturmanıza yardımcı olabilir. Geçen hafta gördüğünüz gibi, kamerayla çektiğiniz videoya içerik eklemenize yardımcı olabilir.”

YouTube başkanı, “Bence bu tür olasılıkların henüz çok başındayız ve umarım bu, sadece en üstteki yaratıcılar için değil, yaratıcılığın tüm tedarik zinciri için çok daha fazla fırsat yaratır” diye ekledi.

Kaynak: The Hollywood Reporter

Okumaya devam et

Haberler

Spotify, Apple TV uygulamasına nihayet video podcast’leri ekledi

Spotify’ın Apple TV’deki uygulaması, şaşırtıcı bir şekilde, video podcast’lere erişim imkanı sunmuyordu. Spotify uygulamasının tvOS sürümü yeniden tasarlandı ve şarkı sözleri ve sıra yönetimi gibi özellikler eklendi.

Yayınlanma tarihi

=>

Spotify, Apple TV uygulamasının yeniden tasarlanmış bir sürümünü duyurdu. Şirket, bu sürümün “daha hızlı, daha akıllı ve daha görsel bir deneyim sunmak için baştan aşağı yeniden tasarlandığını” belirtiyor. Spotify uygulamasının tvOS sürümü, mobil sürümden de birkaç hoş özelliği bünyesine katıyor, ancak en büyük güncellemeler arasında video podcast’lerin ve müzik videolarının eklenmesi yer alıyor.

Bazı kullanıcılar birkaç gündür bu güncellemeye erişebiliyordu, ancak yeni sürüm artık Apple’ın App Store’undan herkes tarafından indirilebilirken, otomatik güncelleme kullanan cihazlar yeni deneyimi Kasım ortasına kadar elde etmelidir. Spotify’ın tvOS uygulamasının eski sürümünü kullananlar, daha önce Reddit dahil olmak üzere çevrimiçi forumlara girerek, sinir bozucu navigasyondan, uygulamanın Google TV sürümünde uzun süredir bulunan eksik özelliklere kadar her şeyden şikayet etmişlerdi, ancak bu sürümde bu sorunların çözülmüş olduğu görülüyor.

Spotify’da müzik videoları izlemek henüz ABD ve Kanada’da mümkün değil, ancak bu özellik Spotify Premium aboneleri için sınırlı bir katalogla birlikte dünya çapında 97 farklı pazara yayıldı. Dinlediğiniz şarkının Spotify kataloğunda eşlik eden bir müzik videosu varsa, “videoya geç” komutunu kullanarak bu videolara kolayca erişebilirsiniz.

Video versiyonu sunan podcast’ler, yeni Spotify tvOS uygulamasında da benzer şekilde çalışacak ve oynatma hızını ayarlama seçeneği içerecek. Bu ayın başlarında, şirketin podcast stüdyosu, Netflix ve The Ringer ile bir ortaklık kurduğunu duyurdu. Bu ortaklık kapsamında, 2026’dan itibaren The Bill Simmons Podcast ve NFL, NBA, Fantasy Football ve F1’e dayalı programlar da dahil olmak üzere 16 video podcast serisi ABD’deki video akış platformuna getirilecek.

Güncellenen Spotify Apple TV uygulaması, sıra yönetimi, kesintisiz oynatma, şarkı sözleri ve AI kullanarak bir sonraki dinleyecekleri öneren Spotify DJ’e erişim gibi yeni mobil özellikler de ekliyor. Ayrıca, Spotify Connect aracılığıyla akıllı telefonunuzu veya tabletinizi ve mobil uygulamayı kullanarak Apple TV’deki oynatmayı kontrol edebileceksiniz.

Okumaya devam et

En son