Bizimle iletişime geçin

Haberler

Google, Gemini sohbet robotuna Canvas editörü ve yapay zeka podcast’leri ekledi

Gemini’nin yeni “Sesli Genel Bakış” özelliği, belgeleri ve sunumları podcast tarzı özetlere dönüştürüyor ve burada yapay zeka tarafından oluşturulan iki moderatör içeriği tartışıyor ve özetliyor.

Yayınlanma tarihi

on

Google, ChatGPT’nin izinden giderek yapay zeka asistanına işbirliğine dayalı çalışma alanı ve ses özellikleri ekliyor.

Google, Gemini AI asistanına iki önemli özellik ekledi: belge oluşturma için etkileşimli bir çalışma alanı sağlayan Canvas ve yazılı içeriği konuşma ses formatlarına dönüştüren Audio Overviews.

Yeni Canvas çalışma alanı, kullanıcıların belge ve kod oluştururken yapay zeka ile işbirliği yapmasına olanak tanıyor. Değişiklikler gerçek zamanlı olarak görüntüleniyor ve kullanıcılar entegre bir sohbet arayüzü aracılığıyla değişiklikleri tartışabiliyor.

Google’a göre Canvas, HTML ve React kodunun anında önizlemesini oluşturabiliyor ve kullanıcılar bitmiş belgeleri Google Docs’a aktarabiliyor. Bu özellik, ChatGPT’nin geçen sonbaharda sunduğu Canvas özelliğini yakından yansıtıyor gibi görünüyor.

Yapay zeka araştırmalarını yapay zeka konuşmalarına dönüştürme

Sesli Genel Bakış özelliği, belgeler, sunumlar ve araştırma raporları gibi yazılı içerikleri, materyali analiz eden iki yapay zeka sunucusu arasında podcast tarzı konuşmalara dönüştürüyor. Google bunu, güncellenmiş ücretsiz Deep Research işlevinden elde edilen çıktıyı bir yapay zeka sesli podcast’ine dönüştürerek gösteriyor.

Bu sesli özetler ilk olarak geçen yıl NotebookLM’de yayınlandı. Yapay zeka tarafından üretilen diğer içerikler gibi, hem podcast’ler hem de Derin Araştırma özelliği yanlış bilgiler içerebilir. Bu, her iki aracın da yararlı olamayacağı anlamına gelmez, sadece muhtemelen bilmediğiniz bir şeyi öğrenmek için bunları kullanmamalısınız çünkü burada hataları tespit edemezsiniz.

Ses özelliği şu anda yalnızca İngilizce’yi destekliyor ve web ve mobil platformlar üzerinden erişilebiliyor. Kullanıcılar oluşturulan ses dosyalarını indirebilir ve paylaşabilir. Google’a göre, her iki özellik de Gemini ve Gemini Advanced aboneleri için artık dünya çapında kullanılabilir.

Google yeni Gemini yapay zeka özelliklerini kullanıma sunuyor

Google, yılın başından bu yana Gemini ekosistemini büyük ölçüde genişletti. Gemini Live, Samsung Galaxy S24/S25 ve Pixel 9 cihazlarından başlayarak video ve ekran paylaşımı desteği ekliyor ve Google, Samsung uygulamalarıyla entegrasyon da dahil olmak üzere Android’in varsayılan yapay zeka asistanı olarak Google Asistan’ı Gemini ile değiştirmeyi planlıyor.

Buna ek olarak Google üç yeni model çeşidini piyasaya sürdü: Gemini 2.0 Flash temel model olarak hizmet verirken, Flash Lite uygun maliyetli işleme sunuyor ve 2.0 Pro deneysel olarak genişletilmiş bağlam işleme sağlıyor.

AB, İsviçre ve İngiltere dışında, Gemini artık daha bağlamsal yanıtlar için kullanıcıların Google arama geçmişine erişebiliyor. Platform ayrıca görüntü oluşturma ve düzenleme ve YouTube videolarını anlama için yerel çok modlu yetenekler kazandı.

Kaynak: The Decoder

Haberler

NotebookLM’nin Video Genel Bakış özelliği artık 80 dili destekliyor

Google, NotebookLM’nin “Video Özetleri” özelliğini aralarında Türkçe, Fransızca, Almanca, İspanyolca ve Japonca dahil 80 dili destekleyecek şekilde güncellediğini  duyurdu. Şirket ayrıca, İngilizce olmayan sesli özetleri daha ayrıntılı hale getirerek “Ses Özetleri” özelliğini de geliştirdi.

Yayınlanma tarihi

=>

Google, NotebookLM’nin “Video Özetleri” özelliğini aralarında Türkçe, Fransızca, Almanca, İspanyolca ve Japonca dahil 80 dili destekleyecek şekilde güncellediğini  duyurdu. Şirket ayrıca, İngilizce olmayan sesli özetleri daha ayrıntılı hale getirerek “Ses Özetleri” özelliğini de geliştirdi.

NotebookLM, geçen ay kullanıcıların notlarını, PDF’lerini ve görsellerini video sunumlarına dönüştürebilmeleri için Video Genel Bakış özelliğini kullanıma sundu. Daha önce yalnızca İngilizce olarak sunulan bu güncelleme, tercih ettikleri dilde görsel özetlerden öğrenmek isteyen İngilizce bilmeyenler için faydalı olacak. 

Ayrıca, “Sesli Genel Bakışlar”, İngilizce bilmeyen kullanıcılar için de daha iyi hale geliyor. Başlangıçta kısa özetlerle sınırlıydı, tam sürüm ise yalnızca İngilizce. Artık kullanıcılar 80’den fazla dilde daha derinlemesine genel bakışlara erişebiliyor. Şirket, yalnızca önemli noktaları görmek isteyen kullanıcılar için daha kısa bir genel bakış seçeneği sunmaya devam edeceğini belirtiyor.  

Bu güncellemeler, NotebookLM’nin küresel kitlesinin ihtiyaçlarını karşılamak üzere tasarlandı ve kullanıcıların hangi dili tercih ederlerse etsinler, video veya sesli özetler aracılığıyla öğrenmelerine yardımcı oluyor.

Bu yeni güncellemeler 25 Ağustos 2025 tarihinden itibaren herkesin kullanımına sunulacak ve hızla dünya genelinde yaygınlaştırılacak.

Okumaya devam et

Haberler

Elevenlabs, yeni ifade kontrolleri ve sınırsız ses desteğiyle v3 modelini piyasaya sürdü

ElevenLabs, API aracılığıyla kullanılabilen güncellenmiş bir metinden sese dönüştürme modeli olan Eleven v3’ü (alfa) yayınladı.

Yayınlanma tarihi

=>

ElevenLabs, API aracılığıyla kullanılabilen güncellenmiş bir metinden sese dönüştürme modeli olan Eleven v3’ü (alfa) yayınladı. Yeni sürüm, daha etkileyici seçenekler, ek kontroller ve 70’ten fazla dil desteği sunuyor. Önemli değişiklikler arasında, istediğiniz sayıda konuşmacıyı işleyebilen bir iletişim modu, duygu ve sesi kontrol etmek için yeni ses etiketleri yer alıyor.

Eleven v3 (alfa) API ücretsiz bir hesapla çalışıyor, ancak bazı özellikler için ödeme gerekebilir. Teknik ayrıntılar ve örnekler resmi belgelerde mevcut. Yeni kullanıcılar ücretsiz olarak kayıt kullanmaya başlayabilir.

Okumaya devam et

Haberler

Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı piyasaya sürdü

Wondercraft, “içerik oluşturmak için tasarlanmış ilk yapay zeka aracı” olarak adlandırdığı “Wonda”yı piyasaya sürdü. Bu araç, kullanıcıların basit bir sohbetle profesyonel ses ve video oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıyor.

Yayınlanma tarihi

=>

Wondercraft, Wonda’yı tanıtarak, içerik oluşturmak için özel olarak tasarlanmış ilk yapay zeka aracının tanıtımını yaptı. Y Combinator destekli şirket, bu teknolojinin kullanıcıların doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıdığını ve geleneksel düzenleme yazılımlarına veya teknik uzmanlığa ihtiyaç olmadığını duyurdu.

Duyuruya göre, kullanıcılar istedikleri içeriği tanımlıyor ve Wonda, sezgisel bir konuşma arayüzü aracılığıyla gerçek zamanlı yinelemelere izin vererek içeriği oluşturuyor. Platform, şirketin zaman çizelgelerine, kayıt yazılımlarına ve geleneksel düzenleme araçlarına dayanan geleneksel içerik oluşturma iş akışlarından “radikal bir değişim” olarak adlandırdığı şeyi temsil ediyor.

Wondercraft’ın kurucu ortağı Dimitris Nikolaou, “İnsan hikâye anlatıcılığı, kamp ateşi etrafında yapılan sohbetlerle başladı. Wonda bizi o sadeliğe geri götürüyor: Siz konuşursunuz, Wonda yaratır” diyerek, “Hiçbir şey insan hikâye anlatıcılığı kadar güçlü değildir, ancak birçok yaratıcı fikir, eski düzenleme araçlarının zaman çizelgelerinde yok olur. Adobe’nin yaratıcılığı basitleştirmek için 30 yılı vardı. Wonda ise bunu 30 saniyede yapıyor” diye devam ediyor.

Lansman, içerik oluşturma engellerinin pazarlama ekiplerini zorlamaya devam ettiği bir dönemde gerçekleşti. Wondercraft tarafından yakın zamanda yayınlanan bir araştırma raporuna göre, küresel içerik üreticilerinin %80’inden fazlası artık iş akışlarına yapay zekayı dahil ediyor ve yaklaşık %40’ı fikir aşamasından üretime kadar uçtan uca yapay zeka kullanıyor.  Sesli reklamcılık  , tüketici etkileşimi ile reklamveren yatırımı arasında belgelenmiş %22’lik bir farkla, önemli ölçüde keşfedilmemiş bir potansiyele sahip.

Teknik yetenekler ve mevcut sınırlamalar

Wonda, içerik oluşturucularına şu anda altı temel işlev sunuyor. Sistem, konuşma komutlarıyla içerik oluşturmayı mümkün kılıyor, yüklenen notlardan veya dosyalardan senaryolar oluşturuyor, etkileyici yapay zeka sesleri üretiyor veya mevcut sesleri kopyalıyor, özel müzikler ve efektler ekliyor, görseller ve avatarlar aracılığıyla görsellere hayat veriyor ve yayına hazır, cilalı ve son halini almış içerikler sunuyor.

Platform, uygun renkleri, yazı tiplerini ve düzenleri seçmek için web sitelerini analiz ederek marka unsurlarını otomatik olarak entegre eder. Eksiksiz ses kontrolü, kullanıcıların oluşturulan ses içeriğinde tonu, duyguyu ve tempoyu ayarlamasına olanak tanır. Özel ses parçaları ve efektler, Wondercraft kütüphanesinden alınabilir veya bireysel projeler için özel olarak yeni sesler üretilebilir.

Wonda şu anda yalnızca ses prodüksiyonu için faaliyet gösteriyor ve video üretim yetenekleri 2025 sonbaharında beta kullanıcılarına sunulacak. Şirket, video özelliğinin genişlemesi için kesin bir tarih veya hangi kullanıcıların öncelikli erişime sahip olacağını belirtmedi.

Wondercraft, Şubat 2024’ten bu yana 110 ülkede 300.000’den fazla kullanıcıya ulaştı. Platform, Amazon, Spotify, BetterHelp, Dünya Bankası ve Publicis Groupe’daki yaratıcı ekiplere hizmet verirken, aynı zamanda Spotify Advertising tarafından onaylanan ve kullanılan bir yapay zeka prodüksiyon platformu olarak da faaliyet gösteriyor.

Sektör bağlamı ve piyasa zamanlaması

Bu duyuru, pazarlamacıların %72’sinin 2025’te yatırımlarını artırmayı planladığı, programatik reklamcılıkta önemli bir büyüme döneminde geldi. Dijital reklam yatırımlarının en küçük payı olmaya devam etmesine rağmen, sesli reklamcılık özellikle 2023 ile 2025 yılları arasında programatik harcamaların %7’sinden %9’una mütevazı bir büyüme gösteriyor.

Sesli içerik oluşturma zorlukları,  2025 boyunca çeşitli platform entegrasyonlarına yol açtı. Trade Desk, 28 Nisan 2025’te Bunny Studio ile ortaklık kurduğunu duyurdu ve bu ortaklık, Kokai platformunda doğrudan sesli reklam üretimine olanak sağladı. Benzer şekilde, AudioGO da Şubat 2025’te otomatik teklif verme için Dinamik Fiyatlandırma özelliğini kullanıma sunarak, sektörün sesli reklam iş akışlarını basitleştirme çabalarını gösterdi.

Kuruluşlar verimlilik iyileştirmeleri ararken, pazarlama topluluğu yapay zeka destekli içerik araçlarına artan bir ilgi gösteriyor. Treasure Data, CDP World 2024’te Müşteri Veri Platformları için Yapay Zeka Çerçevesini tanıttı ve pazarlama operasyonlarını geliştirmek üzere tasarlanmış, kişi tabanlı üretken yapay zeka sohbet arayüzlerini tanıttı.

Kurucu ortak ve yaratıcı ekonomi uzmanı Oskar Serrander, “Yaratıcı üretimin geleceği, azınlık için karmaşıklık üzerine değil, çoğunluk için daha basit konuşmalar üzerine inşa edilecek,” dedi. “Yapay zeka ajanlarının yakında tarayıcı kadar temel olacağı yeni bir insan yaratıcılığı çağına giriyoruz. Wonda, fikirlerinizi gerçek zamanlı olarak şekillendirmek için geleneksel iş akışlarını ve yazılımları diyalogla değiştiriyor.”

Uygulama ve erişilebilirlik

DAX Global Operasyonlardan Sorumlu Başkan Yardımcısı Jake Rea, son beta döneminin ardından şu geri bildirimde bulundu: “Wonda, Wondercraft platformuna eklenen değerli bir yenilik. Müşterilerimize sunduğumuz ses prodüksiyon hizmetlerini daha da kolaylaştırmak için tasarlandı. Wondercraft, yapay zeka alanında gelişmeye devam ediyor ve hem verimliliği hem de yaratıcı çıktıları artıran yenilikçi özellikler sunuyor.”

Platform, 1 Eylül 2025’ten itibaren bir bekleme listesi sistemiyle faaliyet gösterecek ve şirket haftalık 10.000 kullanıcıyı sisteme dahil etmeyi planlıyor. Bekleme listesi üyeleri için öncelikli erişim 30 güne kadar uzatılabiliyor, ancak Wondercraft öncelikli seçim için belirli kriterleri ayrıntılı olarak açıklamadı.

Şirket, Wonda’nın yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu ele aldığını belirtiyor. Geleneksel ses ve video prodüksiyonu genellikle birçok içerik üreticisinin sahip olmadığı özel yazılım bilgisi, profesyonel ekipman ve teknik uzmanlık gerektirir.

Wondercraft, Londra ve New York’taki ofisleriyle dünya çapında faaliyet gösteriyor ve 110 ülkedeki müşterilere hizmet veriyor. Şirket, Y Combinator, Podcast Sunucusu Steven Bartlett, Unicorn AI ses platformu ElevenLabs ve Will Ventures’tan destek alıyor.

Teknik mimari ve farklılaşma

Sistemin konuşma arayüzü, kullanıcıların belirli yazılım arayüzlerini öğrenmesini gerektiren mevcut içerik oluşturma platformlarından onu farklı kılıyor. Kullanıcılar, zaman çizelgelerini değiştirmek, ses seviyelerini ayarlamak veya karmaşık katman sistemlerini yönetmek yerine, gereksinimlerini doğal dilde iletiyor.

Yapay zeka aracısı bu istekleri işler ve ek konuşma girdilerine dayanarak yineleme yeteneğini korurken uygun içerik üretir. Bu yaklaşım, birçok kişi ve kuruluşun profesyonel kalitede ses ve video içeriği üretmesini engelleyen teknik engelleri potansiyel olarak azaltır.

Platformlar daha gelişmiş hedefleme ve ölçüm yetenekleri geliştirdikçe, programatik ses kullanımı  yaygınlaşmaya devam ediyor. Spotify, Temmuz 2025’te otomatik podcast satın alımını 12 pazarda 170 milyon dinleyiciye genişleterek, büyük platformların ses envanterine erişimi nasıl demokratikleştirdiğini gösterdi.

Wonda’nın lansmanının zamanlaması,  yapay zeka aramalarının  geleneksel pazarlama yaklaşımları üzerindeki etkisine dair artan endişelerle aynı zamana denk geliyor. Pazarlamacıların %58’i yapay zeka destekli arama sonuçlarında içerik görünümünü izlemek için manuel gözlem tekniklerini kullanırken, Wonda gibi araçlar, değişen arama ortamlarına uyum sağlamak için daha hızlı içerik oluşturma potansiyeline sahip.

Piyasa etkileri ve rekabet ortamı

Wonda’nın lansmanı, içerik oluşturmaya özel olarak odaklanan ilk yapay zeka aracını temsil ediyor ve bu da onu yaratıcı çalışmalara uyarlanmış genel amaçlı yapay zeka araçlarından farklı kılıyor. Şirket, mevcut yazılımları geliştirmek yerine tüm iş akışlarını değiştirmeye odaklanıyor ve bu da birden fazla araç bağımlılığını ortadan kaldırmak isteyen kuruluşlara hitap edebilir.

Platformun yaklaşımı, mevcut ürünlerine yapay zeka özellikleri ekleyen geleneksel yazılım satıcılarının yaklaşımından farklıdır. Kullanıcılar, karmaşık arayüzleri öğrenip ardından yapay zeka desteği uygulamak yerine, içerik oluşturma hedeflerine ulaşmak için doğrudan yapay zeka aracısıyla iletişim kurarlar.

2023 yılında eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün deneyimli ismi Oskar Serrander tarafından kurulan Wondercraft, yapay zeka teknolojisi ve içerik üretiminin kesişim noktasında konumlanıyor. Serrander’in geçmişinde Spotify, Acast, iHeartMedia ve Carat/Dentsu’da deneyim bulunuyor.

Şirketin genişleme stratejisiyle ilgili olarak Serrander, “Sadece dünyanın en kapsamlı içerik stüdyosunu inşa etmiyoruz; aynı zamanda yaratıcılığın ihtiyaç duyulduğu her yerde güçlenmesini sağlayacak bir aracı inşa ediyoruz” dedi.

Şirket, ortaklıklar aracılığıyla genişlemeyi ve acentesini yaratıcı çalışmaların halihazırda gerçekleştiği platformlara entegre etmeyi planlıyor. Bu dağıtım stratejisi, kullanıcıların tamamen yeni platformlar benimsemesini gerektirmek yerine, mevcut iş akışı araçlarıyla entegre olarak benimsenmeyi hızlandırabilir.

Wonda’yı deneyimlemek ve yeni Wondercraft içerik stüdyosuna erişmek isteyen kullanıcılar, wondercraft.ai/wonda adresinden bekleme listesine kaydolabilirler. Şirket, hizmetin fiyatlandırma ayrıntılarını açıklamadı veya bireysel içerik oluşturucular ile kurumsal müşteriler için farklı seviyelerin mevcut olup olmayacağını belirtmedi.

Zaman çizelgesi

  • Şubat 2024 : Wondercraft, 110 ülkede 300.000’den fazla kullanıcıya ulaşarak kullanıcı sayısını artırmaya başladı
  • 3 Şubat 2025 :  AudioGO, otomatik teklif verme için Dinamik Fiyatlandırmayı tanıttı
  • 28 Nisan 2025 :  Trade Desk, sesli reklam oluşturma için Bunny Studio’yu entegre ediyor
  • Temmuz 2025 :  Spotify, otomatik podcast satın alımını 170 milyon dinleyiciye genişletiyor
  • 19 Ağustos 2025 : Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı duyurdu
  • 1 Eylül 2025 : Wonda bekleme listesi haftalık 10.000 kullanıcı hedefiyle açılıyor
  • Sonbahar 2025 : Video üretim yeteneklerinin beta sürümüne sunulması planlanıyor

Özet

Kim: Eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün kıdemli ismi Oskar Serrander tarafından kurulan, Y Combinator destekli bir yapay zeka içerik stüdyosu olan Wondercraft.

Ne: İçerik oluşturma için özel olarak tasarlanmış ilk yapay zeka aracı olan Wonda’nın piyasaya sürülmesi, kullanıcıların geleneksel düzenleme yazılımlarına ihtiyaç duymadan doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına ve düzenlemesine olanak sağlıyor.

Ne zaman: 19 Ağustos 2025’te duyuruldu, bekleme listesi 1 Eylül 2025’te açılacak ve video özellikleri 2025 sonbaharında beta kullanıcılarına sunulacak.

Nerede: Londra ve New York’ta şirket ofisleri bulunan, 110 ülkede 300.000’den fazla kullanıcıya hizmet veren küresel platform.

Neden: Karmaşık geleneksel iş akışlarını basit konuşma arayüzleriyle değiştirerek yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu gidermek ve iş akışlarına yapay zekayı dahil eden yaratıcıların %80’ini hedeflemek.

Kaynak: PPC.Land

Okumaya devam et

En son