Haberler
ai|coustics Lark’ı Tanıttı: Stüdyo kalitesinde konuşma iyileştirme için yapay zeka modeli
ai|coustics, herhangi bir cihaz, konum veya dilde stüdyo kalitesinde konuşma sesi sunmak için tasarlanmış yeni bir yapay zeka modeli olan Lark’ın piyasaya sürüldüğünü duyurdu. Lark ile kullanıcılar, en bozuk kayıtları bile onarmak, kayıp frekansları geri yüklemek ve derinlik ve netlik eklemek için gelişmiş yeniden yapılandırma teknolojisini kullanarak seslerini profesyonel düzeyde kaliteye yükseltebilirler.
Yayınlanma tarihi
10 ay önceon
Yazar :
Podcast Turkeyai|coustics, herhangi bir cihaz, konum veya dilde stüdyo kalitesinde konuşma sesi sunmak için tasarlanmış yeni bir yapay zeka modeli olan Lark’ın piyasaya sürüldüğünü duyurdu. Lark ile kullanıcılar, en bozuk kayıtları bile onarmak, kayıp frekansları geri yüklemek ve derinlik ve netlik eklemek için gelişmiş yeniden yapılandırma teknolojisini kullanarak seslerini profesyonel düzeyde kaliteye yükseltebilirler.
ai|coustics’in kurucu ortağı Fabian Seipel, “Lark ile amacımız her duruma güçlendirilmiş ses kalitesi getirmek. İster içerik oluşturucu, ister gazeteci, ister ses mühendisi olun, Lark ses kalitesini gerçek zamanlı olarak, zahmetsizce geliştirmek için yeni olanaklar sunuyor” dedi.
Lark’ın Temel Özellikleri:
- Yapay Zeka Güdümlü Yeniden Yapılandırma: Lark’ın teknolojisi hasarlı ses sinyallerini onararak eksik frekansları geri kazandırıyor ve ses netliğini artırıyor.
- Çok Yönlü Ses İyileştirme: Bant sınırlı veya codec sıkıştırmalı ses sinyallerinin onarımı ve stüdyo dışındaki zorlu kayıtların iyileştirilmesi için mükemmel.
- Şimdi Web Uygulamasında Mevcut: Lark, ai|coustics’in web platformu üzerinden kullanıma hazır ve yakında entegrasyon olanaklarını genişleten bir API seçeneği olarak sunulacak.
Finch ve Lark Arasında Seçim Yapmak
Lark, ai|coustics’in mevcut modeli Finch’e katılarak kullanıcılara seslerini nasıl geliştirecekleri konusunda bir seçenek sunuyor:
- Finch, arka plan gürültüsünü ortadan kaldırmak için ideal olan yapay zeka tabanlı bir eksiltici model. Finch’i kalabalık caddeler veya yankı dolu odalar gibi yoğun ortam seslerinin olduğu ortamlar için kullanın.
- Lark, eksik ses frekanslarını doldurmak ve genel zenginliği artırmak için yapay zeka odaklı yeniden yapılandırmadan yararlanıyor ve ses restorasyonuna daha ayrıntılı ve yaratıcı bir yaklaşım gerektiren durumlar için ideal.
Uygulamada Lark Örnekleri:
- Yüksek frekansların kaybolduğu arşiv seslerine netlik kazandırır.
- Web seminerleri veya çevrimiçi kayıtlar için mükemmel olan sıkıştırılmış kodeklerden gelen tiz sesleri onarma.
- Sınırlı son kullanıcı cihazlarıyla veya mikrofondan uzakta yapılan kayıtları iyileştirme.
Teknoloji Nasıl Çalışıyor?
Finch gibi Lark da makine öğrenimi üzerine inşa edildi. ai|coustics mühendisleri, gerçek dünyadaki kayıt zorluklarını simüle etmek için model eğitimi sırasında çeşitli ses bozulmaları yarattı. Finch’in eğitimi eksiltici gürültü azaltmayı vurgularken, Lark kayıp ses ayrıntılarını etkili bir şekilde geri yükleyen yeniden yapılandırıcı geliştirmeye odaklanıyor. Her iki model de içerikten bağımsız olarak ses sinyaliyle çalışarak onları her dile, aksana ve konuşmacıya uyarlanabilir hale getiriyor.
Yapay akustik için sırada ne var?
Bu lansmanın ardından ai|coustics, Lark’ı API’sinde yayınlamayı ve bir SDK aracılığıyla tüketici cihazlarına erişimi genişletmeyi planlıyor. Fabian, “Bu lansman, yüksek kaliteli sesi herkes için her yerde ve her zaman erişilebilir hale getirme misyonumuza yönelik bir adımı” diye ekledi.
ai|coustics hakkında
Berlin merkezli girişim ai|coustics, her cihazda ve herkes için Generative Audio AI algoritmalarıyla sesli iletişim ve içerik oluşturmada düşük konuşma kalitesi ve anlaşılabilirlikle ilgili çözümler üretiyor. Teknolojisi, medya yaratıcılarını ve ses şirketlerini ürünlerine ve prodüksiyonlarına yeni bir konuşma kalitesi standardı ekleme konusunda güçlendirerek iletişim kurma ve içerik tüketme şeklerini iyileştiriyor.
Lark artık ai|coustics web uygulamasında mevcut. Hangi modelin ihtiyaçlarınıza en uygun olduğunu keşfedin (Finch veya Lark) veya ikisini birlikte kullanabilirsiniz.
Kaynak: PodNews
Beğenebilirsin
Haberler
NotebookLM’nin Video Genel Bakış özelliği artık 80 dili destekliyor
Google, NotebookLM’nin “Video Özetleri” özelliğini aralarında Türkçe, Fransızca, Almanca, İspanyolca ve Japonca dahil 80 dili destekleyecek şekilde güncellediğini duyurdu. Şirket ayrıca, İngilizce olmayan sesli özetleri daha ayrıntılı hale getirerek “Ses Özetleri” özelliğini de geliştirdi.
Yayınlanma tarihi
12 saat önce=>
26 Ağustos 2025Google, NotebookLM’nin “Video Özetleri” özelliğini aralarında Türkçe, Fransızca, Almanca, İspanyolca ve Japonca dahil 80 dili destekleyecek şekilde güncellediğini duyurdu. Şirket ayrıca, İngilizce olmayan sesli özetleri daha ayrıntılı hale getirerek “Ses Özetleri” özelliğini de geliştirdi.
NotebookLM, geçen ay kullanıcıların notlarını, PDF’lerini ve görsellerini video sunumlarına dönüştürebilmeleri için Video Genel Bakış özelliğini kullanıma sundu. Daha önce yalnızca İngilizce olarak sunulan bu güncelleme, tercih ettikleri dilde görsel özetlerden öğrenmek isteyen İngilizce bilmeyenler için faydalı olacak.
Ayrıca, “Sesli Genel Bakışlar”, İngilizce bilmeyen kullanıcılar için de daha iyi hale geliyor. Başlangıçta kısa özetlerle sınırlıydı, tam sürüm ise yalnızca İngilizce. Artık kullanıcılar 80’den fazla dilde daha derinlemesine genel bakışlara erişebiliyor. Şirket, yalnızca önemli noktaları görmek isteyen kullanıcılar için daha kısa bir genel bakış seçeneği sunmaya devam edeceğini belirtiyor.
Bu güncellemeler, NotebookLM’nin küresel kitlesinin ihtiyaçlarını karşılamak üzere tasarlandı ve kullanıcıların hangi dili tercih ederlerse etsinler, video veya sesli özetler aracılığıyla öğrenmelerine yardımcı oluyor.
Bu yeni güncellemeler 25 Ağustos 2025 tarihinden itibaren herkesin kullanımına sunulacak ve hızla dünya genelinde yaygınlaştırılacak.
Haberler
Elevenlabs, yeni ifade kontrolleri ve sınırsız ses desteğiyle v3 modelini piyasaya sürdü
ElevenLabs, API aracılığıyla kullanılabilen güncellenmiş bir metinden sese dönüştürme modeli olan Eleven v3’ü (alfa) yayınladı.
Yayınlanma tarihi
3 gün önce=>
23 Ağustos 2025ElevenLabs, API aracılığıyla kullanılabilen güncellenmiş bir metinden sese dönüştürme modeli olan Eleven v3’ü (alfa) yayınladı. Yeni sürüm, daha etkileyici seçenekler, ek kontroller ve 70’ten fazla dil desteği sunuyor. Önemli değişiklikler arasında, istediğiniz sayıda konuşmacıyı işleyebilen bir iletişim modu, duygu ve sesi kontrol etmek için yeni ses etiketleri yer alıyor.
Eleven v3 (alfa) API ücretsiz bir hesapla çalışıyor, ancak bazı özellikler için ödeme gerekebilir. Teknik ayrıntılar ve örnekler resmi belgelerde mevcut. Yeni kullanıcılar ücretsiz olarak kayıt kullanmaya başlayabilir.
Haberler
Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı piyasaya sürdü
Wondercraft, “içerik oluşturmak için tasarlanmış ilk yapay zeka aracı” olarak adlandırdığı “Wonda”yı piyasaya sürdü. Bu araç, kullanıcıların basit bir sohbetle profesyonel ses ve video oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıyor.
Yayınlanma tarihi
5 gün önce=>
21 Ağustos 2025Wondercraft, Wonda’yı tanıtarak, içerik oluşturmak için özel olarak tasarlanmış ilk yapay zeka aracının tanıtımını yaptı. Y Combinator destekli şirket, bu teknolojinin kullanıcıların doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına, düzenlemesine ve iyileştirmesine olanak tanıdığını ve geleneksel düzenleme yazılımlarına veya teknik uzmanlığa ihtiyaç olmadığını duyurdu.
Duyuruya göre, kullanıcılar istedikleri içeriği tanımlıyor ve Wonda, sezgisel bir konuşma arayüzü aracılığıyla gerçek zamanlı yinelemelere izin vererek içeriği oluşturuyor. Platform, şirketin zaman çizelgelerine, kayıt yazılımlarına ve geleneksel düzenleme araçlarına dayanan geleneksel içerik oluşturma iş akışlarından “radikal bir değişim” olarak adlandırdığı şeyi temsil ediyor.
Wondercraft’ın kurucu ortağı Dimitris Nikolaou, “İnsan hikâye anlatıcılığı, kamp ateşi etrafında yapılan sohbetlerle başladı. Wonda bizi o sadeliğe geri götürüyor: Siz konuşursunuz, Wonda yaratır” diyerek, “Hiçbir şey insan hikâye anlatıcılığı kadar güçlü değildir, ancak birçok yaratıcı fikir, eski düzenleme araçlarının zaman çizelgelerinde yok olur. Adobe’nin yaratıcılığı basitleştirmek için 30 yılı vardı. Wonda ise bunu 30 saniyede yapıyor” diye devam ediyor.
Lansman, içerik oluşturma engellerinin pazarlama ekiplerini zorlamaya devam ettiği bir dönemde gerçekleşti. Wondercraft tarafından yakın zamanda yayınlanan bir araştırma raporuna göre, küresel içerik üreticilerinin %80’inden fazlası artık iş akışlarına yapay zekayı dahil ediyor ve yaklaşık %40’ı fikir aşamasından üretime kadar uçtan uca yapay zeka kullanıyor. Sesli reklamcılık , tüketici etkileşimi ile reklamveren yatırımı arasında belgelenmiş %22’lik bir farkla, önemli ölçüde keşfedilmemiş bir potansiyele sahip.
Teknik yetenekler ve mevcut sınırlamalar
Wonda, içerik oluşturucularına şu anda altı temel işlev sunuyor. Sistem, konuşma komutlarıyla içerik oluşturmayı mümkün kılıyor, yüklenen notlardan veya dosyalardan senaryolar oluşturuyor, etkileyici yapay zeka sesleri üretiyor veya mevcut sesleri kopyalıyor, özel müzikler ve efektler ekliyor, görseller ve avatarlar aracılığıyla görsellere hayat veriyor ve yayına hazır, cilalı ve son halini almış içerikler sunuyor.
Platform, uygun renkleri, yazı tiplerini ve düzenleri seçmek için web sitelerini analiz ederek marka unsurlarını otomatik olarak entegre eder. Eksiksiz ses kontrolü, kullanıcıların oluşturulan ses içeriğinde tonu, duyguyu ve tempoyu ayarlamasına olanak tanır. Özel ses parçaları ve efektler, Wondercraft kütüphanesinden alınabilir veya bireysel projeler için özel olarak yeni sesler üretilebilir.
Wonda şu anda yalnızca ses prodüksiyonu için faaliyet gösteriyor ve video üretim yetenekleri 2025 sonbaharında beta kullanıcılarına sunulacak. Şirket, video özelliğinin genişlemesi için kesin bir tarih veya hangi kullanıcıların öncelikli erişime sahip olacağını belirtmedi.
Wondercraft, Şubat 2024’ten bu yana 110 ülkede 300.000’den fazla kullanıcıya ulaştı. Platform, Amazon, Spotify, BetterHelp, Dünya Bankası ve Publicis Groupe’daki yaratıcı ekiplere hizmet verirken, aynı zamanda Spotify Advertising tarafından onaylanan ve kullanılan bir yapay zeka prodüksiyon platformu olarak da faaliyet gösteriyor.
Sektör bağlamı ve piyasa zamanlaması
Bu duyuru, pazarlamacıların %72’sinin 2025’te yatırımlarını artırmayı planladığı, programatik reklamcılıkta önemli bir büyüme döneminde geldi. Dijital reklam yatırımlarının en küçük payı olmaya devam etmesine rağmen, sesli reklamcılık özellikle 2023 ile 2025 yılları arasında programatik harcamaların %7’sinden %9’una mütevazı bir büyüme gösteriyor.
Sesli içerik oluşturma zorlukları, 2025 boyunca çeşitli platform entegrasyonlarına yol açtı. Trade Desk, 28 Nisan 2025’te Bunny Studio ile ortaklık kurduğunu duyurdu ve bu ortaklık, Kokai platformunda doğrudan sesli reklam üretimine olanak sağladı. Benzer şekilde, AudioGO da Şubat 2025’te otomatik teklif verme için Dinamik Fiyatlandırma özelliğini kullanıma sunarak, sektörün sesli reklam iş akışlarını basitleştirme çabalarını gösterdi.
Kuruluşlar verimlilik iyileştirmeleri ararken, pazarlama topluluğu yapay zeka destekli içerik araçlarına artan bir ilgi gösteriyor. Treasure Data, CDP World 2024’te Müşteri Veri Platformları için Yapay Zeka Çerçevesini tanıttı ve pazarlama operasyonlarını geliştirmek üzere tasarlanmış, kişi tabanlı üretken yapay zeka sohbet arayüzlerini tanıttı.
Kurucu ortak ve yaratıcı ekonomi uzmanı Oskar Serrander, “Yaratıcı üretimin geleceği, azınlık için karmaşıklık üzerine değil, çoğunluk için daha basit konuşmalar üzerine inşa edilecek,” dedi. “Yapay zeka ajanlarının yakında tarayıcı kadar temel olacağı yeni bir insan yaratıcılığı çağına giriyoruz. Wonda, fikirlerinizi gerçek zamanlı olarak şekillendirmek için geleneksel iş akışlarını ve yazılımları diyalogla değiştiriyor.”
Uygulama ve erişilebilirlik
DAX Global Operasyonlardan Sorumlu Başkan Yardımcısı Jake Rea, son beta döneminin ardından şu geri bildirimde bulundu: “Wonda, Wondercraft platformuna eklenen değerli bir yenilik. Müşterilerimize sunduğumuz ses prodüksiyon hizmetlerini daha da kolaylaştırmak için tasarlandı. Wondercraft, yapay zeka alanında gelişmeye devam ediyor ve hem verimliliği hem de yaratıcı çıktıları artıran yenilikçi özellikler sunuyor.”
Platform, 1 Eylül 2025’ten itibaren bir bekleme listesi sistemiyle faaliyet gösterecek ve şirket haftalık 10.000 kullanıcıyı sisteme dahil etmeyi planlıyor. Bekleme listesi üyeleri için öncelikli erişim 30 güne kadar uzatılabiliyor, ancak Wondercraft öncelikli seçim için belirli kriterleri ayrıntılı olarak açıklamadı.
Şirket, Wonda’nın yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu ele aldığını belirtiyor. Geleneksel ses ve video prodüksiyonu genellikle birçok içerik üreticisinin sahip olmadığı özel yazılım bilgisi, profesyonel ekipman ve teknik uzmanlık gerektirir.
Wondercraft, Londra ve New York’taki ofisleriyle dünya çapında faaliyet gösteriyor ve 110 ülkedeki müşterilere hizmet veriyor. Şirket, Y Combinator, Podcast Sunucusu Steven Bartlett, Unicorn AI ses platformu ElevenLabs ve Will Ventures’tan destek alıyor.
Teknik mimari ve farklılaşma
Sistemin konuşma arayüzü, kullanıcıların belirli yazılım arayüzlerini öğrenmesini gerektiren mevcut içerik oluşturma platformlarından onu farklı kılıyor. Kullanıcılar, zaman çizelgelerini değiştirmek, ses seviyelerini ayarlamak veya karmaşık katman sistemlerini yönetmek yerine, gereksinimlerini doğal dilde iletiyor.
Yapay zeka aracısı bu istekleri işler ve ek konuşma girdilerine dayanarak yineleme yeteneğini korurken uygun içerik üretir. Bu yaklaşım, birçok kişi ve kuruluşun profesyonel kalitede ses ve video içeriği üretmesini engelleyen teknik engelleri potansiyel olarak azaltır.
Platformlar daha gelişmiş hedefleme ve ölçüm yetenekleri geliştirdikçe, programatik ses kullanımı yaygınlaşmaya devam ediyor. Spotify, Temmuz 2025’te otomatik podcast satın alımını 12 pazarda 170 milyon dinleyiciye genişleterek, büyük platformların ses envanterine erişimi nasıl demokratikleştirdiğini gösterdi.
Wonda’nın lansmanının zamanlaması, yapay zeka aramalarının geleneksel pazarlama yaklaşımları üzerindeki etkisine dair artan endişelerle aynı zamana denk geliyor. Pazarlamacıların %58’i yapay zeka destekli arama sonuçlarında içerik görünümünü izlemek için manuel gözlem tekniklerini kullanırken, Wonda gibi araçlar, değişen arama ortamlarına uyum sağlamak için daha hızlı içerik oluşturma potansiyeline sahip.
Piyasa etkileri ve rekabet ortamı
Wonda’nın lansmanı, içerik oluşturmaya özel olarak odaklanan ilk yapay zeka aracını temsil ediyor ve bu da onu yaratıcı çalışmalara uyarlanmış genel amaçlı yapay zeka araçlarından farklı kılıyor. Şirket, mevcut yazılımları geliştirmek yerine tüm iş akışlarını değiştirmeye odaklanıyor ve bu da birden fazla araç bağımlılığını ortadan kaldırmak isteyen kuruluşlara hitap edebilir.
Platformun yaklaşımı, mevcut ürünlerine yapay zeka özellikleri ekleyen geleneksel yazılım satıcılarının yaklaşımından farklıdır. Kullanıcılar, karmaşık arayüzleri öğrenip ardından yapay zeka desteği uygulamak yerine, içerik oluşturma hedeflerine ulaşmak için doğrudan yapay zeka aracısıyla iletişim kurarlar.
2023 yılında eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün deneyimli ismi Oskar Serrander tarafından kurulan Wondercraft, yapay zeka teknolojisi ve içerik üretiminin kesişim noktasında konumlanıyor. Serrander’in geçmişinde Spotify, Acast, iHeartMedia ve Carat/Dentsu’da deneyim bulunuyor.
Şirketin genişleme stratejisiyle ilgili olarak Serrander, “Sadece dünyanın en kapsamlı içerik stüdyosunu inşa etmiyoruz; aynı zamanda yaratıcılığın ihtiyaç duyulduğu her yerde güçlenmesini sağlayacak bir aracı inşa ediyoruz” dedi.
Şirket, ortaklıklar aracılığıyla genişlemeyi ve acentesini yaratıcı çalışmaların halihazırda gerçekleştiği platformlara entegre etmeyi planlıyor. Bu dağıtım stratejisi, kullanıcıların tamamen yeni platformlar benimsemesini gerektirmek yerine, mevcut iş akışı araçlarıyla entegre olarak benimsenmeyi hızlandırabilir.
Wonda’yı deneyimlemek ve yeni Wondercraft içerik stüdyosuna erişmek isteyen kullanıcılar, wondercraft.ai/wonda adresinden bekleme listesine kaydolabilirler. Şirket, hizmetin fiyatlandırma ayrıntılarını açıklamadı veya bireysel içerik oluşturucular ile kurumsal müşteriler için farklı seviyelerin mevcut olup olmayacağını belirtmedi.
Zaman çizelgesi
- Şubat 2024 : Wondercraft, 110 ülkede 300.000’den fazla kullanıcıya ulaşarak kullanıcı sayısını artırmaya başladı
- 3 Şubat 2025 : AudioGO, otomatik teklif verme için Dinamik Fiyatlandırmayı tanıttı
- 28 Nisan 2025 : Trade Desk, sesli reklam oluşturma için Bunny Studio’yu entegre ediyor
- Temmuz 2025 : Spotify, otomatik podcast satın alımını 170 milyon dinleyiciye genişletiyor
- 19 Ağustos 2025 : Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı duyurdu
- 1 Eylül 2025 : Wonda bekleme listesi haftalık 10.000 kullanıcı hedefiyle açılıyor
- Sonbahar 2025 : Video üretim yeteneklerinin beta sürümüne sunulması planlanıyor
Özet
Kim: Eski Palantir mühendisleri Dimitris Nikolaou, Youssef Rizk ve içerik sektörünün kıdemli ismi Oskar Serrander tarafından kurulan, Y Combinator destekli bir yapay zeka içerik stüdyosu olan Wondercraft.
Ne: İçerik oluşturma için özel olarak tasarlanmış ilk yapay zeka aracı olan Wonda’nın piyasaya sürülmesi, kullanıcıların geleneksel düzenleme yazılımlarına ihtiyaç duymadan doğal konuşma yoluyla profesyonel ses ve video içeriği oluşturmasına ve düzenlemesine olanak sağlıyor.
Ne zaman: 19 Ağustos 2025’te duyuruldu, bekleme listesi 1 Eylül 2025’te açılacak ve video özellikleri 2025 sonbaharında beta kullanıcılarına sunulacak.
Nerede: Londra ve New York’ta şirket ofisleri bulunan, 110 ülkede 300.000’den fazla kullanıcıya hizmet veren küresel platform.
Neden: Karmaşık geleneksel iş akışlarını basit konuşma arayüzleriyle değiştirerek yaratıcı fikirler ile uygulama araçları arasındaki temel kopukluğu gidermek ve iş akışlarına yapay zekayı dahil eden yaratıcıların %80’ini hedeflemek.
Kaynak: PPC.Land
NotebookLM’nin Video Genel Bakış özelliği artık 80 dili destekliyor
Elevenlabs, yeni ifade kontrolleri ve sınırsız ses desteğiyle v3 modelini piyasaya sürdü
Wondercraft, içerik oluşturma için ilk yapay zeka aracı olan Wonda’yı piyasaya sürdü
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Araştırma1 yıl önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Haberler3 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik2 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı