Bizimle iletişime geçin

Haberler

D-ID, ses klonlama ve dudak senkronizasyonu içeren bir yapay zeka video çeviri aracı başlattı

Yapay zeka video oluşturma platformu D-ID, yapay zeka teknolojilerini kullanarak videoları diğer dillere çevirmek için bir araç sunan en son şirketlerden birisi oldu.

Yayınlanma tarihi

on

Yapay zeka video oluşturma platformu D-ID, yapay zeka teknolojilerini kullanarak videoları diğer dillere çevirmek için bir araç sunan en son şirketlerden birisi oldu. D-ID, yapay zeka düzenleme sürecinin bir parçası olarak konuşmacının sesini de klonluyor ve dudak hareketlerini çevrilen sözcüklerle eşleşecek şekilde değiştiriyor.

Teknoloji, D-ID’nin daha önceki çalışmalarından kaynaklanıyor; birkaç yıl önce kullanıcıların eski aile fotoğraflarını canlandırmış ve daha sonra bu fotoğrafların konuşabildiği viral trend olmuştu. Bu başarının ardından, girişim 2022’de 25 milyon dolarlık Seri B fon toplamayı başardı. Şirket, ABD’de yapay zeka destekli videolar yapmak için teknolojisini kullanan artan sayıda kurumsal müşterisine hizmet vermeyi hedefliyor.

Şirketin şu anda D-ID abonelerine ücretsiz olarak sunulan AI Video Çeviri teknolojisiyle, içerik oluşturucular erişimlerini genişletmelerine yardımcı olmak için videolarını otomatik olarak diğer dillere çevirebilirler. Toplamda, Türkçe, Arapça, Mandarin, Japonca, Hintçe, İspanyolca ve Fransızca dahil olmak üzere şu anda mevcut 30 dil bulunuyorr. Bir D-ID aboneliği, en ucuz planı ve yapay zeka özelliklerine yönelik kullanılacak en az kredi sayısı için yılda 56 dolardan başlıyor ve ardından kurumsal fiyatlandırmaya geçmeden önce yılda 1.293 dolara kadar çıkıyor.

D-ID, yeni YZ video teknolojisinin, müşterilerin pazarlama, eğlence ve sosyal medya gibi alanlarda kampanyalarını küresel bir kitleye ölçeklendirirken yerelleştirme maliyetlerinden tasarruf etmelerine yardımcı olabileceğini öne sürüyor. Teknoloji, hem dublaj hem de YZ video için diğer çözümlerle rekabet edecek.

Yıllardır, dublaj teknolojileri video izleyicilerinin kendi dillerinde ses dinlemesini kolaylaştırdı ancak genellikle daha küçük içerik oluşturucular için erişilemezdi. Şirketler teknolojiye erişimi iyileştirdikçe bu durum değişti. Örneğin, YouTube içerik oluşturucularının videolarını diğer dillere çevirerek daha geniş bir kitleyle bağlantı kurmasına yardımcı olmak için tasarlanmış çok dilli bir ses özelliği yayınladı. Tanınmış içerik oluşturucu MrBeast (Jimmy Donaldson) erken benimseyenler arasındaydı ve teknolojiyi kullanarak popüler videolarından birkaçını 11 dile daha getirdi.

Yapay zeka ile ses oluşturma, çevirme veya klonlama yeteneği de genişliyor. Microsoft bu yıl, izlerken YouTube videolarını ve diğerlerini çevirmek ve dublajlamak için yapay zekayı kullanacağını duyurdu. Temmuz ayında, içerik oluşturucu platformu Vimeo, sesi ve altyazıları çevirmek ve bunu konuşmacının sesini yapay zeka teknolojisiyle kopyalayarak yapmak için araçlar tanıttı. Ayrıca, Descript, ElevenLabs, Speechify, Veed, Camb.ai, Captions.ai ve Akool gibi birçok şirket ses klonlama veya yapay zeka çeviri araçları (veya bazen her ikisi) sunuyor ve HeyGen, Deepbrain AI ve diğerleri gibi düzinelerce dil konuşabilen yapay zeka avatarları kullanarak videolar oluşturmanıza olanak tanıyan araçlar da sunuyor.

Wav2lip gibi dublaj ve dudak senkronizasyonu yapan YZ kütüphaneleri, yeni kurulan şirketlerin bu tür araçları geliştirmesini kolaylaştırırken, içerik üreticilerine YZ teknolojisini kullanmayı daha kolay ve belki de daha uygun fiyatlı hale getireceklerini söylüyor. (D-ID’nin yeni geliştirdiği Rosetta-1 adlı tescilli modeli, YZ Video Translate’e güç veriyor.)

D-ID, yeni Video Çeviri teknolojisinin D-ID Studio ve API’si aracılığıyla kullanılabileceğini söylüyor. Bir aylık deneme sunuluyor ve web sitesinde daha fazla demo mevcut.

Şirket, videoların 10 saniye ile 5 dakika arasında uzunlukta olabileceğini ve dosya boyutunun 2 GB’ın altında olması gerektiğini söylüyor. Bu özellik, karede yalnızca bir kişi olduğunda çalışıyor ve en iyi sonuç için, her zaman yüzleri görünür şekilde kameraya bakmaları gerekiyor.

Kaynak: TechCrunch

 

Haberler

The Audio Marketplace (TAM) Avrupa’da piyasaya çıkıyor

Avrupa’da The Audio Marketplace önümüzdeki hafta açılıyor. Platform podcast yayıncılarını, medya kuruluşlarını ve ses üreticilerini birbirine bağlıyor ve yüksek kaliteli ses materyallerinin ticareti için bir pazar yeri oluşturuyor.

Yayınlanma tarihi

=>

Çok dilli profesyonel ses içeriği için Avrupa’nın ilk B2B platformu olan Audio Marketplace (TAM – The Audio Marketplace), Avrupa Komisyonu’nun desteğiyle Agence France-Presse (AFP) tarafından koordine edilen European Audio Dataspace (EAD) projesinin bir parçası olarak 16 Eylül’de resmi olarak faaliyete geçecek.

TAM, içerik üreticileri (podcast yayıncıları, gazeteciler, ses tasarımcıları) ile alıcıları (medya, kurumlar, işletmeler) bir araya getirerek, Avrupa çapında güvenilir ses içeriklerinin lisanslanması ve dağıtımı için güvenli ve yapılandırılmış bir merkez sunuyor.

AFP’nin Geliştirme ve Çeşitlendirme Direktörü Christine Buhagiar, “TAM ile, televizyonun Eurovision veya ENEX aracılığıyla zaten yaptığı gibi, profesyonellere sınır ötesi içerik satın alma, satma ve değiştirme araçları sunarak gerçek bir Avrupa ses ekosistemi oluşturmayı hedefliyoruz” dedi.

Temel Özellikler

  • Beş dilde (İngilizce, Fransızca, İspanyolca, Almanca, İtalyanca) Avrupa kataloğu
  • Lisans seçenekleri: Standart ve özelleştirilebilir sözleşmeler
  • AI destekli öneri aracı
  • Stripe üzerinden güvenli ödeme
  • Yaratıcılar ve alıcılar için özel alanlar
  • Yakında: Otomatik transkripsiyon ve ses önizlemeleri.

The Audio Marketplace web sitesini buradan ziyaret edebilirsiniz.

Okumaya devam et

Haberler

5.000 podcast; haftada 3.000 bölüm; bölüm başına 1 dolar maliyet

Eski Wondery yöneticisi Jeanine Wright, Inception Point AI adlı yeni bir firmaya liderlik ediyor ve bölgeyi sesli içerikle doldurma konusunda iddialı: “Bence hala yapay zeka tarafından üretilen tüm içeriklerden yapay zeka saçmalığı olarak bahseden insanlar muhtemelen tembel budalalardır.”

Yayınlanma tarihi

=>

AI kullanarak kendi podcast’inizi oluşturabilecekken neden ünlü bir podcast sunucusuna milyonlarca dolar ödeyesiniz?

Inception Point AI tam da bunu yapmaya çalışıyor. Şirket, podcast’leri sunmak ve sonunda sosyal medya, edebiyat ve daha birçok alanda daha geniş bir etki alanına sahip olmak için bir AI yetenek havuzu oluşturuyor. Anlatımlı podcast’leri üretmenin yüksek maliyetleri ve popüler sunucularla yapılan pahalı, kısa vadeli sözleşmelerin ortasında, buradaki fikir, yetenekleri (doğaçlama yapan insanlardan farklı olarak) sahip olmak, ölçeklendirmek ve kontrol etmek ve minimum maliyetle programlar üretmek.

“Yakın gelecekte gezegendeki insanların yarısının yapay zeka olacağına inanıyoruz ve biz bu insanları hayata geçiren şirketiz” diyen CEO Jeanine Wright, daha önce değişen podcast ortamında yeniden yapılanmak zorunda kalan podcasting şirketi Wondery’nin işletme müdürüydü.

Şirket, uzunluk ve karmaşıklığa bağlı olarak her bölümü 1 dolar veya daha az bir maliyetle üretebiliyor ve buna programatik reklam ekleyebiliyor. Bu genellikle, yaklaşık 20 kişi o bölümü dinlerse, şirketin genel giderleri hesaba katmadan o bölümden kar elde ettiği anlamına geliyor.

Inception Point AI, Quiet Please Podcast Network’ünde halihazırda 5.000’den fazla programa sahip ve haftada 3.000’den fazla bölüm üretiyor. Ağ, Eylül 2023’ten bu yana toplamda 10 milyon indirme sayısına ulaştı. Bir bölümün yaratılması, fikirden dünyaya sunulmasına kadar yaklaşık bir saat sürüyor.

Şirket, farklı seviyelerde podcast’ler üretiyor. En düşük seviye, çeşitli coğrafi bölgelerin hava durumu raporlarını veya basit biyografileri içeriyor, daha yüksek seviyelerde, gıda uzmanı Claire Delish, bahçıvan ve doğa uzmanı Nigel Thistledown ve sıra dışı sporları ele alan Oly Bennet dahil olmak üzere, şirketin yarattığı yaklaşık 50 AI kişiliğinden birinin sunduğu konu alanına özgü podcast’ler yer alıyor.

Peki, insan podcast’leriyle karşılaştırıldığında nasıl bir performans sergiliyor?

Wright, “Hala tüm AI tarafından üretilen içeriği AI çöpü olarak nitelendiren insanlar muhtemelen tembel teknoloji karşıtlarıdır. Çünkü piyasada gerçekten çok iyi içerikler var” diyor.

Şirket, kısa videolarla denemeler yapıyor ve yapay zeka kişilikleri için sosyal medya profilleri oluşturuyor. Amaç, bazılarını influencer’lara dönüştürmek. Wright, yakın gelecekte binlerce yeni kişilik yaratarak hangilerinin tutacağını görmek istiyor.

Ekip, teknolojinin ilerlemesiyle birlikte bu yapay zeka kişiliklerini yaratmanın etik boyutunu araştırıyor. Artık her sunucu, bölümlerin başında kendilerini yapay zeka olarak tanıtıyor ve şimdilik sunucuların kendi hikayelerini uydurmalarından kaçınıyorlar, ancak bu da değişebilir. Wright, sonunda sunucuların dinleyicilerle sohbet etmesini veya onlara “Happy Birthday” şarkısını söylemesini hayal edebileceğini söylüyor, ancak bu konuda çok fazla derinlemesine gitme konusunda temkinli davranıyorlar.

Şirketin kurucu ortağı ve CTO’su William Corbin, “Birinin derin bir ilişki kuracağı bir kişilik yaratmayacağım” dedi. Corbin, şirketin şu anda ciddi haberler yapmadığını, ancak Wright’ın gelecekte yapabileceklerini söylediğini ekledi.

Şirketin ardındaki fikir, Corbin’in pandemi sırasında günlük CDC raporlarını okuduğu popüler bir podcast’i tesadüfen geliştirmesinin ardından ortaya çıktı ve ardından hava durumu raporları ve A Moment of Silence (gerçek bir dakikalık sessizlik) dahil olmak üzere popüler olan diğer programlara da yayıldı. O zamanlar AI kullanmıyorlardı.

Şirket şu anda dördü içerikle çalışan sekiz kişilik bir ekipten oluşuyor. Podcast konuları, Google ve sosyal medya trendlerine dayalı olarak yapay zeka yardımıyla seçiliyor ve ardından ekip, en iyi performansı göstereni görmek için programın farklı başlıklara sahip beş farklı versiyonunu yayınlayabiliyor. Podcast’ler genellikle Balinalar gibi basit SEO arama terimlerinden sonra adlandırılıyor, böylece keşfedilebiliyorlar. Tutan programlar daha sonra çoğaltılabiliyor ve ölçeklendirilebiliyor.

Wright, “Belki sadece 50 kişinin dinlediği bir polen podcast’i yapabiliriz, ama ben zaten bu konuda birim karlılığına ulaştım, bu yüzden belki 500 polen raporu podcast’i yapabilirim” dedi.

Eski bir yaşam tarzı televizyon sunucusu ve ev eşyaları uzmanı olan Katie Brown’ın liderliğindeki içerik ekibi, her podcast’e bir başlık veriyor, podcast’in ana hatlarını oluşturuyor, içeriği AI ile dolduruyor ve sunucu olarak kişiliklerden birini atıyor. Diğer ekip üyeleri son kontrolü yapıyor ve müzik ve ses ekliyor. Programlar ayrıca periyodik olarak spot kontrolünden geçiyor.

Bölümler, OpenAI, Perplexity, Claude, Gemini ve daha fazlası dahil olmak üzere birkaç büyük dil modeliyle çalışan 184 özel AI ajanı veya otonom yazılım aracı tarafından desteklenen AI kullanılarak oluşturuluyor. AI sunucularının podcast sesleri ekip tarafından özelleştiriliyor ve tasarlanıyor.

Startup şu anda kendi imkanlarıyla çalışıyor ve çalışanlar henüz maaş almıyor, ancak şirket yakında dış finansman arayışına girecek.

Ekip, bu podcast’leri insan podcast sunucularının yerini alacak olarak görmüyor, bunları sektördeki başka bir tür olarak görüyor. Ayrıca, mevcut içerik üreticilerle işbirliği yaparak onların üretimlerini ölçeklendirmelerine yardımcı olma planları da var.

Kurucu ortak ve baş prodüksiyon sorumlusu Josh Taylor, “Bence onun yanında var oluyor ve insan ev sahiplerinin o kadar derine inmek istemeyebileceği alanlara girebiliyor” dedi.

Kaynak: The Hollywood Reporter

Okumaya devam et

Haberler

Radyo ve podcasting için yapay zeka destekli eksiksiz yayın araç seti: Zeno Plus

Zeno Media, radyo istasyonlarının ve podcast yayıncılarının içeriklerini benzeri görülmemiş bir kolaylıkla üretmelerine, dağıtmalarına ve paraya dönüştürmelerine yardımcı olmak için son teknoloji yapay zeka üzerine kurulu, hepsi bir arada bir yayın araç seti olan Zeno Plus’ı duyurdu. “Sesin geleceği için araçlar geliştiriyoruz” sloganıyla yola çıkan platform, otomasyon, dağıtım ve analitiği bir araya getirerek yayıncıların en önemli şeye, yani harika içerikler oluşturmaya odaklanmalarını sağlıyor.

Yayınlanma tarihi

=>

Zeno Media, radyo istasyonlarının ve podcast yayıncılarının içeriklerini benzeri görülmemiş bir kolaylıkla üretmelerine, dağıtmalarına ve paraya dönüştürmelerine yardımcı olmak için son teknoloji yapay zeka üzerine kurulu, hepsi bir arada bir yayın araç seti olan Zeno Plus’ı duyurdu. “Sesin geleceği için araçlar geliştiriyoruz” sloganıyla yola çıkan platform, otomasyon, dağıtım ve analitiği bir araya getirerek yayıncıların en önemli şeye, yani harika içerikler oluşturmaya odaklanmalarını sağlıyor.

Eski yayıncılar ve sadık izleyici kitlesine sahip istasyonlar için tasarlanan bu hizmet, dijital dönüşüme sorunsuz bir geçiş sağlıyor. 8.000’den fazla kayıtlı program işlendi, tarandı, etiketlendi ve dizine eklendi; bu da içerik kütüphanelerini modernize etme ve istasyonları geleceğe hazırlama becerisini destekliyor.

Sunulan hizmetin merkezinde, radyo yayınlarını kaydeden, reklamları kaldıran, programatik reklam işaretleri ekleyen, metinler oluşturan ve SEO dostu başlıklar oluşturan yapay zeka destekli bir post prodüksiyon sistemi olan Podcast Bot yer alıyor. Ayrıca röportajları kısaltabilir, giriş ve çıkış bölümleri ekleyebilir ve dakikalar içinde telif hakkıyla korunan, paraya çevrilebilir podcast’e hazır bölümler sunabiliyor.

Paket ayrıca, saniyeler içinde profesyonel düzeyde hava durumu, haber, spor, burç ve daha fazlasını üretebilen Yapay Zeka Yayın Yeteneği özelliğini de sunuyor. Her zaman kullanılabilir ve özelleştirilebilir olan bu araç, yayıncılara tutarlı ve ilgi çekici programlar sunarken zamandan tasarruf sağlayan 7/24 içerik sağlıyor.

Dağıtım da aynı şekilde kolaylaştırıldı. Yayıncılar, Android ve iOS uygulamaları, Apple CarPlay, Alexa özellikleri, Roku kanalları, YouTube yayıncılığı ve özel web oynatıcılarıyla erişim alanlarını genişletebilir ve içeriklerin, izleyicilerin dinlemeyi tercih ettiği her yerden erişilebilir olmasını sağlayabiliyor.

Otomasyon ve dağıtımın yanı sıra platform, yayıncılar için özel olarak tasarlanmış web geliştirme, canlı oynatıcılar, podcast entegrasyonu, program arşivleri ve para kazanma araçlarıyla birlikte geliyor. Gelişmiş yapay zeka destekli analizler, dinleyici davranışı, içerik performansı ve hedef kitle segmentasyonu hakkında gerçek zamanlı bilgiler sağlayarak, verileri etkileşim ve gelir artışı için eyleme geçirilebilir stratejilere dönüştürüyor.

Zeno Media CEO’su Morris Berger, “Zeno Plus, yayıncılara dijital çağda sadece hayatta kalmaları için değil, aynı zamanda başarılı olmaları için de araçlar sunuyor. Misyonumuz her zaman dünya çapındaki yayıncıları ve toplulukları birbirine bağlamak oldu. Zeno Plus ile, dünya çapındaki sunucular, yapımcılar ve program yönetmenleri için daha kolay ön ve son prodüksiyon sağlayan araçlar geliştiriyor ve harika içerikler oluşturmayı, dağıtmayı ve paraya çevirmeyi her zamankinden daha kolay hale getiriyoruz” dedi.

Zeno Media Ürün Yöneticisi Chaim Gross, “Zeno Plus, yayıncıların gerçekte neye ihtiyaç duyduklarını dikkatle dinleyerek geliştirildi. İstasyonlar, kendilerini benzersiz kılan özlerini kaybetmeden modernleşme baskısı altında. Platformumuz, yapay zeka destekli araçları sorunsuz dağıtım ve para kazanma ile birleştirerek bu sorunu çözüyor, böylece yayıncılar arka planda daha az zaman harcayıp kitlelerine hizmet etmeye daha fazla zaman ayırabiliyor” dedi.

Erişim, her ölçekten istasyonun ihtiyaçlarını karşılamak üzere tasarlanmış, yapay zeka araçları, podcast otomasyonu, özel uygulamalar, kilitli RSS akışları, web geliştirme ve gelişmiş analizler içeren esnek paketler içeren aylık abonelik modeliyle sağlanıyor.

Daha fazla bilgi almak için: www.zenoplus.co

Kaynak: PodNews

Okumaya devam et

En son