Bizimle iletişime geçin

Haberler

Elevenlabs nedir ve Elevenlabs nasıl kullanılır?

Elevenlabs, yüksek kaliteli, insan benzeri sesi kolaylıkla oluşturmak için araçlar sunan, yapay zeka destekli ses teknolojisi için önde gelen platformlardan biri. Bu yazıda, metinden konuşmaya ve ses klonlamadan ses efektlerine ve yapay zeka konuşmaya kadar, sürükleyici ses deneyimleri oluşturmayı herkes için basit ve erişilebilir hale getirmek için tasarlanan ElevenLabs’in tam olarak ne olduğunu, kimler için olduğunu ve onu nasıl kullanmaya başlayabileceğinizi öğreneceksiniz.

Yayınlanma tarihi

on

Yapay zeka destekli çözümler ortaya çıkmadan önceki eski ekran okuyucularını hatırlıyor musunuz? Genellikle robotik, monoton ve açıkçası dinlemesi biraz sıkıcı geliyordu.

Görme engelliler için araçlar tasarlıyor, sürükleyici sesli kitaplar oluşturuyor veya web sitenize, uygulamanıza veya video oyununuza ses ekliyor olun, ElevenLabs bir daha hiç kimsenin robot sesleriyle yetinmek zorunda kalmamasını sağlıyor.

Bu yazıda, ElevenLabs’in tam olarak ne olduğunu, kimler için olduğunu ve bugün onu nasıl kullanmaya başlayabileceğinizi inceleyeceğiz:

ElevenLabs nedir?

Elevenlabs, yüksek kaliteli, insan benzeri sesi kolaylıkla oluşturmak için araçlar sunan, AI destekli ses teknolojisi için önde gelen platformlardan biridir. Metinden konuşmaya ve ses klonlamadan ses efektlerine ve konuşma AI’ya kadar, sürükleyici ses deneyimleri oluşturmayı herkes için basit ve erişilebilir hale getirmek için tasarlanmıştır.

30’dan fazla dil ve binlerce ses desteğiyle , sesli kitaplardan ve oyunlardan müşteri hizmetlerine ve kişiselleştirilmiş öğrenmeye kadar çok çeşitli uygulamalara hitap eder. ElevenLabs, herkesin sesin gücüyle hikayeler anlatmasını, fikir paylaşmasını ve kitlelerle etkileşim kurmasını sağlar.

ElevenLabs kimler içindir?

ElevenLabs, son teknoloji AI ses teknolojisinden yararlanmak isteyen herkes için güçlü bir araçtır. İster ilgi çekici içerikler oluşturun, ister erişilebilirliği iyileştirin veya iş akışlarını geliştirin, ElevenLabs ihtiyaçlarınıza göre uyarlanmış doğal, gerçekçi sesler sunar. İşte ElevenLabs’ı kullanarak fayda sağlayabilecek birkaç insan türü, ancak olanakları bunların çok ötesine geçiyor!

  • Erişilebilirlik Savunucuları: Görme engelli veya ana dili olmayan kullanıcılar için doğal sesli metinden konuşmaya ve dublaj çözümlerine sahip araçlar ve kaynaklar geliştirmek.
  • İçerik Oluşturucular: Zahmetsizce ilgi çekici içerikler oluşturun! ElevenLabs, ihtiyaçlarınıza uygun çok çeşitli sesler, aksanlar ve konuşma stilleri sunarak çalışmalarınıza kişilik ve özgünlük katmanızı kolaylaştırır.
  • Müşteri Destek Ekipleri: Telefon sistemleri, sohbet robotları ve SSS için gerçekçi seslerle müşteri etkileşimlerini otomatikleştirin ve insan dokunuşundan ödün vermeden mükemmel hizmet sunun.
  • Oyun Stüdyoları: Karakterlerinizi hayata geçirin! Elevenlabs, oyununuzdaki her karakter için benzersiz sesler tasarlayarak sürükleyici oyun deneyimleri yaratmanıza olanak tanır.
  • Bağımsız Yazarlar: Kitaplarınızı, karakterlerinizin kişiliklerine ve tarzlarına uyan sürükleyici sesli kitaplara dönüştürün, hikayenizi canlandırın.
  • Sesli içeriği tercih eden kişiler: ElevenReader uygulamasıyla yazılı makaleleri zahmetsizce sese dönüştürün. İster işe gidip geliyor olun, ister egzersiz yapıyor olun veya sadece çoklu görev yapıyor olun, en sevdiğiniz içeriğin keyfini eller serbest çıkarın!
  • Medya Şirketleri: Doğal ve profesyonel ses veren AI tarafından oluşturulan seslerle üretim iş akışınızı kolaylaştırın. ElevenLabs, dublaj, anlatım ve hatta çok dilli projeler için mükemmeldir.

ElevenLabs’a Nasıl Başlanır?

ElevenLabs’ı kullanmaya başlamak için şu adımları izleyin:

  1. Hesap oluşturun: ElevenLabs web sitesini ziyaret edin ve e-posta adresinizi kullanarak kaydolun.
  2. Gösterge panelini keşfedin: Giriş yaptıktan sonra, Metinden Konuşmaya, Ses Klonlama ve Ses Efektleri gibi çeşitli özelliklere erişebileceğiniz gösterge panelini inceleyin.
  3. Gerçekçi konuşma üretin: Metinden Konuşmaya bölümüne gidin. İstediğiniz metni girin. Mevcut seçeneklerden bir ses seçin. Sesi üretmek için “Oluştur”a tıklayın.
  4. Bu kılavuzda ele aldığımız gelişmiş özellikleri keşfedin.

ElevenLabs’ı Benzersiz Kılan Nedir: Dört Özellik

Özellik 1: Gerçekçi Konuşma (Realistic Speech)

ElevenLabs, doğal insan konuşmasını taklit eden ultra gerçekçi ses sunarak geleneksel metinden sese sistemlerinin çok ötesine geçer. Yapay zeka destekli motoru yalnızca metni okumakla kalmaz, aynı zamanda bağlamı analiz ederek tonun, duygunun ve vurgunun okuduğu şeyle mükemmel bir şekilde eşleşmesini sağlar. Bir hikayedeki gerilimli bir satır gergin duyulurken, neşeli bir duyuru neşeli ve canlı duyulur.

Özellik 2: Kapsamlı Ses Kütüphanesi (Extensive Voice Library)

ElevenLabs, seslendirme sanatçıları ve yaratıcılarından oluşan gelişen bir topluluk sayesinde binlerce benzersiz sesin yer aldığı etkileyici bir ses kütüphanesi oluşturdu . 32 dilde sesler ve geniş bir aksan yelpazesiyle, küresel topluluğunun gerçek bir yansımasıdır.

Ses Kütüphanesini Özel Kılan Nedir?

Ses kütüphanesi, müşteri hizmetleri için sıcak, sohbet havasında bir ton, anlatım için etkili bir ses veya bir video oyunu karakteri için benzersiz bir şey arıyor olun, geniş bir yelpazedeki ihtiyaçlara göre uyarlanmış sesler sunar. Kütüphanedeki sesler, doğal, net ve ilgi çekici sesler çıkarmak için dikkatlice hazırlanmıştır ve bu da onları profesyonel projelerden yaratıcı hikaye anlatımına kadar her şey için ideal hale getirir.

Mükemmel Sesinizi Bulun

Keşfi kolaylaştırmak için ses kütüphanesi güçlü arama, filtreler ve sıralama seçenekleri içerir:

  • İsme veya anahtar sözcüğe göre arama yapın: Belirli bir sesi hızla bulun veya bir ses dosyası yükleyerek benzer seçenekleri bulun
  • Özelliklere göre filtrele: Sesleri dile, aksana, cinsiyete, yaşa veya kullanım durumuna göre daraltın
  • Popülerliğe veya kaliteye göre sırala: Trend olan seslere, en çok kullanılan seçeneklere veya yüksek kaliteli önerilere göz atın

Özellik 3: Ses Kopyalama (Voice Cloning) – (Yalnızca Ücretli Planlar)

ElevenLab’in son teknoloji ses klonlama teknolojisi, benzersiz bir hassasiyetle herhangi bir sesin inanılmaz derecede gerçekçi kopyalarını oluşturmanıza olanak tanır. İster benzersiz bir sesi korumak, ister kişiselleştirilmiş içerik oluşturmak veya markanız için tutarlı bir ton sürdürmek isteyin, bu özellik sonsuz yaratıcı potansiyelin kilidini açar.

Ses klonlama projelerinize benzersiz bir hava katabilir; bir video oyunu için bir karakterin sesini kopyalayabilir, sevdiğiniz birinin sesini bir sesli kitaba dönüştürebilir veya liderlik ekibinizin sesleriyle özel seslendirmeler yaratabilirsiniz.

Ses Klonlama Seçenekleri

ElevenLabs, ses klonlama için iki güçlü seçenek sunuyor: Anında Ses Klonlama ve Profesyonel Ses Klonlama.

Adından da anlaşılacağı gibi, tüm ücretli planlara dahil olan Instant Voice Cloning, hobi projeleri için mükemmel olan hızlı ve kolay bir ses klonu oluşturma yoludur. Daha düşük kalite sunmasına rağmen, erişilebilirdir ve minimum kurulumla kullanıma hazırdır.

En yüksek kaliteyi arayanlar için, Profesyonel Ses Klonlama, orijinal sesin her nüansını ve ayrıntısını yakalayarak olağanüstü sonuçlar sunar. Bu seçenek daha fazla ses girişi ve ek eğitim süresi gerektirir, ancak sonuç inanılmaz derecede gerçekçi ve cilalı gelen bir ses klonudur. Profesyonel Ses Klonlama, Creator Plans’dan itibaren mevcuttur.

Özellik 4: Ses Tasarımı (Voice Design)

ElevenLabs’daki Ses Tasarımı, yaratıcıların metin istemlerinden benzersiz sesler oluşturmasını sağlayarak, Ses Kütüphanesi’nde tam olarak aynı ses bulunmadığında boşlukları doldurmayı mümkün kılar. Profesyonel Ses Klonları platformun en yüksek kaliteli seçeneği olmaya devam ederken, Ses Tasarımı projenizin ihtiyaçlarına göre uyarlanmış sesler oluşturmak için deneysel ancak güçlü bir yol sağlar.

Ses Tasarımı Türleri
  • Gerçekçi Sesler: Yaş, aksan, cinsiyet, ton ve duygu gibi belirli niteliklere sahip sesler yaratın. Örneğin, “Sıcak, derin bir sese sahip orta yaşlı bir Avustralyalı erkek. Sakin ve profesyonel.”
  • Karakter Sesleri: “Huysuz yaşlı bir korsan bağırıyor” veya “neşeli, gıcırdayan bir fare” gibi basit komutlarla yaratıcı karakterleri hayata geçirin.
Etkili Ses Tasarımı İçin Hızlı İpuçları
  • Gerçekçi sesler için olabildiğince ayrıntılı olun. En iyi sonuçlar için yaş, milliyet, ton ve duygu gibi nitelikleri ekleyin.
  • Karakter istemlerini eğlenceli ve basit tutun. Karakterin bir hikayede veya oyunda nasıl duyulacağını düşünün.
  • Sonuçlarınızı iyileştirmek ve projeniz için mükemmel sesi bulmak amacıyla farklı komutları deneyin.

ElevenLabs ile Neler Yapabilirsiniz?

1. Metinden Konuşmaya (Text to Speech)

Nasıl Çalışır?

ElevenLabs’ın Metinden Konuşmaya özelliğini kullanmak basittir:

  1. Metninizi girin: Metninizi giriş kutusuna yazın veya yapıştırın.
  2. Bir ses seçin: Projenizin ihtiyaçlarına uygun olan sesi koleksiyonunuzdan veya ses kitaplığınızdan seçin.
  3. İsteğe bağlı ayarlamalar: İstenilen ton ve stile uyması için kararlılık veya benzerlik gibi ayarları bulun ve ayarlayın.
  4. Oluştur: Sesinizi oluşturmak için “Oluştur”a tıklayın.

Sonuç? Gerçek bir seslendirme sanatçısı tarafından seslendirilmiş gibi duyulan yüksek kaliteli ses.

Sesinizi Ayarlama

Stabilite ve benzerlik kaydırıcıları gibi isteğe bağlı ayarlarla konuşmanın ne kadar tutarlı veya çeşitli duyulacağını ayarlayabilirsiniz. Örneğin:

  • İstikrar: Düşük ayarlar daha fazla duygusal çeşitlilik yaratırken, yüksek ayarlar ciddi tonlar için istikrarı garantiler.
  • Benzerlik: Çıktının orijinal sese ne kadar yakın olduğunu ayarlayarak yaratıcı çabalar için esneklik sağlar.

Başarı İçin İpuçları

  • Yüksek kaliteli metin kullanın: Doğru dil bilgisi ve noktalama, sunumu ve anlaşılırlığı artırabilir.
  • Sesi içeriğe uydurun: Projenizin duygusu, dili ve tonuyla uyumlu bir ses seçin.
  • Ayarlarla denemeler yapın: Mükemmel performansa ulaşmada küçük değişiklikler büyük fark yaratabilir.

2. Ses Değiştirici (Voice Changer)

ElevenLabs’ Voice Changer, ses dönüşümünü bir üst seviyeye taşıyarak orijinal tonu, duyguyu ve sunumu korurken bir sesi diğerine dönüştürmenize olanak tanır. İster bir performansı geliştiriyor, ister telaffuzu düzeltiyor veya tamamen yeni bir ses yaratıyor olun, bu araç doğal ve ifade dolu hissettiren kusursuz bir dönüşüm sağlar.

Ses Değiştiriciyi Farklı Kılan Nedir?

Voice Changer, sese hayat veren konuşmanın ince, insani unsurlarını korumada mükemmeldir. Başlıca özellikleri şunlardır:

  • Duygu Tutma: İç çekmeleri, gülmeleri, fısıltıları ve hatta ağlamaları gerçekçi bir doğrulukla taklit eder.
  • Ritmin Korunması: Orijinal sesin doğal ritmini ve akışını korur.
  • Aksan ve Dil Bütünlüğü: Yeni bir sese geçildiğinde bile aksanları ve dilleri bozulmadan korur.

Bu, Voice Changer’ı dublaj, karakter yaratma veya seslendirmeleri iyileştirme gibi otantik ve duygusal ses gerektiren projeler için paha biçilmez bir araç haline getirir.

Nasıl Çalışır?
  1. Ses Yükleyin veya Kaydedin: Mevcut bir dosyayı kullanın veya mikrofonunuz aracılığıyla canlı kayıt yapın.
  2. Sesinizi seçin: Vizyonunuza uyan koleksiyonunuzdan bir ses seçin
  3. Dönüşümü oluşturun: Sesi işleyip sonuçları deneyimlemek için “Oluştur”a tıklayın.
Daha İyi Bir Dönüşüm İçin İpuçları
  • Kendinizi ifade edin: Kayıtlarınızda olabildiğince ifade edici olun. Araç bu duyguları güzel bir şekilde yansıtacaktır.
  • Arka plan gürültüsüne dikkat edin: Girişinizi temizleyip daha akıcı bir çıktı elde etmek için Arka Plan Gürültüsünü Kaldır seçeneğini açın.
  • Aksanı Eşleştirin: En iyi sonuçlar için, giriş vurgusunun çıkış sesinizin tonuyla uyumlu olduğundan emin olun. Örneğin, Portekizce aksanlı bir ses klibi, dönüştürülen seste bu vurguyu koruyacaktır.

3. Ses Efektleri (Sound Effects)

ElevenLabs’ın Ses Efektleri özelliği, yaratıcıların basit metin açıklamalarından yüksek kaliteli, gerçekçi ses efektleri üretmesini sağlar. İster bir film, ister oyun veya video içeriği üzerinde çalışıyor olun, bu araç ses projelerine derinlik ve gerçekçilik katmanın kolay ve yaratıcı bir yolunu sunar.

ElevenLab’in Ses Efektlerini Öne Çıkaran Nedir?

ElevenLabs’ın ses efektleri dinamik ve özelleştirilmiştir. Araç, aşağıdakiler de dahil olmak üzere çok çeşitli kullanım durumlarını destekler:

  • Sinematik Tasarım: Filmler ve fragmanlar için etkili sesler yaratın
  • Oyun Deneyimi: Oyunlar ve etkileşimli medya için özel efektler tasarlayın
  • Foley ve Ambiyans: Video içeriği için arka plan sesleri üretin

Model hem doğal dili hem de sese özgü terminolojiyi anlıyor ve size ince çevresel efektlerden dramatik ses manzaralarına kadar her şeyi yaratma esnekliği sağlıyor.

Nasıl Çalışır?
  1. Sesi Tanımlayın: “Beton üzerinde cam kırılması” veya “çakıl üzerinde ayak sesleri” gibi net ve öz bir tanım girin.
  2. Ayarları Düzenle:
    • Süre: Ses için belirli bir uzunluk seçin (30 saniyeye kadar) veya aracın en iyi süreyi otomatik olarak belirlemesine izin verin.
    • İstem Etkisi: Çıktının açıklamanıza ne kadar yakın olduğuna karar verin. Daha yüksek bir ayar kesinlik sağlarken, daha düşük bir ayar yaratıcı çeşitliliği getirir.
  3. Oluştur ve İncele: Dört farklı ses varyasyonu üretmek için “Oluştur”a tıklayın. Favorinizi seçin veya istemi daraltın ve tekrar deneyin.
Keşfedin ve Deneyin

Keşfet sekmesi, projelerinize ilham veren topluluk tarafından oluşturulan ses efektlerine göz atmanızı sağlar. Çevresel ambiyanslardan dramatik hitlere kadar, bu araçla mümkün olan her şeyi görebilirsiniz.

Harika Ses Efektleri Yaratmak İçin İpuçları
  • Net ve Belirli Olun : “Ağır tahta kapı gıcırdayarak açılıyor” gibi basit açıklamalar temel efektler için işe yarar.
  • Karmaşık Fikirleri Birleştirin : Katmanlı sesler için tanımlayıcı diziler kullanın, örneğin “ağaçların arasında ıslık çalan rüzgar, ardından yaprakların hışırtısı”.
  • Ses Terimlerini Dahil Edin : Sesin tarzını ve hissini yönlendirmek için “etki”, “döngü” ve “tek vuruş” gibi terimler kullanın.

4. Konuşma AI (Conversational AI)

ElevenLabs’ın Konuşma AI platformu, çok çeşitli uygulamalar için insan benzeri ses ajanlarını dağıtmayı her zamankinden daha kolay hale getiriyor. Gelişmiş konuşmadan metne, metinden konuşmaya ve dil modellemesini bir araya getiren bu platform, aylarca süren geliştirme ihtiyacını ortadan kaldırarak işletmelerin ve yaratıcıların konuşma ajanlarını hızlı ve etkili bir şekilde oluşturmasını sağlıyor.

Konuşmaya Dayalı Yapay Zeka’yı Farklı Kılan Nedir?

ElevenLabs, kusursuz ve gerçekçi sohbetler için tüm temel yapı taşlarını bir araya getiriyor:

  • Konuşmadan Metne (STT) : Konuşulan diyaloğu doğru bir şekilde yakalayan ince ayarlı transkripsiyon
  • Dil Modelleri : Gemini, Claude, OpenAI arasından seçim yapın veya özel amaçlarınız için kendi özel dil modelinizi entegre edin.
  • Metinden Konuşmaya (TTS) : 31’den fazla dilde ve 5.000’den fazla sesle düşük gecikmeli, insan benzeri konuşma
  • Sıra Alma : Doğal konuşma akışı için özel algılama, kesintilere ve sorunsuz ileri geri alışverişlere izin verir

Bu bileşenler bir araya gelerek, dinamik aracı özelleştirme, izleme ve bilgi tabanı entegrasyonu araçlarıyla günlük binlerce etkileşimi destekleyen güçlü ve ölçeklenebilir bir çözüm oluşturur.

Konuşmalı Yapay Zekanın Uygulamaları

ElevenLabs’ın Konuşmaya Dayalı Yapay Zekası çok yönlüdür ve çeşitli sektörlerde kullanılabilir:

  • Müşteri Hizmetleri : Müşteri sorularını çözmek, sorunları gidermek ve 7/24 çok dilli destek sağlamak için şirket dokümantasyonu konusunda eğitim almış sesli müşteri temsilcileri.
  • Sanal Asistanlar : Planlama, hatırlatmalar ve düzenli kalma konusunda yardımcı olan aracılar
  • Oyun : Oyunculara dinamik olarak yanıt verebilen akıllı NPC’ler yaratın
  • Eğitim : Öğrencilerin konuları açıklayarak, soruları yanıtlayarak ve kitap ve makaleleri tartışarak etkileşim kurmalarını sağlayan kişiselleştirilmiş öğrenme deneyimleri sağlayın

ElevenLabs Fiyatlandırması

ElevenLabs, ihtiyaçlarınıza göre ölçeklenebilecek şekilde tasarlanmış, hem bireyler hem de işletmeler için esnek fiyatlandırma sunar. AI tarafından üretilen sesle deney yapan hobicilerden binlerce sesli etkileşimi yöneten işletmelere kadar herkes için bir plan vardır.

Bireylere Yönelik Planlar

Ücretsiz Plan

ElevenLabs’ın AI ses araçlarını denemek için mükemmel. Ücretsiz plan şunları içerir:

  • Metinden sese : Ayda 10 dakika
  • Dillere ve seslere erişim : 32 dil ve binlerce benzersiz ses
  • Özellikler : ses efektleri oluşturma ve sentetik ses oluşturma
Başlangıç ​​Planı (aylık 5$)

Yapay zeka sesine yeni başlayan amatörler için bu plan, ücretsiz plandaki her şeye ek olarak şunları içerir:

  • Metinden sese : Ayda 30 dakika
  • Ses Klonlama : Anında Ses Klonlama
  • Dublaj Stüdyosuna Erişim :
  • Ticari lisans :
Yaratıcı Planı (11$/ay)

Premium içerik üretmek isteyen yaratıcılar için en popüler seçim. Başlangıçtaki her şeyi ve ayrıca şunları içerir:

  • Metinden sese : Ayda 100 dakika
  • Ses Klonlama : Anında ve Profesyonel Ses Klonlama
  • Ses Yerel Entegrasyonu : web sitelerine ve bloglara anlatım eklemek için
  • Ses kalitesi : Daha yüksek kaliteli ses (192 kbps)
Pro Planı (99$/ay)

Üretimi hızlandıran ciddi yaratıcılar için. Bu plan, yaratıcıdaki her şeyi artı şunları sunar:

  • Metinden sese : Ayda 500 dakika
  • Kullanım analitiği : gösterge paneli
  • Ses çıkışı : API üzerinden 44.1 kHz PCM ses çıkışı

İşletmeler İçin Planlar

Ölçek Planı (330$/ay)

Yeni başlayanlar ve yayıncılar için ideal olan bu plan, Pro’daki her şeyi artı şunları sunar:

  • Metinden sese : Ayda 2000 dakika
  • Ek krediler için esnek kullanım tabanlı faturalandırma
İş Planı (1320$/ay)

Hızla ölçeklenen operasyonlar için oluşturulan bu plan, Ölçeklendirme’deki her şeyi ve ayrıca şunları içerir:

  • Metinden sese : Ayda 11.000 dakika ultra yüksek kaliteli TTS veya 22.000 dakika Flash/Turbo TTS
  • Profesyonel Ses Klonları : 3’e kadar mevcut
  • Özel Fiyatlandırma
İş Dünyasına Dair Her Şey, Artı:
  • Her şeye API erişimi
  • Özel şartlar ve güvence
  • Öncelikli destek
  • Ölçekte önemli ölçüde indirimli fiyatlandırma

Sonuç

ElevenLabs, içerik oluşturucuların, eğitimcilerin, geliştiricilerin ve işletmelerin insan benzeri sesler üretmesini kolaylaştırarak ses teknolojisinde devrim yaratıyor. Yapay zeka destekli konuşma sentezi, ses klonlama ve ses efektleriyle, her zamankinden daha doğal gelen ilgi çekici ve duygusal ses içeriklerinin oluşturulmasını sağlıyor.

Kaynak: Kevin Law / Learn Prompting

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Pocket FM’den, anlatıları dönüştürme ve merak uyandıran hikayeler yazma aracı

Hindistan merkezli sesli dizi platformu üreticisi Pocket FM, sesli dizilerin Netflix’i olmayı hedefliyor. Yani şirket, yüzlerce bölümlük sesli dizilerini kullanıcılarının zevkine uygun hale getirmeyi amaçlıyor. Bunun için içerikleri hızla yayınlaması gerekiyor ve bu konuda yapay zekaya yöneliyor.

Yayınlanma tarihi

=>

Hindistan merkezli sesli dizi platformu üreticisi Pocket FM, sesli dizilerin Netflix’i olmayı hedefliyor. Yani şirket, yüzlerce bölümlük sesli dizilerini kullanıcılarının zevkine uygun hale getirmeyi amaçlıyor. Bunun için içerikleri hızla yayınlaması gerekiyor ve bu konuda yapay zekaya yöneliyor.

Lightspeed destekli girişim, yazarlarına bir bölüme daha iyi sonlar önermek veya anlatıyı daha ilgi çekici hale getirmek gibi şeyler yapabilen bir yapay zeka araç seti sunuyor. Bu araçların hikaye yazım sürecini hızlandırması bekleniyor.

Pocket FM, ses dizileri için ses üretmek amacıyla ElevenLabs gibi bazı yapay zeka araçlarını kullanıyor. Ayrıca, şirket içinde yazım ve uyarlama yardımı için yapay zeka araçlarını test etti.

Pocket FM’in kurucusu Rohan Nayak, yapay zeka araçlarının tüm yazarlara sunulacağını, böylece yazarların bölümlerini bitirmelerinin daha az zaman alacağını söyledi.

CoPilot adı verilen yazma aracı, herhangi bir yazarın hikaye oluşturmasına yardımcı olmak için kullanılabilir.

CoPilot, belirli bir bölüm için anlatı tabanlı yazıyı diyalog tabanlı yazıya dönüştürebilir. Ayrıca, belirli bir türdeki sesli diziler için yazıyı daha ilgi çekici hale getirmek üzere şekillendirmek için “vuruş analizi” de yapabilir. Araç ayrıca, “kısaltma”, “genişletme” ve bir komut aracılığıyla metin oluşturma gibi temel sohbet robotu tarzı yazım özelliklerine de sahip.

Şirket, CoPilot’u geliştirmek için kullanıcıların belirli bir türdeki belirli bir hikaye ile daha fazla etkileşim kurmasını sağlayan şeyin ne olduğunu anlamak amacıyla binlerce saatlik veri noktasını inceledi.

Buna dayanarak, karakterler arasındaki çatışmayı artırmak ve bölümü daha heyecanlı hale getirmek için sonlar önermek üzere tasarlanmış yazı önerisi özellikleri ekledi. Yapay zeka ayrıca, ses üretilirken kullanılabilecek arka plan efektleri için etiketler de önerebiliyor.

Araç, karakterlerin biyografilerini, ilişkilerini otomatik olarak oluşturabilir ve farklı bölümlerin olay örgüsü noktalarını özetleyebilir; böylece yaratıcıların yazarken bu ayrıntılara tekrar başvurmalarına olanak tanıyor.

CoPilot’un ayrıca bir bölüm hakkında yorum yaparak olay örgüsünü, dilbilgisini kontrol eden ve nitel geri bildirimler bırakan bir inceleme aracı da bulunuyor.

Pocket FM, perde arkasında, karakter gelişimleri ve ilişkileri için bir hikâyenin bağlamını ve anlatı tutarlılığını korumak üzere daha küçük modelleri eğitiyor. Ayrıca, kullanıcılardan gelen sinyalleri kullanan girişim, yapay zekayı hikâyeye daha fazla dram katması için teşvik ediyor.

Uluslararası genişleme ve yerelleştirme planları

Yapay zeka araçlarının gelişiyle birlikte Pocket FM, metni bir dilden diğerine çevirmenin yanı sıra, o bölgenin kültürüne daha uygun şekilde isimleri ve ifadeleri değiştiren çeşitli pazarlara yönelik uyarlama araçları da piyasaya sürdü.

Şirket, geçen yıl Avrupa ülkesinde kullanıcılarla etkileşim kurmakta zorlandığı yönündeki haberlerin ardından, bu aracı ilk olarak bu yılın başlarında Almanya’da CoPilot paketinin bir parçası olarak diğer bölgelerdeki hikayeleri dönüştürmek için kullanıma sundu.

Nayak, şirketin bu denemeden harika sonuçlar aldığını, Haziran ayında aylık uygulama içi gelirinin 700.000 doları aştığını söyledi.

Nayak, “Yeni bölgelere açılmaya başladığımızda, o pazarda anlamlı bir şekilde var olmamız 12-18 ayı buluyordu. Kullanıcı edinmeye ve pazarı büyütmeye başlamak için en az 1.000 saatlik içeriğe sahip olmanız gerekiyor. Şimdi bunu üç aydan kısa sürede yapabiliyoruz” dedi.

Araç, Alman pazarındaki program çıktıları açısından yazar verimliliğini %50’ye kadar artırdı. Ayrıca, şirketin programların daha hatasız taslaklarını oluşturmasına yardımcı olarak sesli diziler için daha yüksek kullanıcı sadakati sağladı.

ABD’de, bu yeni yapay zeka araçlarının yardımıyla oluşturulan diziler artık izlenme süresinin %10’unu oluşturuyor. Ayrıca, bu diziler son 12 ayda 7 milyon dolar gelir elde ederken, yapım maliyetlerini 2-3 kat azalttı.

İçerik üretimini ölçeklendirmek için teknoloji oluşturma

Pocket FM, şirket içinde farklı yapay zeka özelliklerini benimsemesi sayesinde içeriği hızla ölçeklendirebildi. Girişim, ayda yaklaşık 1.000 pilot yayın başlattığını belirtti. Üstelik, yalnızca içerik hacmi bile birkaçının hit olmasını sağlıyor.

Ancak sesli gösteri sadece bir bölüm. Şirket, Pocket Toons platformuyla hikâyeleri çizgi romanlara dönüştürecek araçlar üzerinde çalışıyor . Ayrıca Nayak, videonun da şirketin araştırabileceği olası bir format olduğunu söyledi. Turlar boyunca 196 milyon doların üzerinde fon toplayan girişim , bir mikro drama uygulaması üzerinde de denemeler yapıyor.

Pocket FM, gelecek yıl programlarından toplanan verilere dayanan ve yazım yardımı, uyarlama, dramatizasyon ve hikaye bağlamını koruma gibi farklı araçları içeren kendi tekil büyük dil modelini (LLM) yayınlamayı planlıyor. Şirketin kurucu ortağı Prateek Dixit, kendi LLM programına geçtiğinde, ayrı özellikler için çok sayıda küçük model eğitmesine gerek kalmayacağını söyledi.

Yapay zekanın potansiyel dezavantajları

Yapay zekayı benimsemenin yan etkileri oldu.

Pocket FM, son 12 ayda birden fazla dönemde çalışan veya taşeron olarak çalışan kişileri işten çıkardı. Ayrıca, yazarların zaman içinde getirilerinin azaldığına dair raporlar da var. Şirket, istihdam ve ücret sorunları nedeniyle Kaliforniya’da davalarla karşı karşıya.

Bir şirket temsilcisi, bu işten çıkarmalara yanıt olarak, “İçerik odaklı çoğu sektörde olduğu gibi, proje bazında çeşitli yazar, seslendirme sanatçısı ve prodüksiyon ortaklarıyla çalışıyoruz ve kaynakları her pazara göre uyarlıyoruz. Yapay zekanın temel yaratıcı topluluğumuz üzerinde çok az etkisi oldu; bunun yerine, erişimi ve çıktıyı genişletmek için yeni yollar açtı,” dedi.

Kalite konusunda da sorular var. Şirket, kaliteyi bir gösterinin izlenme oranlarına göre ölçüyor.

Temel argüman, yeni yapay zeka araçlarının tek başına içerik üretenler için bile bir yazar odası gibi davrandığı ve böylece daha hızlı bir şekilde daha fazla içerik üretebilecekleri yönünde. Ayrıca, rakamlara bakıldığında, yazarlar yapay zekanın yardımıyla hikayeyi hızla düzenleyebilirler. Ancak bu araçlar, platforma “yapay zeka kaynaklı içerik” (yani düşük kaliteli, yapay zeka tarafından oluşturulmuş içerik) ekleyebilir ve kullanıcıların önerilerini etkileyerek iyi hikayeler keşfetmelerini zorlaştırabilir.

Pocket FM, yapay zekanın yardımıyla sağlam bir yapıya sahip hikayelerin popülerlik kazanacağını savunuyor.

Şirket, her içeriğin kalite ve özgünlük sağlamak için yapay zeka destekli moderasyon sistemi tarafından incelendiğini belirtti. Ayrıca, yapay zeka moderasyon sisteminin, sesin yayınlanmasını onaylamadan önce tekrar, telif hakkı sorunları, içerik sağlığı ve diğer kalite ölçütleri gibi unsurları kontrol ettiğini iddia ediyor. Her program eşit şekilde destekleniyor ve kullanıcı etkileşimi, bir programın sıralamasını belirliyor.

Bir diğer endişe ise yazarların zamanla yapay zekaya aşırı bağımlı hale gelebilmesi.

Almanya’da, yapay zeka, belirli programlar için program başına insanlardan daha fazla içerik yazıyor. Pocket FM’in daha fazla yapay zeka aracı sunma planlarıyla, yapay zeka tarafından yazılan içerik miktarı artabilir. Bununla birlikte, daha fazla program yayınlama beklentisi de yükselebilir. Kullanıcı benimsemesi hızla artmazsa, ortalama getiriler düşebilir.

Şirket, TechCrunch’ın iadelerle ilgili sorularına doğrudan yanıt vermedi, ancak yapay zeka araçlarının bir yazarın işini hızlandırabileceğini ve bir bölümü sayılara ve izleyici geri bildirimlerine göre düzenlemelerine yardımcı olabileceğini belirtti. Yani, tamamen yeniden yazmak yerine hedefli iyileştirmeler yapabilirler.

Bir sözcü yaptığı açıklamada, “Bu şekilde, daha hızlı içerik oluşturma, kaliteyi veya alaka düzeyini düşürmüyor; sadece yazarın rolünü daha üretken çıktıları düzenlemeye, iyileştirmeye ve yönlendirmeye kaydırıyor” dedi.

Kaynak: TechCrunch

Okumaya devam et

Haberler

Meta, yapay zeka ses girişimi WaveForms’u satın aldı

Meta, AI ses teknolojisi girişimi WaveForms’u açıklanmayan bir bedel karşılığında satın aldı. Bu satın alma, şirketin yeni AI birimi Superintelligence Labs’ı güçlendirmek için yapılan en son hamle ve Meta’nın PlayAI’yi satın almasının ardından son bir ay içinde yaptığı ikinci büyük AI ses teknolojisi satın alımı.

Yayınlanma tarihi

=>

Meta, AI ses teknolojisi girişimi WaveForms’u açıklanmayan bir bedel karşılığında satın aldı. The Information’ın haberine göre, bu satın alma, şirketin yeni AI birimi Superintelligence Labs’ı güçlendirmek için yapılan en son hamle ve Meta’nın PlayAI’yi satın almasının ardından son bir ay içinde yaptığı ikinci büyük AI ses teknolojisi satın alımı.

Sadece 8 ay önce kurulan WaveForms, PitchBook verilerine göre Andreessen Horowitz’den 40 milyon dolarlık yatırım aldı ve bu yatırım turunda şirketin değerlemesi 160 milyon dolar olarak belirlendi.

Girişimin iki kurucu ortağı, eski Meta ve OpenAI araştırmacısı Alexis Conneau ile eski Google reklam stratejisti Coralie Lemaitre’nin Meta’ya katıldığı bildirildi. Conneau, OpenAI’da çalışırken GPT4-o Advanced Voice Mode sinir ağlarını ortaklaşa oluşturdu.

TechCrunch, WaveForms’a ulaşarak şirketin baş teknoloji uzmanı Kartikay Khandelwal’ın da Meta’ya katılıp katılmayacağını ve şirketin diğer yaklaşık 14 çalışanının (LinkedIn’e göre) anlaşmanın sonucunu öğrenmek istedi.

WaveForms kendi web sitesini kapatmış gibi görünüyor, ancak şirketin LinkedIn sayfasında misyonunu, dinleyicinin insan ve yapay zeka tarafından üretilen konuşmaları ayırt edip edemediğini ölçmeye çalışan “Konuşma Turing Testi”ni çözmek olarak tanımlıyor. WaveForms ayrıca, bireysel öz farkındalık ve yönetimi anlamaya odaklanan “Duygusal Genel Zeka”yı da geliştiriyordu.

Kaynak: TechCrunch

Okumaya devam et

Araştırma

İngiltere’de televizyonda podcast dinleme oranı 2 yılda iki katına çıktı

Edison Research’ün yayınladığı The UK Podcast Consumer 2025 raporuna göre, Birleşik Krallık’ta televizyonda podcast tüketimi son iki yılda iki katına çıktı. Araştırma ayrıca, ülkede kullanılan ana podcast platformunun Spotify olduğunu ve BBC Sounds’ın Apple Podcasts’ten daha popüler olduğunu gösteriyor.

Yayınlanma tarihi

=>

Edison Research’ün yayınladığı The UK Podcast Consumer 2025 raporuna göre, Birleşik Krallık’ta televizyonda podcast tüketimi son iki yılda iki katına çıktı. Araştırma ayrıca, ülkede kullanılan ana podcast platformunun Spotify olduğunu ve BBC Sounds’ın Apple Podcasts’ten daha popüler olduğunu gösteriyor.

Edison Research’ün yayınladığı “The UK Podcast Consumer 2025” raporu, Birleşik Krallık’ta podcast’lerin muazzam erişimini ve podcast dinlemenin büyüme potansiyelini ortaya koyuyor.

İngilizlerin çoğu son bir ay içinde podcast dinledi: Birleşik Krallık’ta 16 yaş ve üstü kişilerin %71’i hiç podcast dinlemiş, %51’i son bir ay içinde podcast dinlemiş ve %33’ü son bir hafta içinde podcast dinlemiştir.

Birleşik Krallık’ta podcast dinleme büyümeye hazır: Evlerde podcast tüketimi için akıllı TV’lerin benimsenmesi, dijital hizmetlerde podcast’lere erişimin ve çeşitliliğin artması ve otomobillerde bilgi-eğlence sistemlerinin yaygınlaşması, bu mecranın büyüme potansiyelini artırıyor.

  • 2023 yılından bu yana, 15 yaş ve üzeri İngiliz haftalık podcast tüketicileri arasında akıllı TV’de en sık dinleyenlerin sayısı iki katına çıktı: 2023 yılının ilk çeyreğinde akıllı TV’de en sık dinleyenlerin oranı %4 iken, 2025 yılının ilk çeyreğinde bu oran %8’e çıktı.
  • İngiltere’de haftalık podcast dinleyicileri arasında 15 yaş ve üzeri olanların %33’ü podcast dinlemek için en sık Spotify’ı kullanıyor; %20’si YouTube’u, %15’i BBC Sounds’u ve %13’ü Apple Podcasts’ı kullanıyor.
  • İngiltere’de son bir ay içinde araba süren veya araba ile seyahat eden 18 yaş ve üzeri kişilerin %38’i ana araçlarında Apple CarPlay veya Android Auto’ya sahip.

Edison Research Araştırma Direktörü Gabriel Soto, Edison’un The Infinite Dial® UK, Edison Podcast Metrics™ ve diğer özgün özel araştırmalarından elde edilen bulguları bir araya getiren çalışmanın sonuçlarını sundu.

Soto, “Bu yılın İngiltere Podcast Tüketici Raporu, podcast’lerin sadece ana akım tarafından benimsenmediğini, aynı zamanda değerli ve çeşitli kitlelere nasıl ulaştığını da gösteriyor” dedi. “Reklamverenler için bu çok önemli bir an. Edison olarak podcast’lere iyimser bakıyoruz, çünkü veriler daha fazla benimsenme potansiyeli, sağlam reklam ROI’si ve markaların medya stratejilerinin temel bir parçası olarak podcast’lere güvenle yatırım yapmalarına yardımcı olacak araçların zaten mevcut olduğunu gösteriyor.”

  • Podcast’ler geniş bir nesil kitlesine hitap ediyor: Birleşik Krallık’ta 16-24 yaş grubunun %61’i, 35-54 yaş grubunun %56’sı ve 55 yaş üstü grubun %38’i aylık podcast tüketicisidir.
  • Podcast reklamcılığı sağlam bir yatırım getirisi sağlıyor: Birleşik Krallık’ta 15 yaş ve üzeri haftalık podcast tüketicilerinin %83’ü, reklam dinlemenin ücretsiz içerik için ödenmesi gereken makul bir bedel olduğunu kabul etmektedir.
  • Birleşik Krallık merkezli en popüler podcast’ler ABD’deki dinleyicilere ulaşıyor: Birleşik Krallık merkezli en popüler 10 podcast (Birleşik Krallık’tan bir kişi tarafından sunulan veya Birleşik Krallık’taki bir kuruluş tarafından üretilen podcast’ler) her hafta ABD’de toplam 2,3 milyon podcast dinleyicisine ulaşmaktadır.

Diğer bulgular şunlar:

  • 15 yaş ve üzeri haftalık podcast tüketicilerinin %59’u podcast’leri en sık evde dinliyor.
  • 15 yaş ve üzeri haftalık podcast tüketicilerinin %66’sı podcast’leri en sık akıllı telefonlarında dinliyor.

Kaynak: PodNews

Okumaya devam et

En son