Haberler
Trinity Audio makaleleri podcast’lere dönüştürecek
İsrailli girişim Trinity Audio, yazılı içeriği okuyan bir ses oynatıcı geliştirdi. Bu özellik Google’ın henüz yapmadığı bir şey…
Yayınlanma tarihi
3 yıl önceon
Yazar :
Podcast TurkeyŞunu hayal edin: haber akışınızda geziniyorsunuz ve çok ilginç bir makaleyle karşılaşıyorsunuz. Bunu okurken, telefonunuzu bırakmanız gerekiyor; belki de araba sürüyorsunuz veya ellerinize ihtiyaç duyduğunuz yerde başka bir şey yapıyorsunuz. Açıkçası bu, makaleyi okumaya devam edemeyeceğiniz anlamına geliyor. Oysa yaazı süper ilgi çekiciydi ve nasıl bittiğini merak ediyorsunuz. Bu durum hepimizin başına geliyor ve bir İsrailli startup bu sorunu bizim için çözmek istiyor. Hatta, içeriğiniz için güvendiğiniz web sitelerine girmek zorunda kalmanıza gerek kalmadan size zaman kazandırmak ve sizin için bir podcast beslemesi hazırlamak istiyorlar.
Google’ın henüz yapamadıklarını başarmak
İsrailli girişim Trinity Audio, tek bir tıklamayla web sitelerinin makalelerin içeriğini basit bir eklenti “oynatıcı” ile “okumasına” izin verecek bir sistem geliştirdi. Trinity’nin sistemi halihazırda 125 dilde çalışıyor ve Google ile Amazon da dahil olmak üzere üçüncü taraf şirketlerin Metin-Konuşma motorlarının kullanımına dayanıyor.
İsrailli startup tarafından oluşturulan sistemin önemli avantajı, Text-to-Speech motorlarına karşı agnostik olması. Bu nedenle esasen onları kullanır ama aynı zamanda onlara bir yükseltme sağlar. Trinity, kelimelerin çeşitli motorlar aracılığıyla telaffuz edilme şeklini önemli ölçüde iyileştirmek için tasarlanmış kural tabanlı bir sisteme ve araçlara sahip.
Trinity’nin sisteminin çalıştığı 125 dilden biri İbranice ve üçüncü taraf Text-to-Speech motorunun yanı sıra kendi oluşturdukları sözlükle de çalışıyor. Bu tür bir entegrasyon, Trinity ile çalışan şirketlerin, sistemin belirli kelimeleri algılama şeklini gerçek zamanlı olarak geliştirmelerine olanak tanıyor. Harflere ek olarak, sistem daha doğru bir dinleme akışı için İbranice gibi birçok dilde kelimenin telaffuzuyla ilgili farklı sembolleri bile “okuyabiliyor”.
Bu, sistemin Google’ın henüz geliştirmediği yeteneğinde önemli bir avantaj. Konuştuğumuz Google mühendislerine göre bu, İbranice’nin Google’ın sesli asistanının desteklediği dillerden biri olarak resmi olarak eklenmesini engelleyen daha önemli sorunlardan biri. Dahası, eğer semboller bir şekilde yazılanları deşifre etmeye yardımcı olmadıysa, Trinity’nin sistemi, fonetiklerini (kelimedeki her sesin nasıl davrandığını) inceleyerek kelimenin nasıl telaffuz edileceğini bulabilir, ancak bu daha alışılmadık durum için tasarlanmış bir seçenek ve Uluslararası Fonetik Alfabesinin kullanımına dayanan bir araç, birçoğunun onu nasıl doğru kullanacağını bilmediği bir araç.
Herhangi bir çalışan kullanabilir
Trinity’nin ürünü, web sitesinin JS koduna kısa bir entegrasyon içeriyor, ancak o andan itibaren, şirket çalışanlarının herhangi birinin onunla çalışabilmesi için Kodsuz bir ürün. Trinity’nin sistemi tarafından sunulan gelişmiş okuma yeteneklerinin yanı sıra, okuyucular için bir içerik tavsiye motoru oluşturma yeteneği, oynatıcısında reklam verme yetenekleri ve makaleleri bir Spotify çalma listesine dönüştürme dahil olmak üzere başka ilginç araçlar da getiriyor. Örneğin, bir web sitesi yüklediği bir periyodik bölümdeki (haftalık, aylık veya başka herhangi bir şey) her makalenin doğrudan bu oynatma listesine gönderilmesine karar verebilir ve Trinity bu “podcast” için bir RSS beslemesi bile oluşturacaktır, böylece okuyucular (zaten dinleyen) her “yeni bölüm” yüklendiğinde bir bildirim alabilir.
Trinity’nin ürün müdürü Oren Liberman, Geektime’a aptığı açıklamada, Trinity’nin, sistemi tarafından okunacak yeni metni girebileceğiniz Editör adında başka bir aracı olduğunu söylüyor. Sistemin bir diğer avantajı ise kullandığı sesi, çalma hızını ve sistemin üst düzey bir kullanıcı deneyimi için gerekli düzenlemeleri yapabilmenizdir. Liberman, editör seçeneğinin çok yüksek düzeyde kişiselleştirme ile sadece metinden bir şeyler üretmeyi mümkün kıldığını açıkladı.
Trinity, Ron Jaworski (CEO) tarafından kuruldu ve GoTo Mobility adlı halka açık bir şirket altında faaliyet gösteriyor (onları Car2Go olarak biliyor olabilirsiniz). Trinity’nin 10’u İsrail’deki geliştirme merkezinde olmak üzere 12 çalışanı var. Startup, ana şirketinden şimdiye kadar 4 milyon dolar topladı ancak gelecekte risk sermayesi fonlarından fon almayı reddetmediklerini söyledi. Bugün itibariyle, İsrailli girişimin ödeme yapan müşterileri var.
Kaynak: Oshry Alkeslasi / Geektime
Beğenebilirsin
Haberler
Danimarka, insanların kendi özelliklerini telif hakkıyla korumayı planlıyor
Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. Bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.
Yayınlanma tarihi
4 gün önce=>
28 Haziran 2025Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. The Guardian’ın haberine göre, bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.
Danimarka Kültür Bakanlığı, mevcut yasayı değiştirmek için bir öneri sunması gerekse de, kurum şimdiden tüm partilerin desteğini almayı başardı.
Danimarka Kültür Bakanı Jakob Engel-Schmidt, The Guardian gazetesine verdiği demeçte, “Tasarıda, herkesin kendi bedeni, kendi sesi ve kendi yüz özellikleri üzerinde hak sahibi olduğu konusunda hemfikiriz ve bu konuda net bir mesaj veriyoruz. Ancak mevcut yasa, insanları yapay zeka ile üretilen içeriklere karşı bu şekilde korumuyor” dedi.
ABD’de, birkaç eyalet, seçimler sırasında kötüye kullanım ve rıza dışı cinsel içerikle ilgili derin sahtecilik yasalarını kabul etti. Kongre, eyaletlerin yapay zekayı 10 yıl boyunca düzenleme yetkisini elinden alacak yeni bir bütçe uzlaşma tasarısını değerlendirirken, bu yasaların çoğu şu anda risk altında.
Kaynak: TechCrunch
Haberler
Meta, ses klonlama girişimi Play AI’ı satın almaya hazırlanıyor
Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.
Yayınlanma tarihi
4 gün önce=>
28 Haziran 2025Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Bloomberg’in haberine göre şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.
Habere göre teknoloji devi, girişimin teknolojisini satın almayı ve bazı çalışanlarını bünyesine katmayı hedefliyor.
Play AI, web sitesine göre, herkesin müşteri hizmetleri gibi AI destekli kullanım durumları için kullanabileceği farklı türde sesleri klonlamasına olanak tanıyor. Crunchbase’e göre, bu girişim toplamda 23,5 milyon dolar fon topladı ve yatırımcıları arasında 500 Global, Kindred Ventures, Race Capital ve Soma Capital bulunuyor.
Meta şu anda sosyal platformlarındaki içerik oluşturucuların kendi sohbet robotlarını oluşturmalarına izin veriyor ve Meta AI sohbet robotuna video düzenleme özellikleri ekledi. Bir ses girişimini satın almak, şirketin yaratıcı paketine ses özellikleri eklemesine olanak tanıyacak.
Meta ve Play AI haberlere ilişkin yorum yapmadı.
Kaynak: TechCrunch
Haberler
ElevenLabs, yapay zeka özelliklerine sahip mobil uygulamasını başlattı
Sesli yapay zeka şirketi ElevenLabs, iOS ve Android için kullanıcıların hareket halindeyken metinden ses klipleri oluşturmasına olanak tanıyan, etiketler aracılığıyla ifade kontrolü ve popüler içerik oluşturma uygulamalarıyla sorunsuz entegrasyon sağlayan en yeni v3 alfa metinden sese modellerine erişim sunan bağımsız bir mobil uygulama başlattı.
Yayınlanma tarihi
6 gün önce=>
26 Haziran 2025Sesli yapay zeka şirketi ElevenLabs, iOS ve Android kullanıcılarının metinden ses klipleri oluşturmasına olanak tanıyan bağımsız bir mobil uygulama yayınladı.
Şimdiye kadar, ElevenLabs’ın yapay zeka destekli ses kütüphanelerini kullanarak örnekler üretmeniz gerekiyorsa, web uygulamasına güvenmek zorundaydınız. Şimdi hareket halindeyken klipler üretmek için mobil uygulamasını kullanabilirsiniz.
ElevenLabs mobil uygulaması, hareket halindeki içerik üreticiler için tasarlanmış şık ve sezgisel bir arayüzde güçlü AI ses üretme özelliklerini bir araya getiriyor. Kullanıcılar, 70’den fazla dilde binlerce gerçekçi sese erişebilir ve yaş, aksan ve stil filtreleri kullanarak her projeye en uygun sesi bulabilir. Uygulama, stadyum tezahüratlarından ince komedi zamanlamalarına kadar her ses klibini olağanüstü derecede insan sesine benzeten, benzeri görülmemiş bir duygusal aralık ve ifade kontrolü sunan son teknoloji Eleven v3 modelini içeriyor.
Uygulamayı diğerlerinden ayıran özellik, özelleştirme seçenekleri ve sorunsuz iş akışı entegrasyonu. Kullanıcılar, hayal ettikleri sesi tam olarak elde etmek için hız, kararlılık ve stil gibi ses parametrelerini ince ayar yapabilirler. Tek dokunuşla dışa aktarma özelliği sayesinde, oluşturulan sesler CapCut, TikTok, Instagram ve YouTube Shorts gibi popüler içerik oluşturma platformlarında anında paylaşılabilir. Uygulama, kullanıcıların ElevenLabs hesaplarıyla senkronize olarak, kişisel ses klonları, kaydedilmiş favoriler ve web platformundaki önceki içerikler dahil olmak üzere tam ses kitaplığına erişim sağlıyor. Ücretsiz kullanıcılar, mobil ve web uygulamaları arasında paylaşılan kredi limitleri ile ayda yaklaşık 10 dakika ses oluşturma hakkı elde ediyor.
V3 Alpha İfade Kontrolleri
Eleven v3 (alpha), satır içi ses etiketleri aracılığıyla ses ifadesinde benzeri görülmemiş bir kontrol sağlayarak AI konuşma sentezinde devrim yaratıyor. Önceki modellerden farklı olarak, v3 kullanıcıların [fısıldar], [güler], [kızgın], [heyecanlı] ve [iç çeker] gibi duygusal ipuçlarını doğrudan metne yerleştirerek performansları yönlendirmelerine olanak tanıyor ve doğal duygusal geçişlerle olağanüstü insan benzeri bir sunum yaratıyor. Bu etiketler birleştirilebilir (örneğin, “[mutlu][bağırır] Başardık! [güler]”) birleştirilerek, AI ses teknolojisiyle daha önce imkansız olan nüanslı performanslar elde edilebilir.
Modelin gelişmiş mimarisi, tüm duyguları ve ses efektlerini destekleyerek, ince ton değişikliklerinden cümle ortasında dramatik performans değişikliklerine kadar her şeyi mümkün kılıyor. v3, önceki sürümlerden daha fazla hızlı mühendislik gerektirse de, sesli kitaplar, videolar ve etkileşimli medya gibi uygulamalarda olağanüstü gerçekçilik sağlıyor. Gerçek zamanlı üretim ihtiyacı olan kullanıcılar için ElevenLabs, v3’ün gerçek zamanlı sürümü kullanıma sunulana kadar v2.5 Turbo veya Flash modellerini kullanmaya devam etmelerini öneriyor. Şirket, arayüzü üzerinden erişen self servis kullanıcılar için 2025 Haziran sonuna kadar v3 kullanımında %80 indirim sunuyor.
Çapraz Platform Entegrasyon Yetenekleri
ElevenLabs, geliştiricilerin AI ses teknolojisini çeşitli uygulamalara sorunsuz bir şekilde entegre etmelerini sağlayan, birden fazla platformda sağlam entegrasyon yetenekleri sunuyor. Platform, geliştiricilerin ses özelliklerini hızlı bir şekilde uygulamaya koyarken, kurumsal düzeyde güvenlik için GDPR ve SOC II uyumluluğunu koruyan Python ve TypeScript SDK’ları sağliyor. Kodsuz çözümler arayanlar için Albato, Make ve Appy Pie Automate gibi hizmetler, programlama uzmanlığı gerektirmeden ElevenLabs’ı yüzlerce popüler uygulamaya bağlamayı mümkün kılıyor.
Şirketin Konuşma Yapay Zeka teknolojisi, Salesforce, HubSpot ve Gmail gibi hizmetlere bağlanmak için Çok Kanallı Protokolü (MCP) destekleyen 11ai’nin tanıtımıyla entegrasyon olanaklarını daha da genişletti. Mobil uygulama entegrasyonu, geliştiricilerin önceden hazırlanmış sesler arasından seçim yapabileceği veya mobil uygulamalar için kendi seslerini özelleştirebileceği konuşma AI oyun alanı aracılığıyla kolayca gerçekleştirilebilir. Bu entegrasyon seçenekleri, ElevenLabs’ı web, mobil ve telefon kanallarında gerçekçi AI tarafından üretilen seslerle ürünlerini geliştirmek isteyen işletmeler için çok yönlü bir seçim haline getiriyor.
Kaynak: Perplexity
Danimarka, insanların kendi özelliklerini telif hakkıyla korumayı planlıyor
Meta, ses klonlama girişimi Play AI’ı satın almaya hazırlanıyor
ElevenLabs, yapay zeka özelliklerine sahip mobil uygulamasını başlattı
En son
- Haberler3 yıl önce
Podcast’ten para kazanmanın 12 yolu
- Haberler2 yıl önce
Spotify’dan ‘Şişedeki Çalma Listesi’
- Etkinlik2 yıl önce
‘Podcast Dinliyorum’ etkinliğinin ikincisi 25 Ekim’de
- Araştırma10 ay önce
Popüler podcast yayıncıları sektördeki en büyük zorlukları yorumluyor
- Araştırma3 yıl önce
Mart ayına Anchor, Buzzsprout ve Spreaker damgası
- Haberler3 yıl önce
Video podcast nedir?
- Haberler3 yıl önce
Podcast’leri nasıl daha hızlı dinleyebilirsiniz?
- Haberler3 yıl önce
Daniel Ek Spotify’ın büyük vizyonunu anlattı