Bizimle iletişime geçin

Haberler

OpenAI, gerçekçi, duygusal konuşmalar üretebilen yeni nesil bir “Ses Motoru” tanıttı

OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses modellerini yayınladı.

Yayınlanma tarihi

on

OpenAI, API’sine, şirketin önceki sürümlerini geliştirdiğini iddia ettiği yeni transkripsiyon ve ses üreten yapay zeka modelleri getiriyor.

OpenAI için bu modeller, kullanıcılar adına görevleri bağımsız olarak yerine getirebilen otomatik sistemler oluşturmak anlamına gelen daha geniş “ajan” vizyonuna uyuyor. “Temsilci” tanımı tartışmalı olabilir, ancak OpenAI Ürün Başkanı Olivier Godement bir yorumu, bir işletmenin müşterileriyle konuşabilen bir sohbet robotu olarak tanımladı.

Godement, “Önümüzdeki aylarda giderek daha fazla temsilcinin ortaya çıktığını göreceğiz. Genel tema, müşterilerin ve geliştiricilerin faydalı, kullanılabilir ve doğru aracılardan yararlanmasına yardımcı olmak” dedi.

OpenAI, yeni metinden konuşmaya modeli “gpt-4o-mini-tts ‘nin sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerine göre daha ’yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler gpt-4o-mini-tts’e doğal dilde bir şeyleri nasıl söyleyeceği konusunda talimat verebiliyor; örneğin, “çılgın bir bilim adamı gibi konuş” veya “bir farkındalık öğretmeni gibi sakin bir ses kullan”.

İşte “gerçek suç tarzı”, yıpranmış bir ses:

OpenAI ürün ekibinin bir üyesi olan Jeff Harris, TechCrunch’a verdiği demeçte, amacın geliştiricilerin hem ses “deneyimini” hem de “bağlamı” uyarlamasına izin vermek olduğunu söyledi.

Harris, “Farklı bağlamlarda, sadece düz, monoton bir ses istemezsiniz. Bir müşteri destek deneyimindeyseniz ve sesin bir hata yaptığı için özür dilemesini istiyorsanız, aslında sesin içinde bu duyguyu barındırmasını sağlayabilirsiniz… Buradaki en büyük inancımız, geliştiricilerin ve kullanıcıların yalnızca ne konuşulduğunu değil, nasıl konuşulduğunu da gerçekten kontrol etmek istedikleridir” dedi.

OpenAI’nin yeni konuşmadan metne modelleri olan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” ise şirketin uzun süredir kullandığı Whisper transkripsiyon modelinin yerini alıyor. OpenAI, “çeşitli, yüksek kaliteli ses veri kümeleri” üzerinde eğitilen yeni modellerin kaotik ortamlarda bile aksanlı ve çeşitli konuşmaları daha iyi yakalayabildiğini iddia ediyor.

Harris ayrıca halüsinasyon görme olasılıklarının da daha düşük olduğunu sözlerine ekledi. Whisper, ırkçı yorumlardan hayali tıbbi tedavilere kadar her şeyi transkriptlere ekleyerek, konuşmalarda kelimeleri ve hatta tüm pasajları uydurma eğilimindeydi.

Harris, “Bu modeller bu konuda Whisper’a kıyasla çok daha gelişmiş durumda. Modellerin doğru olduğundan emin olmak, güvenilir bir ses deneyimi elde etmek için tamamen önemlidir ve [bu bağlamda] doğru olması, modellerin kelimeleri tam olarak duydukları [ve] duymadıkları ayrıntıları doldurmadıkları anlamına gelir” diye konuştu.

Bununla birlikte, kat ettiğiniz mesafe yazıya dökülen dile bağlı olarak değişebilir.

OpenAI’nin dahili kıyaslamalarına göre, iki transkripsiyon modelinden daha doğru olan gpt-4o-transcribe, Tamil, Telugu, Malayalam ve Kannada gibi Indic ve Dravidian dilleri için %30’a yaklaşan (%120 üzerinden) bir “kelime hata oranına” sahip. Bu, modelden alınan her 10 kelimeden üçünün bu dillerde insan transkripsiyonundan farklı olacağı anlamına gelir.

OpenAI, geleneği bozarak yeni transkripsiyon modellerini açık bir şekilde kullanıma sunmayı planlamıyor. Şirket geçmişte Whisper’ın yeni sürümlerini MIT lisansı altında ticari kullanım için yayınlamıştı.

GPT-4o-transcribe ve gpt-4o-mini-transcribe’ın “Whisper’dan çok daha büyük” olduğunu ve bu nedenle açık bir sürüm için iyi adaylar olmadığını söyleyen Harris, “Whisper gibi dizüstü bilgisayarınızda yerel olarak çalıştırabileceğiniz türden bir model değiller. Bir şeyleri açık kaynak olarak yayınlıyorsak, bunu düşünceli bir şekilde yaptığımızdan ve bu özel ihtiyaç için gerçekten geliştirilmiş bir modele sahip olduğumuzdan emin olmak istiyoruz. Ve son kullanıcı cihazlarının açık kaynak modelleri için en ilginç durumlardan biri olduğunu düşünüyoruz” dedi.

Kaynak: TechCrunch

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Önemli olan 5 yaratıcı gerçek

Her yaratıcı, podcaster ve girişimci eninde sonunda en güçlü derslerin karmaşık olmadığını öğrenir. Çoğu durumda, zamansızdırlar. İster bir marka, ister bir program ya da kariyer inşa ediyor olun, bu dersler tekrar tekrar karşınıza çıkar. Bunu akılda tutarak, işte dünyanın en büyük düşünürlerinden bazılarının iş, bağlantı ve büyüme hakkındaki düşünceleri şekillendiren beş yaratıcı gerçeği.

Yayınlanma tarihi

=>

Her yaratıcı, podcaster ve girişimci eninde sonunda en güçlü derslerin karmaşık olmadığını öğrenir. Çoğu durumda, zamansızdırlar.

İster bir marka, ister bir program ya da kariyer inşa ediyor olun, bu dersler tekrar tekrar karşınıza çıkar. Bunu akılda tutarak, işte dünyanın en büyük düşünürlerinden bazılarının iş, bağlantı ve büyüme hakkındaki düşüncelerimi şekillendiren beş yaratıcı gerçeği.

Bunu ilk set olarak kabul edin, daha fazla gerçek gelecek.

1. Markanız İnsanların Sizin Hakkınızda Söyledikleridir

“Markanız, siz odada yokken insanların sizin hakkınızda söyledikleridir.” – Jeff Bezos, Amazon’un kurucusu

Pek çok podcast yayıncısı ve içerik üreticisi “dinleyicilerimin” sadakatinden bahsediyor, dinleyicilerinin ne istediğini derinden anladıklarına inanıyor, ancak dinleyiciler uzaklaşmaya başladığında şaşırıyorlar. İletişimde kalmak her şeydir.

Programınız ve kişisel markanız yaşayan, nefes alan organizmalardır. Geri bildirimler, analizler, konuşmalar ve hatta içgüdüsel kontroller yoluyla aktif olarak dinlemiyorsanız, senkronizasyondan düşme riskiyle karşı karşıya kalırsınız.

Tom Webster, NYU’daki The Business of Podcasting dersimin müfredatında yer alan mükemmel kitabı “The Audience is Listening”de bunu ortaya koyuyor. İzleyiciler evrim geçiriyor. Yaratıcılar da değişmeli ya da bir gün uyandıklarında herkesin nereye gittiğini merak etmeliler.

Anahtar hatırlatma: Dinleyicilerinizin sadakatine sahip değilsiniz. Onu tekrar tekrar kazanırsınız.

2. Deneme ve Yanılma Süreci

“İşimi en iyi yapan şeyi, yapmayanları bulana kadar asla bulamam.” – Thomas Edison, inovasyonun öncüsü

Deneme ve yanılma zayıflık belirtisi değildir. Oyunun içinde olduğunuzun kanıtıdır. Her harika şov, proje ya da ürün, önce uymayan şeyler üzerinde çalışarak gelişir.

Örnek olarak Seinfeld’i ele alalım. İlk bölümlerde Jerry hikayeyi çerçeveleyen stand-up gösterileri yapıyordu. 4. Sezonda dizinin gerçek sesi ve temposu ortaya çıktıkça bu araç sessizce ortadan kayboldu. Karakterler keskinleşti. Hikaye anlatımı gelişti. Sihir zaman aldı.

Anahtar hatırlatma: Erken hataları kucaklayın. Bu, mükemmellik için ödediğiniz harçtır.

3. İşbirliği Üsteldir

“Eğer benim bir elmam varsa ve senin de bir elman varsa ve bunları değiştirirsek, ikimizin de hala bir elması olur. Ama benim bir fikrim varsa ve sizin de bir fikriniz varsa ve bunları değiş tokuş edersek, ikimizin de iki fikri olur.” – George Bernard Shaw, oyun yazarı ve eleştirmen

Benim için en iyi iş günlerinden bazıları anlaşmaları kapatmakla ilgili değildir. Zihinleri açmakla ilgilidir. Akıllı insanlarla oturup fikir alışverişinde bulunduğunuzda ortaya çıkan bir simya var. Bir düşünce diğerini tetikliyor. Yarı pişmiş bir konsept yeni bir stratejiye dönüşür. Birdenbire, her zamanki iki şeritli yolunuzda düşünmezsiniz. Dört şeritli bir olasılık otoyolunda yarışıyorsunuz.

Anahtar hatırlatma: İşbirliği sadece yardımcı olmakla kalmaz. Üsteldir.

4. Kurallarda Ustalaşın. Sonra Onları Yıkın

“Kuralları bir profesyonel gibi öğrenin, böylece onları bir sanatçı gibi yıkabilirsiniz.” – Pablo Picasso, sanatı yeniden tanımlayan bir vizyoner

En ilgi çekici yaratıcılar sistemi reddederek işe başlamadılar. Onda ustalaşarak başladılar.

Yapıyı, formatı ve beklentileri öğrendiler, onlarla oynadılar, onları zorladılar ve nihayetinde yepyeni bir şey yarattılar.

Kuralları ezbere bildiğinizde, onları tesadüfen değil, bilerek esnetebilirsiniz. İşte dönüşüm burada gerçekleşir.

Anahtar hatırlatma: Önce ustalık. Sonra yaramazlık.

5. Her Şeyi Anlatmayın

“Sıkıcı olmanın sırrı… her şeyi anlatmaktır.” – Voltaire, Fransız yazar ve filozof

İyi hikaye anlatıcıları gizemin bir kusur değil, bir özellik olduğunu bilirler. Her şeyi anlatmak zorunda değilsiniz. Her hareketi açıklamanıza gerek yoktur.

Harika hikaye anlatımı genellikle söylememeyi seçtiğiniz şeylerde yatar. Duraklamalar ve cevaplanmamış sorular izleyiciyi boşlukları doldurmaya davet eder. Aşırı açıklama, aşırı konuşma ve aşırı doldurma içeriğin ömrünü tüketebilir. Özellikle TikTok dünyasında, kısalık ödüllendirilebilir. Bu arada, bu Voltaire alıntısı 1738’den. O zaman bile, kısalık ve düzenlemeye değer verildiği görülüyor.

Anahtar hatırlatma: Daha fazlasını istemelerini ve saatlerini kontrol etmemelerini sağlayın.

Son Düşünce

Yaratıcılık rastgele değildir. Sektörler, nesiller, teknolojiler ve içerik platformları arasında işe yarayan bir temel ve gerçekler üzerine inşa edilmiştir. Bu aksiyomlar katı yasalar değildir. En iyi fikirlerin (ve en iyi programların, markaların ve işletmelerin) zaman içinde nasıl canlı kaldığını gösteren rehberler ve hatırlatıcılardır.

Yakında başka doğrular ve aksiyomlar da gelecek.

Sizin için işe yarayan yaratıcı veya ticari bir gerçek/aksiyom nedir? Duymak isterim.

Kaynak: Steve Goldstein / Amplifi Media

Okumaya devam et

Haberler

Spotify’ın ücretli abone sayısı 268 milyona ulaştı

Spotify’ın ücretli abone sayısı ilk çeyrekte bir önceki yılın aynı dönemine göre yüzde 11 artarak 268 milyona ulaştı ve beklentileri üç milyon aştı. Aylık toplam aktif kullanıcı sayısı ise bir önceki yıla göre yüzde 10 artarak 678 milyona ulaştı.

Yayınlanma tarihi

=>

Spotify’ın ücretli abone sayısı ilk çeyrekte bir önceki yılın aynı dönemine göre yüzde 11 artarak 268 milyona ulaştı ve beklentileri üç milyon aştı.

Spotify, 2025 yılı 1. çeyrek mali tablosunu yayınladı. 

Aylık toplam aktif kullanıcı sayısı, bir önceki yıla göre yüzde 10 artışla 678 milyona ulaşarak müzik ve podcasting platformu için en yüksek sayıda net ekleme gerçekleşti ve beklentileri 10 milyon aştı. Gelir bir önceki yıla göre yüzde 16 artışla 4,2 milyar Avro’ya ulaşarak beklentilerin üzerinde gerçekleşirken, faaliyet geliri de şirket için rekor bir seviye olan 477 milyon Avro’ya yükseldi.

Spotify, aylık aktif kullanıcı sayısındaki artışı “dünyanın geri kalanı” ve Latin Amerika segmentlerinin öncülüğüne bağladı, ancak tüm bölgelerde büyüme kaydedildi.

Reklam destekli gelir, müzik ve podcast reklamcılığının satılan gösterimlerdeki büyümeyle desteklenmesi, ancak şirketin sahip olduğu ve lisanslı portföyündeki “fiyatlandırmadaki yumuşaklık ve podcast envanterimizin optimizasyonu ile kısmen dengelenmesi” nedeniyle bir önceki yıla göre yüzde 8 arttı.

Faaliyet geliri, çeyrek boyunca hisse fiyatlarının değer kazanması nedeniyle tahminlerin 58 milyon € üzerinde gerçekleşen 76 milyon € tutarındaki sosyal giderler nedeniyle şirketin beklentilerinin biraz altında kaldı.

EK BELİRSİZLİKLERE DİKKAT ÇEKTİ

Spotify CEO’su Daniel Ek makroekonomik ortama dikkat çekerek, müziğe olan talebin devam etmesi ve freemium teklifi nedeniyle Spotify’ın “çoğundan daha iyi durumda” olduğuna inandığını söyledi.

Ek, “Dünyada çok fazla belirsizlik var ve dalgalanma arttığında, kimin nasıl etkilenebileceğini sormak doğaldır ve benim oturduğum yerden Spotify çoğundan daha iyi durumda. Ancak elbette, gerçekten aşırı bir şey olursa, biz de etkilenebiliriz. Bununla birlikte, bugün gördüğümüz hiçbir şeyin Spotify için uzun vadeli resmi değiştirdiğine inanmıyorum. İşimiz sağlam, modelimiz dayanıyor ve gittiğimiz yön netliğini koruyor” dedi.

Rakamlar Spotify’ın ilk tam kârlılık yılının sona ermesinin ardından ve Temmuz 2024’teki fiyat artışının ardından geldi. Spotify aynı zamanda video podcast alanında da atılım yapıyor; platformda 330.000 video podcast programı bulunuyor ve 270 milyon kullanıcı Spotify’da bir video podcast yayınlamış durumda. Ek, kazanç çağrısında “Kullanıcıların genel olarak video içeriğiyle %44 daha fazla zaman geçirmesiyle güçlü bir çekiş görüyoruz” dedi.

Sesli kitaplar da platformun daha büyük bir parçası haline geliyor ve 350.000 kitap artık alakart olarak sunuluyor.

Ek ayrıca podcasting reklamları işini büyütmek için Ocak ayında başlatılan Spotify Partner Programına da işaret etti. Ek, programın ilk çeyrekte podcast yaratıcılarına 100 milyon dolardan fazla ödeme yaptığını söyledi.

Spotify, ikinci çeyrekte 11 milyon kullanıcı ekleyerek 689 milyon aylık aktif kullanıcıya ve 5 milyon abone ekleyerek 273 milyon ücretli aboneye ulaşmayı bekliyor.

“2025 yılı için çok heyecanlıyım ve hem ürün hem de işletme olarak geldiğimiz nokta konusunda kendimi gerçekten iyi hissediyorum” diyen Ek sözlerini şöyle sürdürdü:

“Uzun vadeli etki yaratacak bahisler oynamaya devam edeceğiz ve geçen yıl elde ettiğimiz verimlilik seviyelerini korurken hızımızı artıracağız. Bu kombinasyon, en iyi ve en değerli kullanıcı deneyimini oluşturmamızı, sürdürülebilir bir şekilde büyümemizi ve dünyaya yaratıcılık sunmamızı sağlayacak.”

Spotify’ın bu yıl belirlediği yıllık sabit para birimi cinsinden yüzde 20 gelir artışı hedefine ulaşıp ulaşamayacağı sorulduğunda Ek, şirketin hızlı bir şekilde çalışmaya devam etmesi ve daha sonra belirli pazarlarda büyümek için daha düşük fiyat kullanması ve platform geliştikçe fiyat artışlarını da eklemesi halinde bunun başarılabileceğine inandığını söyledi.

Ek, “Keşke size bu yolun tamamen doğrusal olduğunu söyleyebilseydim ve bunu ay bazında çizebilseydik ve her çeyrekte öngörülebilir bir fiyat artışımız olsaydı. Ama işler böyle yürümüyor. Ancak ileriye dönük olarak bana güven veren şey, baktığınızda bunu daha önce birçok kez yapmış olmamızdır” dedi.

RAKAMLARLA ÖZET

  • Abone Sayısı bir önceki yıla göre %12 artarak 268 milyona ulaştı.
  • Aylık Aktif Kullanıcı sayısı bir önceki yıla göre %10 artarak 678 milyona ulaştı.
  • Toplam Gelir yıllık %15 artışla 4,2 milyar Avro’ya ulaştı.
  • Brüt Marj yıllık bazda ~400 baz puan artarak %31,6’ya yükseldi.
  • Faaliyet Geliri 509 milyon Avroya yükseldi.

Kaynak: HollyWood Reporter

Okumaya devam et

Haberler

Google NotebookLM’in yapay zeka podcast özelliğini artık Türkçe kullanabilirsiniz

Google’ın yapay zeka tabanlı not alma ve araştırma asistanı NotebookLM, yeni bir güncellemeyle Sesli Genel Bakış (Audio Overviews) özelliğini aralarında Türkçe’nin de bulunduğu 76 yeni dilde kullanıma sundu.

Yayınlanma tarihi

=>

Google’ın yapay zeka tabanlı not alma ve araştırma asistanı NotebookLM, yeni bir güncellemeyle Sesli Genel Bakış (Audio Overviews) özelliğini aralarında Türkçe’nin de bulunduğu 76 yeni dilde kullanıma sundu. Audio Overviews geçen yıl, kullanıcılara NotebookLM ile paylaştıkları kurs okumaları veya yasal özetler gibi belgelere dayalı olarak yapay zekalı sanal sunucularla bir podcast oluşturma olanağı sağlamak için başlatıldı.

Bu özelliğin arkasındaki fikir, kullanıcılara uygulamaya yükledikleri belgelerdeki bilgileri sindirmeleri ve anlamaları için başka bir yol sunmak. Bu genişleme ile daha fazla kişi Sesli Genel Bakışları tercih ettikleri dilde kullanabilecek.

Google, şimdiye kadar Sesli Genel Bakışların hesabınızın tercih ettiği dilde oluşturulduğunu belirtiyor. Şimdi şirket, kullanıcıların Sesli Genel Bakışlarının hangi dilde oluşturulacağını seçmelerine olanak tanıyan yeni bir “Çıkış Dili” seçeneği sunuyor.

Google, dili istediğiniz zaman değiştirebileceğinizi ve böylece gerektiğinde çok dilli içerik veya çalışma materyalleri oluşturmanın kolaylaşacağını söylüyor.

Google bir blog yazısında, “Örneğin, Amazon yağmur ormanları hakkında bir ders hazırlayan bir öğretmen, Portekizce bir belgesel, İspanyolca bir araştırma makalesi ve İngilizce çalışma raporları gibi çeşitli dillerdeki kaynakları öğrencileriyle paylaşabilir. Öğrenciler bunları yükleyebilir ve tercih ettikleri dilde temel bilgilerden oluşan bir Sesli Genel Bakış oluşturabilirler” diye yazdı.

Google’ın desteklenen yeni diller arasında Afrikaans, Arapça, Azerice, Bulgarca, Bengalce, Katalanca, Çekçe, Danca, Almanca, Yunanca, İspanyolca (Avrupa, Latin Amerika, Meksika), Estonca, Baskça, Farsça, Fince, Filipince, Fransızca (Avrupa), Fransızca (Kanada), Galiçyaca, Gujarati, Hintçe, Hırvatça, Haiti Kreolü, Macarca, Ermenice, Endonezyaca, İzlandaca, İtalyanca, İbranice ve Japonca yer alıyor.

Ayrıca Cava, Gürcüce, Kannada, Korece, Konkani, Latince, Litvanca, Letonca, Maithili, Makedonca, Malayalam, Marathi, Malayca, Birmanca (Myanmar), Nepalce, Felemenkçe, Norveççe (Nynorsk), Norveççe (Bokmål), Oriya, Pencapça, Lehçe, Peştuca, Portekizce (Brezilya, Portekiz), Rumence, Rusça, Sindhi, Sinhala, Slovakça, Slovence, Arnavutça, Sırpça (Kiril), İsveççe, Svahili, Tamilce, Telugu, Tayca, Türkçe, Ukraynaca, Urduca, Vietnamca, Çince (Basitleştirilmiş) ve Çince (Geleneksel).

Okumaya devam et

En son