Bizimle iletişime geçin

Haberler

OpenAI, Ses Yapay Zeka Çalışmalarını Hızlandırıyor

OpenAI, yapay zeka destekli kişisel cihazının nihai piyasaya sürülmesine hazırlık olarak sesli yapay zeka modellerini iyileştirmek için adımlar atıyor. Cihazın büyük ölçüde ses tabanlı olması bekleniyor.

Yayınlanma tarihi

on

OpenAI, yapay zeka destekli kişisel cihazının nihai piyasaya sürülmesine hazırlık olarak sesli yapay zeka modellerini iyileştirmek için adımlar atıyor. Cihazın büyük ölçüde ses tabanlı olması bekleniyor.

Kullanıcılar ChatGPT ile konuştuğunda, sohbet robotu cevap verebiliyor, ancak sesli sürümü destekleyen büyük dil modeli, ChatGPT’nin metin tabanlı yanıtlarını destekleyen modelden farklı. Eski ve mevcut çalışanlara göre, şirketin araştırmacıları mevcut sesli modellerin, yanıtlarının doğruluğu ve soruları cevaplama hızı açısından metin tabanlı modellerin gerisinde kaldığına inanıyor.

Sonuç olarak, son iki ay içinde OpenAI, gelecekteki cihazları için ses modellerini iyileştirme hedefi etrafında birkaç mühendislik, ürün ve araştırma ekibini bir araya getirdi.

Ses modellerinin doğruluğunu iyileştirmek, OpenAI’nin tüketicilerin sesli komutlar verebileceği bir cihaz piyasaya sürme hedefleri için önemli. The Information’ın daha önce bildirdiği gibi, bu cihazların ilki yaklaşık bir yıl sonra piyasaya çıkması bekleniyor.

OpenAI’nin ses modellerini iyileştirme çabaları meyvelerini vermeye başladı. Şirketin çalışmalarını takip eden kaynaklar, yeni ses modeli mimarisinin daha doğal ve duygusal yanıtlar ürettiğini ve daha doğru, derinlemesine cevaplar verdiğini kaydediyor. Bu kaynaklar, yeni ses modelinin aynı zamanda insan kullanıcılarla aynı anda konuşabileceğini ve bugünkü modellerin yapamadığı kesintileri daha iyi idare edebileceğini de belirtiyor.

Bu çalışmayı yakından takip eden bir kaynak, şirketin yeni ses modelini 2026’nın ilk çeyreğinde piyasaya sürmeyi hedeflediğini söyledi. OpenAI sözcüsü ise yorum yapmaktan kaçındı.
Google, Amazon, Meta Platforms ve Apple gibi OpenAI de giyilebilir cihazlar dahil olmak üzere yeni tür kişisel yapay zeka cihazları geliştirmek istiyor. Bu şirketlerden bazıları, iPhone gibi günümüzün en popüler cihazlarının gelecekteki yapay zeka teknolojisi için optimize edilmediğine inanıyor.

Cihaz üzerinde çalışan OpenAI araştırmacıları, kullanıcıların ekrana bakmak yerine sesli komutlarla cihazla etkileşime geçmesini istiyor. Eski OpenAI Teknoloji Direktörü Mira Murati’nin kurucu ortağı olduğu AI girişimi Thinking Machines Lab’daki araştırmacılar da dahil olmak üzere birçok AI araştırmacısı, insanların birbirleriyle öncelikle konuşarak etkileşime geçtiği için sesli komutların AI ile etkileşim kurmanın daha doğal bir yolu olduğuna inanıyor.

Bazıları ayrıca, ekranı olmayan bir tasarımın insanların cihaza bağımlı hale gelme olasılığını azaltacağına inanıyor. OpenAI ile donanım çalışmaları üzerinde çalışan eski Apple tasarım şefi Jony Ive, potansiyel yeni cihazları geçmişteki tüketici cihazlarının hatalarını düzeltmenin bir yolu olarak gördüğü için bunun kendisi için bir öncelik olduğunu söyledi.

Ive, Mayıs ayında Stripe CEO’su Patrick Collison ile yaptığı röportajda, “Niyetiniz masum olsa bile, kötü sonuçları olan bir şeye karışmışsanız, bunun sorumluluğunu üstlenmeniz gerekir. Kişisel olarak, bu sorumluluk duygusu, üzerinde çalıştığım birçok şeyi yönlendirdi” dedi.

Ancak eski bir çalışan “OpenAI’nin bugün karşılaştığı bir engel, birçok ChatGPT kullanıcısının, ses modellerinin düşük kalitesi veya bu özelliğin farkında olmamaları nedeniyle, chatbot ile yüksek sesle konuşarak etkileşime girmiyor olmasıdır” dedi. Ses öncelikli bir AI cihazı geliştirmek için OpenAI’nin önce tüketicileri ChatGPT gibi AI ürünleriyle yüksek sesle konuşmaya alıştırması gerekyor.

Sesli AI çalışmaları hakkında bilgi sahibi olan bir kaynak, OpenAI’nin sesli AI girişimlerinin arkasındaki kilit ismin, bu yaz Character.AI’dan bu çalışmayı yönetmesi için şirketin işe aldığı sesli AI araştırmacısı Kundan Kumar olduğunu söyledi. Diğer liderler arasında, OpenAI’nin büyük ölçüde metin odaklı AI için oluşturulmuş altyapısını sesli AI için yeniden yazılmasına yardımcı olan ürün araştırma lideri Ben Newhouse ve multimodal ChatGPT ürün müdürü Jackie Shannon da bulunuyor.

Bu çalışmayı yakından takip eden birçok kişiye göre, OpenAI tek bir cihaz yerine zaman içinde piyasaya sürmeyi planladığı bir cihaz ailesi geliştiriyor. Şirketin tartıştığı fikirler arasında gözlükler ve ekranı olmayan akıllı hoparlörler de var.

Sesli yapay zeka çalışmaları hakkında bilgi sahibi olan bir kişiye göre, cihaz üzerinde çalışan araştırmacılar bu yaz OpenAI çalışanlarına yaptıkları sunumda, cihazın kullanıcıya eşlik eden bir yardımcı gibi çalışacağını ve kullanıcıya hedeflerine ulaşması için proaktif olarak önerilerde bulunacağını, basit bir uygulama ve yazılım aracı olmaktan öteye geçeceğini söylediler. Bu kişi, cihazın, kullanıcı izin verdiğinde ses ve video yoluyla çevresi ve kullanıcısı hakkında bilgi toplayabileceğini belirtti.

OpenAI’da birçok çalışan, tedarik zinciri, endüstriyel tasarım ve model araştırması gibi cihazla ilgili çalışmalarda görev alıyor. 2025’in başlarında OpenAI, donanım cihazlarını tasarlamak için Ive’nin kurucu ortağı olduğu io şirketini yaklaşık 6,5 milyar dolara satın aldı.

Kaynak: Stephanie Palazzolo / The Information

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Spotify yapay zeka destekli kişiselleştirilmiş podcast’leri tanıttı

Spotify, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre yapay zeka desteğiyle doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Yeni özellik kapsamında Spotify, “Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserleri hakkında bilgi ver” gibi istemlere dayanarak sesli içerik oluşturacak.

Yayınlanma tarihi

=>

Spotify, platformuna daha fazla yapay zeka özelliği eklerken, yakında kullanıcıların kendi podcast’lerini oluşturmalarına olanak tanıyacağını duyurdu.

Spotify, Perşembe günü düzenlediği yatırımcı gününde, kullanıcıların ilgi alanlarına ve dinleme alışkanlıklarına göre doğrudan Spotify içinde podcast oluşturmalarına olanak tanıyan kişisel podcast özelliğini duyurdu. Bu özellik, kullanıcıların Spotify’a bir istek yazması ve Spotify’ın da bu isteğe göre ses dosyaları oluşturması prensibine dayanan mevcut “İstekli Çalma Listeleri” bölümüne benzer bir mekanizma izliyecek. 

Spotify şu örneği verdi:

“Günlük bir özet, merak ettiğiniz bir konu hakkında derinlemesine bir inceleme veya aklınızdaki her şeyin haftalık bir özetini oluşturabilirsiniz. ‘Günlük şehir güncellemelerimi paylaş ve sevdiğim sanatçıların yerel konserlerinden bahset’ veya ‘Ekonomiyi beş dakikada anlamama yardımcı ol’ gibi isteklerde bulunun ve Spotify, size özel bir sesli özet oluştururken, daha fazlasını keşfedebileceğiniz ilgili bölümlere, programlara ve içerik oluşturuculara da bağlantı verecektir.” 

Kullanıcılar daha sonra bu podcast’leri günlük veya haftalık olarak tekrar edecek şekilde planlayabilir, bir ses seçebilir ve ek metin, PDF veya bağlantılar aracılığıyla daha fazla bağlam ekleyebilirler. Bölümler yalnızca her bireyin kendi kütüphanesi aracılığıyla erişilebilir durumda. 

Kişisel podcast’ler, önümüzdeki aydan itibaren ABD’deki uygun premium kullanıcılara sunulacak ve belirli sayıda aylık kredi içerecek, ayrıca daha fazla kredi satın alma seçeneği de sunulacak. Spotify ayrıca Perşembe günü, kullanıcıların dinledikleri podcast’ler hakkında Spotify’a sorular sormasına ve yanıt almasına olanak tanıyan yeni bir özellik yayınlayacağını duyurdu.

Spotify’ın eş CEO’su Gustav Söderström, yatırımcı sunumunda şunları söyledi:

“Deneyimin sadece bir katalogdan seçilmediği, her bir kullanıcımız tarafından gerçek zamanlı olarak, zevklerine, bağlamlarına ve niyetlerine göre şekillendirildiği bir Nesil Çağına giriyoruz… Bugün, hem kamuya açık hem de özel içerik için (veya başka bir deyişle) üretken çağ için bir medya oynatıcı yok. Spotify’ın bunu başaracağına inanıyoruz.”

Ayrıca Spotify, podcast içerik üreticilerinin Spotify’daki en ilgili hayranlarından doğrudan düzenli gelir elde etmelerini sağlayan bir yol olarak içerik üretici sponsorluklarını da tanıttı. Şirket ayrıca, podcast ses dosyaları oluşturmak ve kullanıcının takvimine, gelen kutusuna ve notlarına bağlanmak için kullanılabilen bağımsız bir masaüstü uygulaması olan Studio by Spotify Labs‘ı da tanıttı.

Bu özelliklere ek olarak Spotify, biletler satışa çıkmadan önce Spotify Premium sahibi sadık hayranları için iki konser biletini ayıracağını ve premium abonelerin şarkıların yapay zeka tarafından oluşturulmuş cover ve remixlerini yapmasına izin vereceğini duyurdu.

Okumaya devam et

Haberler

Spotify, Apple Podcasts için HLS video desteği sunacak

Spotify’ın Megaphone ve Spotify for Creators hizmetleri, Apple Podcasts’te yayınlanan podcast’ler için video desteğini sunacak.

Yayınlanma tarihi

=>

Spotify’ın Megaphone ve Spotify for Creators hizmetleri, Apple Podcasts’te yayınlanan podcast’ler için video desteğini sunacak. Apple bu yılın başlarında HLS video desteğini duyurduğunda, bu iki şirket HLS video desteğini açıklamayan tek büyük podcast barındırma platformuydu. Henüz bir fiyatlandırma açıklanmadı. Ancak bu, Spotify’da videoların işleyişini değiştirmiyor: Şirket, videoların Spotify uygulamasında oynatılabilmesi için hâlâ doğrudan yüklenmesini şart koşuyor.

Şirket ayrıca Spotify Video Distribution (podcast barındırma hizmetinizin sizin adınıza videoları doğrudan Spotify’a yüklemesini sağlayan hizmet) için canlı ortaklarını da duyurdu. Libsyn, Podigee, Audioboom, Audiomeans ve Podspace bu özelliği kullanıma sundu. Spotify Video Distribution, Ocak ayında duyurulmuştu; o zaman Acast ve Omny Studio, lansman ortakları olarak öne çıkarılmıştı, ancak henüz yayında değiller. Spotify, SSS bölümünde artık, fikrinizi değiştirirseniz programınızı tekrar sadece ses içeren bir RSS beslemesine geçirebileceğinizi açıkça belirtiyor; ancak şirket, tüm video yüklemelerinizi kaybedeceğinizi uyarıyor.

Okumaya devam et

Haberler

Spotify, yapay zeka tarafından üretilen kişiselleştirilmiş ses içeriklerinin merkezi olmayı hedefliyor

Spotify, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanılarak ve yine Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturulabileceğini ve daha sonra dinlemek üzere Spotify’a aktarılabileceğini duyurdu.

Yayınlanma tarihi

=>

Son birkaç yıldır, Google’ın NotebookLM, Hero ve son zamanlarda Adobe Acrobat gibi uygulamaları, kullanıcılara belgeler, günlük programlar ve makaleler gibi mevcut materyallere dayalı podcast’ler oluşturma olanağı sağladı. Şimdi Spotify da bu podcast’lere uygulaması içinden erişmenize izin veriyor, ancak bunu yapmak için bazı programlama araçlarına ihtiyacınız olacak.

Şirket, OpenAI’nin Codex’i, Anthropic’in Claude Code’u veya OpenClaw gibi bir araç kullanıyorsanız, Spotify’ın beta aşamasındaki yeni CLI aracını kullanarak podcast oluşturabileceğinizi ve daha sonra dinlemek üzere Spotify’a aktarabileceğinizi belirtti.

Şirket bir blog yazısında, “İnsanlar şimdiden asistanlarını kullanarak günlerini yönlendiren kişisel ses kayıtları oluşturmaya başladılar: sınav öncesi ders notlarının özetlerinden takvimlerindeki etkinliklerin bilgilendirmelerine kadar. Ve zaten her şeyi dinledikleri Spotify’da bunları da dinlemenin bir yolunu istiyorlar” dedi .

Podcast’ler, kolay erişim için kullanıcının Spotify kütüphanesinde görünecek ancak diğer Spotify kullanıcıları tarafından erişilemeyecek.

Yeni özellikten yararlanmak için kullanıcılar aracın GitHub sayfasına gidip oradaki talimatları takip edebilirler. Ardından, bir tarayıcı aracılığıyla Spotify hesaplarına giriş yapmaları istenecektir.

Bundan sonra, “Bana Dünya Kupası’nın tarihine derinlemesine inen, önemli oyuncular, nerede düzenlendiği ve bu yılki maçlar hakkında bilmem gerekenler hakkında detaylar içeren bir ses kaydı oluşturun” gibi bir istek yazabilir ve ajansdan bir podcast oluşturmasını ve Spotify’a kaydetmesini isteyebilirler. Kullanıcılar ayrıca podcast’lerinin Spotify listesine bir bağlantı da alacaklardır.

Kaynak: Ivan Mehta / TechCrunch

Okumaya devam et

En son