Bizimle iletişime geçin

Haberler

Google, Android Auto ile Gemini’yi aracınıza getiriyor

Google, şirketin 2025 I/O geliştirici konferansı öncesinde Android Show’da yaptığı açıklamaya göre, önümüzdeki birkaç ay içinde Android Auto’yu destekleyen tüm otomobillere üretken yapay zekası Gemini’yi getiriyor.

Yayınlanma tarihi

on

Google, şirketin 2025 I/O geliştirici konferansı öncesinde Android Show’da yaptığı açıklamaya göre, önümüzdeki birkaç ay içinde Android Auto’yu destekleyen tüm otomobillere üretken yapay zekası Gemini’yi getiriyor.

Şirket blog yazısında Gemini işlevselliğinin Android Auto’ya ve bu yılın ilerleyen dönemlerinde Google’ın yerleşik işletim sistemini çalıştıran otomobillere eklenmesinin sürüşü “daha üretken ve eğlenceli” hale getireceğini söylüyor.

Otomobiller için Android Başkan Yardımcısı Patrick Brady, konferans öncesinde medya mensuplarıyla yaptığı sanal brifingde “Bu gerçekten de araç içi deneyiminde çok çok uzun zamandır gördüğümüz en büyük dönüşümlerden biri olacak” dedi.

Gemini, Android Auto deneyiminde iki ana şekilde ortaya çıkacak.

Gemini çok daha güçlü bir akıllı sesli asistan olarak görev yapacak. Sürücüler (veya yolcular – Brady, Android Auto deneyimini çalıştıran telefonun sahibi ile ses eşleştirmesi yapmadıklarını söyledi) Gemini’den mesaj göndermesini, müzik çalmasını ve temelde Google Asistan’ın zaten yapabildiği her şeyi yapmasını isteyebilecekler. Aradaki fark, Gemini’nin doğal dil yetenekleri sayesinde kullanıcıların komutlarında bu kadar robotik olmak zorunda kalmayacak olmaları.

Gemini ayrıca bir kişinin kısa mesajları belirli bir dilde almayı tercih edip etmediği gibi şeyleri “hatırlayabilir” ve kullanıcı için bu çeviriyi gerçekleştirebilir. Ve Google, Gemini’nin en sık yapılan araç içi teknoloji demolarından birini yapabileceğini iddia ediyor: planlanan bir rota boyunca iyi restoranlar bulmak. Elbette Brady, Gemini’nin daha spesifik taleplere (“vegan seçenekleri olan taco mekanları” gibi) yanıt vermek için Google listelerini ve incelemelerini inceleyebileceğini söyledi.

Gemini’nin ortaya çıkmasının diğer ana yolu ise Google’ın “Gemini Live” adını verdiği, dijital yapay zekanın aslında her zaman dinlediği ve her konuda tam sohbetlere katılmaya hazır olduğu bir seçenek. Brady, bu sohbetlerin bahar tatili için seyahat fikirlerinden, 10 yaşındaki bir çocuğun seveceği yemek tarifleri için beyin fırtınası yapmaya ve “Roma tarihine” kadar her konuda olabileceğini söyledi.

Tüm bunlar kulağa biraz dikkat dağıtıcı geliyorsa, Brady Google’ın öyle olmayacağına inandığını söyledi. Doğal dil yeteneklerinin Android Auto’dan belirli görevleri daha az zahmetle yapmasını istemeyi kolaylaştıracağını ve bu nedenle Gemini’nin “bilişsel yükü azaltacağını” iddia etti.

İnsanların otomobil şirketlerinin dokunmatik ekranlardan uzaklaşıp fiziksel düğme ve butonları geri getirmeleri için yaygara kopardığı bir dönemde bu iddiayı ortaya atmak oldukça cesurca.

Hâlâ çözülmesi gereken çok şey var. Şimdilik Gemini, hem Android Auto’da hem de Google Built-In’e sahip araçlarda çalışmak için Google’ın bulut işlemesinden yararlanacak. Ancak Brady, Google’ın otomobil üreticileriyle “[Gemnini’nin] uçta çalışabilmesi için daha fazla hesaplama yapmak üzere” çalıştığını ve bunun yalnızca performansa değil, aynı zamanda güvenilirliğe de yardımcı olacağını söyledi – bu, birkaç dakikada bir yeni baz istasyonlarına bağlanabilecek hareketli bir araçta zorlu bir faktör.

Modern otomobiller ayrıca yerleşik sensörlerden ve hatta bazı modellerde iç ve dış kameralardan çok sayıda veri üretiyor. Brady, Google’ın Gemini’nin bu çok modlu verilerden yararlanıp yararlanamayacağı konusunda “açıklayacak bir şeyi olmadığını” ve “bu konuda çok konuştuklarını” söyledi.

“Arabalarda giderek daha fazla kamera olduğu için, gelecekte burada gerçekten çok ilginç kullanım durumları olacağını kesinlikle düşünüyoruz” dedi.

Android Auto ve Google Built-In’deki Gemini, şirketin üretken yapay zeka modeline zaten erişimi olan tüm ülkelere gelecek ve 40’tan fazla dili destekleyecek.

Kaynak: TechCrunch

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Danimarka, insanların kendi özelliklerini telif hakkıyla korumayı planlıyor

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. Bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Yayınlanma tarihi

=>

Danimarka hükümeti, vatandaşlarına kendi bedenleri, yüz özellikleri ve sesleri üzerinde hak sahibi olmalarını sağlamak için telif hakkı yasasını değiştirmeye hazırlanıyor. The Guardian’ın haberine göre, bu dönüm noktası niteliğindeki yasa, deepfake’lerin oluşturulması ve yayılmasına karşı korumayı güçlendirmek için tasarlandı.

Danimarka Kültür Bakanlığı, mevcut yasayı değiştirmek için bir öneri sunması gerekse de, kurum şimdiden tüm partilerin desteğini almayı başardı.

Danimarka Kültür Bakanı Jakob Engel-Schmidt, The Guardian gazetesine verdiği demeçte, “Tasarıda, herkesin kendi bedeni, kendi sesi ve kendi yüz özellikleri üzerinde hak sahibi olduğu konusunda hemfikiriz ve bu konuda net bir mesaj veriyoruz. Ancak mevcut yasa, insanları yapay zeka ile üretilen içeriklere karşı bu şekilde korumuyor” dedi.

ABD’de, birkaç eyalet, seçimler sırasında kötüye kullanım ve rıza dışı cinsel içerikle ilgili derin sahtecilik yasalarını kabul etti. Kongre, eyaletlerin yapay zekayı 10 yıl boyunca düzenleme yetkisini elinden alacak yeni bir bütçe uzlaşma tasarısını değerlendirirken, bu yasaların çoğu şu anda risk altında.

Kaynak: TechCrunch

Okumaya devam et

Haberler

Meta, ses klonlama girişimi Play AI’ı satın almaya hazırlanıyor

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Yayınlanma tarihi

=>

Meta, yapay zeka araştırma yetenek havuzunu güçlendirmenin yanı sıra, tüketiciye yönelik yapay zeka özelliklerini de geliştirmeye istekli görünüyor. Bloomberg’in haberine göre şirket, Play AI adlı bir ses klonlama girişimini satın almak için görüşmeler yürütüyor.

Habere göre teknoloji devi, girişimin teknolojisini satın almayı ve bazı çalışanlarını bünyesine katmayı hedefliyor.

Play AI, web sitesine göre, herkesin müşteri hizmetleri gibi AI destekli kullanım durumları için kullanabileceği farklı türde sesleri klonlamasına olanak tanıyor. Crunchbase’e göre, bu girişim toplamda 23,5 milyon dolar fon topladı ve yatırımcıları arasında 500 Global, Kindred Ventures, Race Capital ve Soma Capital bulunuyor.

Meta şu anda sosyal platformlarındaki içerik oluşturucuların kendi sohbet robotlarını oluşturmalarına izin veriyor ve Meta AI sohbet robotuna video düzenleme özellikleri ekledi. Bir ses girişimini satın almak, şirketin yaratıcı paketine ses özellikleri eklemesine olanak tanıyacak.

Meta ve Play AI haberlere ilişkin yorum yapmadı.

Kaynak: TechCrunch

Okumaya devam et

Haberler

ElevenLabs, yapay zeka özelliklerine sahip mobil uygulamasını başlattı

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android için kullanıcıların hareket halindeyken metinden ses klipleri oluşturmasına olanak tanıyan, etiketler aracılığıyla ifade kontrolü ve popüler içerik oluşturma uygulamalarıyla sorunsuz entegrasyon sağlayan en yeni v3 alfa metinden sese modellerine erişim sunan bağımsız bir mobil uygulama başlattı.

Yayınlanma tarihi

=>

Sesli yapay zeka şirketi ElevenLabs, iOS ve Android kullanıcılarının metinden ses klipleri oluşturmasına olanak tanıyan bağımsız bir mobil uygulama yayınladı.

Şimdiye kadar, ElevenLabs’ın yapay zeka destekli ses kütüphanelerini kullanarak örnekler üretmeniz gerekiyorsa, web uygulamasına güvenmek zorundaydınız. Şimdi hareket halindeyken klipler üretmek için mobil uygulamasını kullanabilirsiniz.

ElevenLabs mobil uygulaması, hareket halindeki içerik üreticiler için tasarlanmış şık ve sezgisel bir arayüzde güçlü AI ses üretme özelliklerini bir araya getiriyor. Kullanıcılar, 70’den fazla dilde binlerce gerçekçi sese erişebilir ve yaş, aksan ve stil filtreleri kullanarak her projeye en uygun sesi bulabilir. Uygulama, stadyum tezahüratlarından ince komedi zamanlamalarına kadar her ses klibini olağanüstü derecede insan sesine benzeten, benzeri görülmemiş bir duygusal aralık ve ifade kontrolü sunan son teknoloji Eleven v3 modelini içeriyor.

Uygulamayı diğerlerinden ayıran özellik, özelleştirme seçenekleri ve sorunsuz iş akışı entegrasyonu. Kullanıcılar, hayal ettikleri sesi tam olarak elde etmek için hız, kararlılık ve stil gibi ses parametrelerini ince ayar yapabilirler. Tek dokunuşla dışa aktarma özelliği sayesinde, oluşturulan sesler CapCut, TikTok, Instagram ve YouTube Shorts gibi popüler içerik oluşturma platformlarında anında paylaşılabilir. Uygulama, kullanıcıların ElevenLabs hesaplarıyla senkronize olarak, kişisel ses klonları, kaydedilmiş favoriler ve web platformundaki önceki içerikler dahil olmak üzere tam ses kitaplığına erişim sağlıyor. Ücretsiz kullanıcılar, mobil ve web uygulamaları arasında paylaşılan kredi limitleri ile ayda yaklaşık 10 dakika ses oluşturma hakkı elde ediyor.

V3 Alpha İfade Kontrolleri

Eleven v3 (alpha), satır içi ses etiketleri aracılığıyla ses ifadesinde benzeri görülmemiş bir kontrol sağlayarak AI konuşma sentezinde devrim yaratıyor. Önceki modellerden farklı olarak, v3 kullanıcıların [fısıldar], [güler], [kızgın], [heyecanlı] ve [iç çeker] gibi duygusal ipuçlarını doğrudan metne yerleştirerek performansları yönlendirmelerine olanak tanıyor ve doğal duygusal geçişlerle olağanüstü insan benzeri bir sunum yaratıyor. Bu etiketler birleştirilebilir (örneğin, “[mutlu][bağırır] Başardık! [güler]”) birleştirilerek, AI ses teknolojisiyle daha önce imkansız olan nüanslı performanslar elde edilebilir.

Modelin gelişmiş mimarisi, tüm duyguları ve ses efektlerini destekleyerek, ince ton değişikliklerinden cümle ortasında dramatik performans değişikliklerine kadar her şeyi mümkün kılıyor. v3, önceki sürümlerden daha fazla hızlı mühendislik gerektirse de, sesli kitaplar, videolar ve etkileşimli medya gibi uygulamalarda olağanüstü gerçekçilik sağlıyor. Gerçek zamanlı üretim ihtiyacı olan kullanıcılar için ElevenLabs, v3’ün gerçek zamanlı sürümü kullanıma sunulana kadar v2.5 Turbo veya Flash modellerini kullanmaya devam etmelerini öneriyor. Şirket, arayüzü üzerinden erişen self servis kullanıcılar için 2025 Haziran sonuna kadar v3 kullanımında %80 indirim sunuyor.

Çapraz Platform Entegrasyon Yetenekleri

ElevenLabs, geliştiricilerin AI ses teknolojisini çeşitli uygulamalara sorunsuz bir şekilde entegre etmelerini sağlayan, birden fazla platformda sağlam entegrasyon yetenekleri sunuyor. Platform, geliştiricilerin ses özelliklerini hızlı bir şekilde uygulamaya koyarken, kurumsal düzeyde güvenlik için GDPR ve SOC II uyumluluğunu koruyan Python ve TypeScript SDK’ları sağliyor. Kodsuz çözümler arayanlar için Albato, Make ve Appy Pie Automate gibi hizmetler, programlama uzmanlığı gerektirmeden ElevenLabs’ı yüzlerce popüler uygulamaya bağlamayı mümkün kılıyor.

Şirketin Konuşma Yapay Zeka teknolojisi, Salesforce, HubSpot ve Gmail gibi hizmetlere bağlanmak için Çok Kanallı Protokolü (MCP) destekleyen 11ai’nin tanıtımıyla entegrasyon olanaklarını daha da genişletti. Mobil uygulama entegrasyonu, geliştiricilerin önceden hazırlanmış sesler arasından seçim yapabileceği veya mobil uygulamalar için kendi seslerini özelleştirebileceği konuşma AI oyun alanı aracılığıyla kolayca gerçekleştirilebilir. Bu entegrasyon seçenekleri, ElevenLabs’ı web, mobil ve telefon kanallarında gerçekçi AI tarafından üretilen seslerle ürünlerini geliştirmek isteyen işletmeler için çok yönlü bir seçim haline getiriyor.

Kaynak: Perplexity

Okumaya devam et

En son