OpenAI, ChatGPT'de gerçek zamanlı konuşmalara olanak tanıyan yapay zeka ses özelliği Gelişmiş Ses Modu için, yapay zeka asistanını daha cana yakın hale getirmek ve kullanıcıları daha...
OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses...
Gemini'nin yeni "Sesli Genel Bakış" özelliği, belgeleri ve sunumları podcast tarzı özetlere dönüştürüyor ve burada yapay zeka tarafından oluşturulan iki moderatör içeriği tartışıyor ve özetliyor.
Spotify Sesli Kitaplar (Spotify Audiobooks), bağımsız yazarları Spotify tarafından sesli kitap oluşturma ve yayınlama değerlendirmesi için kısa biçimli hikayeler göndermeye teşvik eden yeni bir web sitesi...
Üretken yapay zeka alanında bugüne kadar odak noktası çoğu metin, görüntü ve daha fazlasını üretmek için kullanılan metin tabanlı arayüzler oldu. Bir sonraki dalga ses gibi...
Yapay zeka girişimi Anthropic, yapay zeka destekli sohbet robotu Claude için ses yetenekleri üzerinde çalışıyor.
Yapay zeka şirketi Sesame, etkileyici derecede gerçekçi sesli asistan Maya'ya güç veren temel modeli yayınladı.
Podcast yayıncıları için önemli bir sorun olan üst üste binmiş sesleri düzenlemek, AudioShake'in geliştirdiği "Multi-Speaker" yapay zeka modeli ile artık mümkün. AudioShake'in üst üste binen sesleri...
OpenAI, geçen yıl Mart ayında sadece 15 saniyelik bir konuşma ile bir kişinin sesini klonlayabileceğini iddia ettiği Voice Engine adlı yapay zeka hizmetinin “küçük ölçekli bir...
Kaliforniya merkezli start-up Sesame AI, daha gerçekçi diyaloglar oluşturmak için mikro duraklamalar, tonlama ve kahkaha gibi kasıtlı kusurları kullanan bir konuşma modeli geliştirdi.