OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses...
Gemini'nin yeni "Sesli Genel Bakış" özelliği, belgeleri ve sunumları podcast tarzı özetlere dönüştürüyor ve burada yapay zeka tarafından oluşturulan iki moderatör içeriği tartışıyor ve özetliyor.
YouTube genel olarak podcast dinlemeye hakim olsa da, Transistor.fm'in son anketi Z Kuşağının Spotify'ı güçlü bir şekilde tercih ettiğini (%56) ve video yerine yalnızca ses formatlarını...
Z kuşağı podcast yayıncıları için önemli bir dinleyici kitlesini oluşturuyor; ancak hakkında çokça konuşulan bu kuşağın alışkanlıkları, ilgileri, motivasyonları önceki kuşaklardan büyük farklılık gösteriyor. Headliner'ın bu...
Stability AI ve Arm, Stable Audio Open modelini telefon işlemcilerinde çalışacak şekilde optimize ederek doğrudan mobil cihazlarda çevrimdışı ses üretimine olanak sağladı.
Podcast kayıt ve düzenleme platformu Podcastle, Asyncflow v1.0 adlı kendi yapay zeka modelini yayınlayarak yapay zeka destekli, metinden konuşma rekabetine katıldı. Geliştiriciler için bir API de...
Kısa bir süre önce 180 milyon dolarlık bir mega fonlama turu gerçekleştiren yapay zeka girişimi ElevenLabs, öncelikle ses üretme becerisiyle tanınıyor. Şirket, Scribe adlı ilk bağımsız...