Bizimle iletişime geçin

Haberler

Yapay zeka hakkında herkesin yanlış anladığı şey

Streamyard’da yapay zeka bölümünü yöneten ve halen Zoom kayıtlarını yapay zeka video podcastlerine dönüştüren Katana.video’yu yöneten Sam Bhattacharyya, insanların yapay zekayı gerçekten anlamadığını savunuyor. Podnews’e yazan Bhattacharyya, ChatGPT gibi araçların nasıl çalıştığını, yaratım için ne kadar korkunç olduklarını ve yapay zekanın aslında bize nasıl fayda sağlayabileceğini açıklıyor.

Yayınlanma tarihi

on

Muhtemelen bu toplulukta gerçek bir yapay zeka araştırma geçmişine sahip birkaç kişiden biriyim; birkaç araştırma makalem, patentlerim (biri yayınlanmış, biri beklemede) var, Streamyard’da yapay zeka bölümünün başındaydım ve şu anda ikinci yapay zeka girişimimi yönetiyorum.

Yapay zeka konusundaki beceriksizliği eleştiren bu tür makaleleri göz önünde bulundurduğunuzda, benden yapay zekayı savunmamı veya bir çürütme yapmamı bekleyebilirsiniz.

Şöyle ki, benim “AI” teriminden anladığım şey ile çoğu insanın bu terimden anladığı şey çok farklı ve benim AI hakkındaki temel düşüncem, çoğu insanın onu gerçekten anlamadığıdır.

Yapay zeka tek parça değildir

İnsanlar yapay zekadan sanki tek parçaymış gibi bahsediyorlar ve sosyal medyadaki bu saçmalıkların sorumlusunun “yapay zeka” olduğunu söyleyenleri duyduğumda, bu durum enflasyonun sorumlusunun “matematik” olduğunu söylemek kadar saçma geliyor.

Asıl şikayet ettiğiniz şey, yazılımlarına belirli bir yapay zeka türü entegre eden Midjourney gibi şirketlerin araçlarını kötüye kullanan insanlar. Bu şirketler, ABD Merkez Bankası’nın tahminlerinde matematiği kullandığı kadar yapay zekayı yazılımlarına dahil ediyorlar.

Birçok farklı şey için kullanılan birçok farklı matematik türü olduğu gibi, birçok farklı şey için kullanılan birçok farklı yapay zeka türü de var.

Nasıl çalışırlar?

Günümüzde insanlar yapay zekadan bahsettiğinde genellikle yapay zeka tarafından oluşturulan görüntülerden/videolardan veya ChatGPT gibi Büyük Dil Modellerinden bahsediyorlar.

Çoğu insan için ChatGPT, yardımcı bir asistan gibidir ve detayları bilmenize gerek yoktur, ancak bazen detaylar önemlidir.

Büyük Dil Modelleri, bir cümledeki bir sonraki kelime gibi dili tahmin etmek için kullanılan istatistiksel modellerden dolayı bu şekilde adlandırılır. Hukuk alanında yüksek lisans (LL.M) programlarının aslında süslü bir otomatik tamamlama programı olduğunu duymuş olabilirsiniz ve bu kesinlikle doğru.

Hukuk alanında yüksek lisans (LL.M) programları öncelikle bir cümledeki kelimeleri alıp her bir kelimeyi bir sayı listesine dönüştürerek başlar, ardından bir dizi matematik işlemi yapılır ve sonuçta sözlükteki her kelime için bir sayı olmak üzere 50.000 sayıdan oluşan bir liste elde edilir.

Eğitim, metni alıp, bir kısmını rastgele gizlemeyi ve doğru bir sonraki kelimeye karşılık gelen sayıyı en üst düzeye çıkarana kadar model ağırlıklarını (matematik işlemlerinde kullanılan sayılar) ayarlamayı içerir.

Tam bir sohbet yanıtı oluşturmak için bu modeller boş bir cümleyle başlar ve bir sonraki kelimeyi kelime kelime tahmin eder. Sanki iPhone’unuzda yeni bir mesaj açmışsınız ve bir paragraf yazana kadar otomatik tamamlama önerilerini seçmeye devam etmişsiniz gibi.

Bunun etkisi, olgusal olarak doğru olmasalar bile tutarlı cümleler gibi görünen çıktıları optimize etmektir. Büyük Dil Modelleri o kadar büyük miktarda veri üzerinde eğitilmiştir ki, gerçek olguları öğrenirler. Bu nedenle, “Fransa’nın başkenti ___” yazdığınızda, bu modeller bir sonraki kelime olarak “Paris”i tahmin etmeyi öğrenir.

Fakat bir LLM bir şeyi “bilmiyorsa” bile, yine de bir sonraki jetonu tahmin eder ve doğru olmasa bile sonunda kulağa doğru gelen bir şey uydurur – buna “halüsinasyon” denir.

“Armadillo’nun başkenti ___’dir” diye deneyebilirsiniz. Bu cümleyi tamamlayacak mantıklı bir kelime yok, ancak standart bir Hukuk Yüksek Lisansı (LL.M.) yine de en olası kelimeyi (GPT2 örneğinde “the”) seçecek ve anlamsız bir cümleyi tamamlayacaktır.

Eğer bu, LLM’lerle yaptığınız görüşmelerde açıkça görülmüyorsa, bunun nedeni yapay zeka laboratuvarlarının, modellere geri bildirim sağlamak için on binlerce kişiyi işe almış olmasıdır; böylece modeller iyi e-postalar yazabilir veya çalışan kodlar yazabilir ve aslında yardımsever bir insan asistanı gibi görünebilirler.

Bu, çok zeki ve yardımsever biriyle konuştuğunuz yanılsamasını yaratır ve çoğu kişi bunu genel yeterlilik olarak algılarken, birçok LLM genellikle sadece uydurur.

Bu yapay zeka araçları korkunç

Bunu söylüyorum çünkü Opus Clips gibi yapay zeka araçlarını klipleri bulmak için kullandığınızda, tek yaptıkları şey metni ChatGPT’ye aktarmak ve ondan yaklaşık 30 klip bulmasını istemek oluyor ve bunların çoğu da pek iyi değil.

ChatGPT düzenleme görevleri konusunda eğitilmediği için, genellikle kağıt üzerinde doğru görünen ama pratikte berbat olan yanıtlar üretir. Bir modelden 5 dakikalık bir diyalogda 30 klip bulmasını isterseniz, elbette saçma sonuçlar verecektir.

Geliştiriciler (sizin kadar yapay zeka hakkında bilgi sahibi olanlar) daha sonra bu modeller etrafında pahalı ve halüsinasyonvari sarmalayıcılar oluşturuyorlar ve herkes “yapay zeka mükemmel değil” sonucuna varıyor.

Bütün bunlar bana inanılmaz derecede aptalca ve distopik geliyor.

Gerçek editörler tarafından eğitilmiş, güvenilir ve iyi düzenlemeler üreten bir yapay zeka sistemi kuramayacağınız anlamına gelmiyor. Podcast bölümlerini dinleyebilen veya izleyebilen, sanatsal etki için kesmeler yapabilen veya çekimler seçebilen modeller oluşturmak tamamen mümkün.

Ancak bu gerçek bir yapay zeka araştırması gerektirir ve ChatGPT etrafında bir sarmalayıcı oluşturmak ve bazı pazarlama metinlerine “yapay zeka video düzenleyici” ifadesini eklemek çok daha kolaydır, bu nedenle bu alandaki çoğu şirket bunu yapar.

Bu, internette dolaşan saçmalık kadar tembel bir şey ve bu tür hikayeleri okuduğumda bir yapay zeka şirketi görmüyorum, Eleven Labs’ın bir API’sine bağlanan ve herkesin zamanını ve parasını boşa harcayan bazı aptallar görüyorum.

Daha iyi bir yol

Tamam, fazla eleştirel davrandım, o yüzden podcasting’te yapay zekanın iyi kullanımlarından bahsedelim. Düzenlemeye odaklanacağım çünkü en iyi bildiğim şey bu.

Üretken yapay zekanın iyi iş çıkarabileceği bazı görevler vardır; örneğin, normalde günler sürebilecek bir podcast “giriş” müziği veya animasyonu üretmek veya bir LLM’den bir konuşmanın belirli bir bölümünü bir komutla kaldırmasını istemek gibi.

En iyi haliyle, yapay zeka (en geniş anlamıyla) ya yardımcı olabilir

  • Yaptığınız işi hızlandırın
  • Daha önce yapamadığınız şeyleri yapmanızı sağlar

Muhtemelen dolguları kaldırmak veya klipler oluşturmak için AI araçlarına aşinasınızdır, ancak bu alan hala gelişiyor ve “Ajan tabanlı düzenleme” (bir AI modelinden sizin için düzenleme yapmasını istemek) daha popüler hale geldikçe, (a) düzenleme sürelerinin daha da azalacağını ve (b) düzenleme deneyimi olmayan kişilerin yüksek prodüksiyon değeri olan içerikler ortaya çıkaracağını tahmin ediyorum.

Yapay zeka kodlama araçları, küçük ekiplerin veya hatta bireysel programcıların daha önce yalnızca büyük şirketlerin yapabildiği şeyleri yapmasını mümkün kıldı ve podcast dünyasında yetenekli bireysel içerik oluşturucuların artık daha önce tam bir ekip gerektirecek düzeyde üretim kalitesinde içerik üreteceklerinden şüpheleniyorum.

Şu anda pek çok yapay zeka düzenleme aracı pek iyi olmasa da, piyasa dinamikleri bunların ya gelişeceğini ya da yok olacağını gösteriyor ve ben de kesinlikle kendiminkini geliştiriyorum.

Video podcast’lerinin yükselişine rağmen, birçok sesli podcast yayıncısının videoya geçmekte tereddüt ettiğini biliyorum. Ancak duyduğum en büyük tereddüt, video düzenlemenin getirdiği ek karmaşıklık, ancak düzenleme kolaylaştıkça daha fazla podcast yayıncısının videoya yöneldiğini göreceğinizi tahmin ediyorum. Geçmişte, sesi bir ortam olarak dikkate alan ayrı bir ses düzenlemesi ve videoyu bir ortam olarak kullanan ayrı bir video düzenlemesi oluşturmak çok fazla düzenleme çabası gerektirirdi, ancak otomasyon düzenleme çabasını azaltabiliyorsa, daha fazla podcast’in birden fazla formatı benimsemesinin neden mümkün olmadığını anlamıyorum.

Yapay zekanın düzenlemenize yardımcı olmasıyla, bunun “Ses” veya “Video” olması gerekmiyor; “Evet ve” de olabilir?

Kaynak: Sam Bhattacharyya / PodNews

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

YouTube’tan, yapay zeka nedeniyle çalışanlarına gönüllü işten ayrılma teklifi

Youtube CEO’su Neal Mohan, ürün bölümünü üç gruba yeniden yapılandırırken, video platformundan ayrılmak isteyen çalışanların tazminat almaya hak kazanacağını duyurdu.

Yayınlanma tarihi

=>

YouTube, reklamcılık ve eğlence sektöründe hâlen baskın bir güç olmaya devam ediyor, ancak yapay zekanın yarattığı dönüşüm hiçbir şirketi es geçmiyor.

YouTube CEO’su Neal Mohan Çarşamba günü çalışanlara gönderdiği bir notta, yapay zekanın yarattığı dönüşüm ve fırsatları video platformunu yeniden yapılandırmak için bir neden olarak gösterdi. Yönetici, şirketin ürün ekipleri için yeni bir raporlama yapısı oluşturdu ve şirketten ayrılmak isteyen YouTuber’lara tazminat ödeyen gönüllü çalışan işten ayrılma programını başlattı.

Bir kaynak, değişiklikler kapsamında hiçbir pozisyonun kaldırılmadığını, ancak gönüllü ayrılma programlarının bazen daha sonra yapılacak kesintilerin habercisi olabileceğini belirtti. İşten ayrılma teklifinde bulunma kararı, Amazon’un yapay zekanın yarattığı yıkıcı etkiyi gerekçe göstererek 14.000 kişilik işgücü azaltma planını açıkladığı hafta alındı.

YouTube bundan sonra üç ürün organizasyonuna sahip olacak ve her birinin üst düzey yöneticisi doğrudan Mohan’a rapor verecek.

Abonelik ürünleri Christian Oestlien tarafından yönetilecek ve YouTube TV, YouTube Premium, YouTube Music, Primetime Channels ve diğer iş kollarının denetimini içerecek; Johanna Voolich tarafından yönetilecek izleyici ürünleri, YouTube mobil ve oturma odası uygulamaları, güven ve güvenlik, YouTube Kids, arama altyapısı ve diğer önemli alanlara odaklanacak; içerik oluşturucu ve topluluk ürünleri ise YouTube Shorts ve üretken AI araçları da dahil olmak üzere içerik oluşturucuları desteklemeye odaklanacak. YouTube’un bu organizasyon için yeni bir lider getirmesi bekleniyor.

Mohan, notunda yapay zekayı YouTube için “yeni sınır” olarak nitelendirdi. Bu ayın YouTube ile ilgili kapak hikayesi için The Hollywood Reporter ile yaptığı röportajda Mohan, yapay zekanın nihayetinde insan içerik üreticilerinin hizmetinde olacağını düşündüğü nedenleri açıkladı.

“Yaratıcılık, AI’nın süreci kolaylaştırarak, daha verimli ve hızlı hale getirerek ve aynı zamanda daha güçlü hale getirerek büyük ölçüde yardımcı olacağı bir alan olduğunu düşünüyorum. Bu anlamda, AI ile ilgili vizyonum, AI’nın insan yaratıcılığına hizmet etmesi, insan yaratıcılığını gerçekten güçlendirmesi yönündedir” diyen Mohan, şunları kaydetti:

“Senaryo yazımı alanında çalışıyorsanız ve belirli bir arka plana ihtiyacınız varsa veya belirli bir sekansınız varsa, yapay zeka size birçok şekilde yardımcı olabilir. Senaryonun nasıl olması gerektiği konusunda fikir üretmenize yardımcı olabilir. Arka planı oluşturmanıza yardımcı olabilir. Geçen hafta gördüğünüz gibi, kamerayla çektiğiniz videoya içerik eklemenize yardımcı olabilir.”

YouTube başkanı, “Bence bu tür olasılıkların henüz çok başındayız ve umarım bu, sadece en üstteki yaratıcılar için değil, yaratıcılığın tüm tedarik zinciri için çok daha fazla fırsat yaratır” diye ekledi.

Kaynak: The Hollywood Reporter

Okumaya devam et

Haberler

Spotify, Apple TV uygulamasına nihayet video podcast’leri ekledi

Spotify’ın Apple TV’deki uygulaması, şaşırtıcı bir şekilde, video podcast’lere erişim imkanı sunmuyordu. Spotify uygulamasının tvOS sürümü yeniden tasarlandı ve şarkı sözleri ve sıra yönetimi gibi özellikler eklendi.

Yayınlanma tarihi

=>

Spotify, Apple TV uygulamasının yeniden tasarlanmış bir sürümünü duyurdu. Şirket, bu sürümün “daha hızlı, daha akıllı ve daha görsel bir deneyim sunmak için baştan aşağı yeniden tasarlandığını” belirtiyor. Spotify uygulamasının tvOS sürümü, mobil sürümden de birkaç hoş özelliği bünyesine katıyor, ancak en büyük güncellemeler arasında video podcast’lerin ve müzik videolarının eklenmesi yer alıyor.

Bazı kullanıcılar birkaç gündür bu güncellemeye erişebiliyordu, ancak yeni sürüm artık Apple’ın App Store’undan herkes tarafından indirilebilirken, otomatik güncelleme kullanan cihazlar yeni deneyimi Kasım ortasına kadar elde etmelidir. Spotify’ın tvOS uygulamasının eski sürümünü kullananlar, daha önce Reddit dahil olmak üzere çevrimiçi forumlara girerek, sinir bozucu navigasyondan, uygulamanın Google TV sürümünde uzun süredir bulunan eksik özelliklere kadar her şeyden şikayet etmişlerdi, ancak bu sürümde bu sorunların çözülmüş olduğu görülüyor.

Spotify’da müzik videoları izlemek henüz ABD ve Kanada’da mümkün değil, ancak bu özellik Spotify Premium aboneleri için sınırlı bir katalogla birlikte dünya çapında 97 farklı pazara yayıldı. Dinlediğiniz şarkının Spotify kataloğunda eşlik eden bir müzik videosu varsa, “videoya geç” komutunu kullanarak bu videolara kolayca erişebilirsiniz.

Video versiyonu sunan podcast’ler, yeni Spotify tvOS uygulamasında da benzer şekilde çalışacak ve oynatma hızını ayarlama seçeneği içerecek. Bu ayın başlarında, şirketin podcast stüdyosu, Netflix ve The Ringer ile bir ortaklık kurduğunu duyurdu. Bu ortaklık kapsamında, 2026’dan itibaren The Bill Simmons Podcast ve NFL, NBA, Fantasy Football ve F1’e dayalı programlar da dahil olmak üzere 16 video podcast serisi ABD’deki video akış platformuna getirilecek.

Güncellenen Spotify Apple TV uygulaması, sıra yönetimi, kesintisiz oynatma, şarkı sözleri ve AI kullanarak bir sonraki dinleyecekleri öneren Spotify DJ’e erişim gibi yeni mobil özellikler de ekliyor. Ayrıca, Spotify Connect aracılığıyla akıllı telefonunuzu veya tabletinizi ve mobil uygulamayı kullanarak Apple TV’deki oynatmayı kontrol edebileceksiniz.

Okumaya devam et

Haberler

Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ı duyurdu

Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ın lansmanını duyurdu. Fountain for Podcasters, desteklenen uygulamalara (podcast uygulaması Fountain dahil) video dağıtımı yapıyor ve ayrıca RSS, Lightning ve Nostr gibi açık standartları kullanarak akış ödemelerini ve ücretli abonelikleri destekliyor.

Yayınlanma tarihi

=>

Fountain, yeni bir podcast barındırma hizmeti olan Fountain for Podcasters’ın lansmanını duyurdu. Fountain for Podcasters, desteklenen uygulamalara (podcast uygulaması Fountain dahil) video dağıtımı yapıyor ve ayrıca RSS, Lightning ve Nostr gibi açık standartları kullanarak akış ödemelerini ve ücretli abonelikleri destekliyor.

Fountain’in resmi bloğundaki dtuyuruda şunlar kaydedildi:

En iyi 500 podcast, ABD reklam gelirinin neredeyse yarısını elde ediyor ve geri kalan %99,9’luk kısım para kazanma açısından dezavantajlı durumda kalıyor.

Mevcut platformlar bunu kolaylaştırmıyor. Yüksek ücretler alıyorlar, kötü bir kullanıcı deneyimi sunuyorlar ve hedef kitlenizle olan ilişkilerinizi kontrol altında tutuyorlar.

Podcasts for Fountain’ı, aylık indirmelerinizden bağımsız olarak güvenilir bir gelir akışı oluşturmanıza ve gelişen bir topluluk oluşturmanıza yardımcı olmak için başlattık.

Fountain, RSS, Lightning ve Nostr gibi açık protokoller üzerine kuruludur; böylece içeriğinizin, kitlenizin ve ödemelerinizin her zaman size ait olmasını sağlar.

Fountain ile artık şunları yapabilirsiniz:

  • Podcast’inizi her platformda sorunsuz bir şekilde barındırın ve dağıtın
  • Dinleyici deneyiminizi video, bölümler ve transkriptlerle geliştirin
  • Ücretli bir abonelik başlatın ve üyelere özel avantajlar sunun
  • Abonelikler ve bağışlar için kart ödemeleri alın
  • Birden fazla uygulamada dinleyicilerle etkileşim kurun
  • Hedef kitleniz ve geliriniz için gelişmiş analizlere erişin

Daha fazla ayrıntı için BURAYI ziyaret edebilirsiniz.

Okumaya devam et

En son