Netflix Nedir? Netflix Big Data’dan Yararlanma ve Veri Madenciliği

Oğuzhan Mallı

Yetkili Kişi
Genel Yönetici
Kayıt
6 Şubat 2015
Mesajlar
549
Tepkiler
435
Meslek
Nükleer ve Atom Mühendisi
Üniv
MEPhI, KTÜ
Yazıma başlamadan önce blog bölümünde daha önce yazdığım big data ve big data stratejisi, Büyük Veri Stratejisi yazısını okumanızı öneririm.

NetFlix
, akan video yayını sektöründe online DVD kiralama yapan ve kurulduğu günden bu yana müşterilerinin izleme modelleri hakkında önemli saptamalar elde ederek çalışmalarını sürdüren bir şirkettir. Bu saptamalar, onların öncelikle olarak ne izlediklerini, ne zaman izlediklerini, hangi cihazlardan izlediklerini gibi önemli noktaları bilmelerini sağlamaktadır. NetFlix başlangıçta, sahip olduğu bu büyük veriyi abonelerinin tavsiye ettiği film ve televizyon şovlarından elde etmiştir. Ancak rakipler arasında filmlerin ve şovların yayın hakları için artan rekabet sonucunda NetFlix orijinal program yapmaya karar vermiştir. Ardından “House of Cards” adlı dizinin 1. ve 2. sezonunun tüm haklarını 100 milyon dolara kendine bağlamıştır. Bu girişimi yapmadan önce bu dizinin takipçilerinin, aktör ve yönetmenin hayranlarının tepkilerini ölçerek hakaret etmiş ve başarılı olacağına karar verip adımlarını atmıştır.

netflix.jpg

Bazı sektör gözlemcileri, NetFlix’in abonelerin izleme alışkanlıklarını ölçerek iş yapmalarını gizlilik yasaları açısından yanlış olduğunu düşünüyordu. Bir kısmı ise NetFlix’in şöhretinin, Amazon Web Servisi’nin yanında hizmet dışı kalması konusunda endişe duyuyordu. Analistler, orijinal programlama konusunda NetFlix’in güvenilir bir imaj yaratabilecek finansal güce sahip olup olmadığı konusunda endişe yaşarken, bir kısım gözlemci de NetFlix gibi izleyicinin izleme alışkanlıklarından yola çıkarak farkındalıklarını arttırmak zorunda olan şirketlerin, yazarların ve yönetmenlerin yaratıcı düşüncelerinden etkilenerek işlerini gerçekleştirmeleri gerektiğini düşünmektedir.

NetFlix Şirket Geçmişi

NetFlix, 1999 yılında, aylık abonelik esasına göre sınırsız kiralama sağlayan DVD abonelik hizmetine başlamıştır. 2000 yılında, tüm NetFlix abonelerinin film yorumlarına ve filmleri derecelendirme durumlarına göre tercihlerini tahmin eden mekanizmayı hayata geçirmiştir. 2007’nin sonlarına doğru, günlük 1,6 milyon DVD nakliyesine ulaşılmıştır. Giderek küreselleşen NetFlix, 2013 yılında, yurtiçi yayın, uluslararası yayın ve yurtiçi DVD hizmeti olarak 3 alanda faaliyetlerini göstermeye başlamıştır.
DVD hizmeti sağlanırken ABD’nin posta abonelik servisinden yararlanılmaktadır. Yayın hizmetinde ise NetFlix, kullanıcılarına “stream” filmleri ve televizyon programlarını bilgisayarlarından, televizyonlarından ve akıllı cihazlarından izleme olanağı vermektedir. 2012 yılının sonunda ABD’de 27.15 milyon, dünyanın diğer yerlerinde ise 6.12 milyon aboneye ulaşmıştır. Mart 2013 itibariyle, yaklaşık 40 ülkeden olan kullanıcıların ayda yaklaşık 1 milyar saate yakın izleme yaptığı görülmüştür.

NETFLİX’DE Büyük Veri

NetFlix, internet dünyasında uygulamış olduğu “Big Data” yaklaşımı ile başarıları beraberinde getirmektedir. Geçmişten bu yana bilgi sayısı giderek artış göstermiştir, hatta son yıllarda katlanarak günümüze gelmiştir. Bilgi sayısının artmasıyla birlikte yanlış bilgi yüzdesi de artış göstermiştir. Bu da bilgi çöplüğü kavramının oluşmasına neden oldu. Birçok yazılım şirketleri bu konuyla ilgili araştırma ve geliştirme çalışmaları yaptıktan sonra ortaya Big Data (Büyük Veri) durumu karşımıza çıkmıştır. Büyük veri; toplumsal medya paylaşımları, ağ günlükleri, bloglar, fotoğraf, video vb. gibi farklı kaynaklardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime dönüştürülmüş biçimine denmektedir.

Büyük veri, doğru analiz metotları ile işlendiğinde firmaların stratejik kararlarını daha doğru bir biçimde almalarına, olası risklerini daha iyi yönetmelerine ve yenilik yapmalarına imkân sağlayabilmektedir. Büyük veri geleneksel database araçları ve iterasyonları ile işlemesi zor olan bu devasa verinin oluşturulması, saklanması, sürecin akışı, analiz edilmesi, yorumlanması gibi birçok konuyu içeren bir terim olarak karşımıza çıkmaktadır.

netflix nedir.jpg


Abonelerin İzleme Modellerini Takip Etme

NetFlix, izleyicilerin yaptığı iyi ya da kötü bütün derecelendirmeleri sürekli olarak takip etmiştir ardından konum verileri, cihaz verileri ve sosyal medyadaki uyarıları da elindeki büyük veriye eklemiştir. Böylelikle, abonelerin ne zaman hangi cihazdan ne izlediğine dair verileri, izledikleri şeyi kaç kere durdurduğunu, kaç kişinin izlediği şeyi tamamlamadan bıraktığını, kimlerin sürekli izleyici olduğunu gösteren verileri elde edebilmektedir. NetFlix’in içerik şefinin yaptığı açıklamaya göre DVD’lerden elde edilen veriler de onlara tüm bunların cevabını vermektedir. Eş zamanlı yayın sayesinde istenilen bilgilere kolaylıkla ulaşılabilmektedir.

İzleyicilerin tercihlerini ölçerken NetFlix, yapılan derecelendirme sistemini, izleme listelerini de dikkate almaktadır. Bu veriler, hangi tür filmlerin ya da şovların daha çok tercih edildiğini onlara göstermektedir. NetFlix’in uyguladığı bu yöntemler ve verilerin bu ölçüde başarılı kullanımı ile kullanıcı isteklerine uygunluk giderek artmıştır.

Veri ve Algoritma Envanteri

2012 yılı haziran ayı itibariyle, eş zamanlı yayın servisi kullanıcısı 25 milyon aboneye ulaşmıştır. Bu kullanım göz önüne alındığında, NetFlix yıllardır gerçekleşen derecelendirme sistemini kaydeden, her filmin 3 kopyasını elinde bulunduran, kapsamlı abone hesap bilgilerini içeren, sesleri, altyazıları bünyesinde barındıran büyük bir veritabanına sahiptir.

Bigdata adı altında abonelerin izleme tercihleri, alışkanlıkları, yaptıkları derecelendirmeleri gibi bilgilerin toplanması, oluşturulan bir algoritma ile anlamlı hale getirilmiştir. Bu algoritma birden fazla kaynaktan yararlanırken birçok farklı davranışlarına cevap vermektedir. En önemli kaynaklarından biri, izleyicilerin yaptığı derecelendirme(rating) sistemidir. Bu derecelendirme sistemi de izleyicilerin davranışlarına göre ağırlıklandırılmaktadır.

Kişiselleştirilmiş Tavsiyeler

NetFlix, abonelerine, oluşturulan algoritmayla beraber önceki izlediklerinden, izleyici davranışlarından, diğer kullanıcıların yorumlarından yola çıkarak izleme önerileri sunmaktadır. İzleyicilerin sipariş ettiği DVD’leri değerlendirerek ya da eş zamanlı olarak izlediklerine bakarak potansiyel ilgi alanlarına göre, sonradan izlemek üzere film ya da program hatırlatmaları yapmaktadır. Bu şekilde birçok yeni sipariş almaktadır ve aboneler izledikleri program ya da film bittiğinde hemen ardından başka bir şey izleyebilmektedir.

NetFlix ana sayfası her abone için kişiselleştirilebilir özelliğe sahiptir. Filmler ya da videolar ana sayfada yatay olarak dizilmiştir ve her yatay grubun anlamlı bir etiketi vardır. Kişiselleştirmede ortaklığı sağlayan etiketlerden biri “tür”dür (komedi, drama). Kullanıcının son izledikleri, derecelendirdikleri, yarıda izlemeyi kestikleri bu sayfada listeler halinde yer almaktadır.

Kendi Veri Merkezinden Amozon WEB Servisine (AWS) Geçiş

Araştırmacılara göre, 2009 yılında, NetFlix’in bigdata yetenekleri, bulut programlama destekli Amazon Web Servis bilişim sistemi altyapısına geçişi hız kazanmıştır. Bunun nedenlerinden biri, eş zamanlı video yayınında giderek artan talebin yakalanamayacak düzeye doğru gitmesidir. AWS’nin sunduğu Simpel Storage Service, güvenli olması ve statik verilerin webe sorunsuz olarak ulaşmasını sağlamaktadır. NetFlix, tüm içeriğini S3’te tutup kullanıcıya AWS’den aldığı bütünleşik hizmetlerle birlikte bu içeriği sunmaktadır. NetFlix gibi hali hazırda yüklü içeriği olmayan ancak belli dönemlerde trafiği artan platformlar için de AWS “kullandığın kadar öde” sistemi sayesinde tercih edilen bir çözüm olmaktadır. Esnek sunucu sistemi sayesinde sabit bir bilgi işlem gücünün yanı sıra fazla yüklemenin olabileceği belli dönemlerde, değişen ihtiyaca ve talebe göre kendini ayarlayabilen bir web sitesi, AWS ile mümkün olabilmektedir.

Hadoop, sıradan sunuculardan oluşan küme üzerinde büyük verileri işlemek amaçlı uygulamaları çalıştıran Java ile geliştirilmiş açık kaynaklı bir yazılımdır. NetFlix, bu yazılım desteğini de Amazon üzerinden sağlamaktadır. Kasım 2012 itibariyle, AWS, NetFlix’in depolama ve hesaplama gereksinimlerinin %95’ini yönetir hale gelmiştir. NetFlix’in bulut tabanlı Hadoop mimarisi ise aşağıdaki gibidir:

NETFLİX İçin Orjinal İçerik İhtiyacı

NetFlix’in 2011 yılındaki hedeflerinde, filmlerin ve TV dizilerinin canlı veya banttan yayınlandığı platformlar arasında en yüksek gelire sahip olma gibi bir hedefi yoktu. Hatta NetFlix dizilerin ya da filmlerin yayınlandıktan çok sonra ulaşmak isteyen izleyiciler için oluşturulmuş bir platformdu.
İçerik sahiplerinin telif hakları yüzünden istedikleri yüksek miktarlar ve HBO, Comcast gibi güçlü yapımcıların NetFlix ile sözleşmelerini iptal etmesi yüzünden, NetFlix kullanıcılarına az miktarda içerik sunabilmiştir. NetFlix içerik yöneticisi ”Farkına vardık ki içerik tedariği hakkında beklentilerimiz gerçekçi ve güvenilir değilmiş.” Sözleriyle mevcut durumu açıklamıştır. Öte yandan NetFlix Google, Apple ve birçok girişimci şirketlerle öncelikle içerik bulma konusu olmak üzere rekabet içerisine girmişti. Bunun üzerine NetFlix CEO’su ReedsHastings kendi TV dizilerini yaratmak için finansman oluşturabileceklerine karar verdi. Böylece orijinal içerik yaratarak güvenirlik ve sürdürülebilirlik sağlayacaklarına kadar kıldılar.

House Of Card'ın Oluşumu

Şovun Tanımı

Netflix, yaklaşık 29 milyon kullanıcısının dizi ve film tercihleri, yorumları, sevdiği aktörleri, kategorilerini gibi birçok veriyi elinde bulundurmaktaydı.

Bu veriler doğrultusunda, NetFlix kullanıcılarına birçok içerik sağlayıp bunlardan bazılarının başarı sağlamasını hedeflemek yerine abonelerinin tercihleri ve hareketleri doğrultusunda bir içerik oluşturmaya karar verdi. Bunun sonucunda BBC yapımı House of Cards’ın David Fincher ve KevinSpacey birlikteliği ile tekrardan çekilmesi fikri ortaya çıktı. Şirket siyasi entrikaları konu alan bu diziye çok güveniyordu ve diğer yapımcıların aksine hiçbir tanıtım yapmadan 2 sezonluk 26 bölümü toplu halde 100 milyon dolarlık bir bütçe ile yeniden çekmiştir.

Dizi 1 Şubat 2013 yılında ve TV dizileri tarihinde bir ilk yaşatarak birinci sezonun bütün bölümlerini yayınlayarak boy göstermiştir.

Sonuçlar

Sosyal medya analistliği yapan firmalara göre, House of Cards hakkında yayınlandığı ilk gün yaklaşık %62’si olumlu yönde olan 10.000 yorum girilmiş, saatte 1000 kez görüntülenmiş, kullanıcılar tarafından 10 üzerinden 9 puanla değerlendirilmiştir.

Ayrıca Youtube kanalı üzerinden House of Cards sayesinde 3 hafta içerisinden 1 milyon kişiye ulaşan NetFlix’in bu sayede pazarlama bütçesi payını büyüttüğü belirtilmiştir.
Şubat 2013’te NetFlix yayını yapılan ülkelerde en çok izlenen dizinin House of Cards olduğu açıklanmıştır. Oluşan bu tablo sayesinde NetFlix’in güvenilirliği ve pazarlık yapma gücü önemli bir gelişme göstermiştir.

Başarının Arkasındaki Sebepler

House of Cards’ın başarısı tesadüfi bir şekilde değil gerçek zamanlı şekilde programı kullanan kişilerden toplanan verilerin analiz edilmesi sonucu oluşmuştur. NetFlix yöneticileri BBC'nin 1990 yapımı House of Cards dizisini sevenlerin aynı zamanda KevinSpacey’nin oynadığı filmleri sevdikleri ve David Fincher’ın yönetmenliğini yaptığı filmlere ilgi duyduklarını ve politik dizileri sevdikleri bilgisine ulaşmışlardı.
Bu sebeplerden ötürü House of Cards dizisinin lisans hakları için HBO ve AMC gibi köklü, geleneksel medya kanallarını geride bırakacak bir teklifte bulunarak başrolde
KevinSpacey’in olduğu, yapımcının/(ara ara) yönetmenin David Fincher House of Cards'ın yeniden çekilmesine karar vermişlerdir.
Sinema endüstrisi de Netflix’in uyguladığı kullanıcı odaklı veri kullanımını birçok alanda geliştirerek kullanmaya başlamıştır. Kişinin öncelikleri ve tercihleri doğrultusunda öneriler yaparak doğru ürünü doğru kullanıcıya ulaştırmayı sağlamışlardır.

big data nedir.jpg


Netflix Big DATA'dan Nasıl Faydalandı


Haziran 2012 itibariyle 25 milyondan fazla kullanıcıya, günlük 4 milyonluk sayfa görüntüleme sayılarına erişebilen NetFlix, sadece sevdiğiniz dizileri, yönetmenleri karşılaştırmakla kalmıyor; aynı zamanda seyrettiğiniz videoyu hangi dakikada durduğunuzu, ara vermenizi ve ara verdikten sonra diziye geri dönüp dönmediğinizi de inceleyebiliyor. Bu da NetFlix’in elinde analiz edebileceği çok yüksek miktarda veri bulunduğunu belirtmektedir. Sandaros verilerin kullanımı bazlı karar mekanizmasının faydasını “ Ulaşılabilir bir kitleye sahip olmaktan öte, onların kim olduğunu biliyorum.” şeklinde belirtmiştir.
Araştırmalara göre geleneksel stüdyoların feedback mekanizmaları olmamasının dezavantajından dolayı milyarlarca dolarlık yatırımları boşa harcamaktadırlar. 2011 yılında 43 tane büyük bütçeli yeni dizinin yaklaşık üçte ikilik bir kısmı yeterli reytingi alamadıkları için piyasadan çekildikleri belirlenmiştir. Netflix iyi stratejisi sayesinde pazarlamaya büyük bütçeler ayırmamıştır. Kullanıcının içeriği bulması yerine, içeriklerin doğru kullanıcılara ulaştırılması hedeflenmiştir. Kullanıcı davranışlarına ve tercihlerine göre yazılan bu algoritma sayesinde eldeki veriler analiz edilerek orijinal içerik üreterek başarı sağlamıştır.

Gelecekte NETFLIX

Netflix, 2013 yılında “HemlockGrove” ve “Arrested Development” gibi popüler dizileri yayınlamaya başlamıştır. “Arrested Development” dizisinin yeni sezon yayını sadece Netflix üzerinden olmuştur. Bununla beraber, Amazon komedi programları denemeleriyle, Microsoft Xbox Live platformundan yaptığı yayınlarla orijinal içerik oluşturma girişiminde bulunmuştur. AWS’ye olan bağlılığı ise uzmanlar tarafından endişe verici bir durum olarak görülmekteydi. AWS’de oluşacak bir sorun doğrudan Netflix üzerinde de etkili olacak ve kullanıcıların rakip firmalara yönelmesine sebep olacaktı. Uzmanlar tarafından diğer bir endişe duyulan konu ise, abonelerin tercihlerini belirlerken başvurdukları yöntemin gizlilik esaslarına uygun olup olmadığıydı.

Netflix, 2006 yılında, izleyici isteklerine uygun tavsiye verme konusunda yarattığı algoritmayı geliştirmek için ödüllü bir yarışma başlatmıştır. Ancak 2010 yılında, bazı kişilerin gizlilik kurallarını ihlal etmeye çalışmasıyla bu yarışma iptal edilmiştir.

Bütün verileri bir kenara bıraktığımızda aslında şu temel soruya focuslanmak gerekiyor: Müşterilerinin datasını analiz edebilen Netflix, tutabilecek formüle sahip dizileri rahatlıkla yayına alabilir. Ancak bu sistem, sürekli olarak daha önce denenmiş, tutacağı kanıtlanmış konseptler üzerine yoğunlaşacağı için, yeni /sıra dışı/ kendine özgü içerik bulma konusunda önümüzdeki yıllar içerisinde sıkıntı çekecek miyiz?
Ayrıca uzmanlar big data kullanımının gelişiminin daha ergenlik çağını yaşadığını belirterek, birçok uygulamada daha akıllı kararların verilmesi için kullanılacağını ve geliştirileceğini belirtmektedir. Ancak diğer bir kesim ise big datanın sunacağı imkânların sınırlı olduğunu belirterek, verilerin sadece neleri sevdiğimizi ortaya döktüğünü gelecekte nasıl davranacağımızı tahmin edemeyeceğini savunmaktadır.
 
Yukarı Alt