Big Data Hakkında Bilmeniz Gereken Herşey

841 0
841 0

Big Data günümüzün online dünyasında en sık duymaya başladığımız kavramlardan biri. Türkçe ‘büyük veri’ anlamı gelen bu kavramın anlamı ve önemi ise geleceğin teknolojilerini belirlemede oldukça etkili.

Big Data kavramı günümüzde internet dünyasıyla özdeşleştiriliyor. Ancak büyük veri kavramının tarihi çok daha eski dönemlere uzanıyor. İlk olarak astronomi alanında kullanılan ‘big data’ kavramı zamanla bugün ifade ettiği anlama evriliyor.

Big Data Nedir?

Big Data kavramını şu şekilde açıklamak mümkün. İnsanların her gün kullandığı sosyal medya hesapları, arama motorları, internet gezintileri sırasında arkalarında bıraktıkları izler ve tekil kullanıcıların internet ile olan tüm etkileşimlerinin bir araya getirildiği devasa veri yığınına Big Data deniliyor. Anlayacağınız attığımız her adım, yaptığımız her tercihle bizler yeni verilere kaynaklık ediyoruz.

Bilgisayarların çantalarımızdan, akıllı telefonların ellerimizden düşmediği 21.yy’da  Big Data denilerek kastedilen veri büyüklüğünü hayal dahi edebilmek mümkün değil. Üstelik her geçen gün artan ve gittikçe bilişim dünyasına yönelen teknolojilerle Big Data’nın inanılmaz bir ivmeyle artıyor olduğunu da kolaylıkla söyleyebiliyoruz. 2012 yılına ait bir veriye göre dünyada bir günde 2.5 kentrilyon byte’lık veri üretilmekteydi. Üstelik bu rakamın 2022 yılında 44 katına çıkması bekleniyor.Big data nedir

 

Big Data Nasıl Toplanır?

Bu veri nasıl toplanıyor sorusunun cevabı ise oldukça açık. İnternete bağlı bir cihazda yaptığınız her şey bu devasa veri yığının bir parçası. En güncel örneklerle, en çok kullandığımız Facebook, Twitter, Instagram ve Foursquare gibi ağlar bizimle ilgili o kadar çok bilgiye sahip ki. İşte bu ağlar yapılan her işlemi bünyesinde kaydederek, o verileri mantıklı birimlere ayırıyor.

Mutlaka başınıza şöyle bir durum gelmiştir. Facebook’ta beğendiğiniz bir manzara resmi veya bir arkadaşınızın beğendiğiniz bir yer bildirimi sonrasında Foursquare size tam da o lokasyonda bir restorantı önermiştir. İşte sizi kısa bir an için çok şaşırtan, ‘Tesadüftür yahu’ dediğiniz şeyin arkasında tam olarak Big Data var. Başka bir örnek ise Google’da arattığınız bir üründen ( örneğin bir ayakkabı) sonra Facebook’da, Instagram’da bu ürünü satan mağazaların reklamlarının çıkması olabilir.

Önceleri bu kadar büyük bir veri yığının nasıl işleneceği, içerisinden nasıl yararlı verilerin çekilebileceği oldukça büyük bir soru işaretiydi. Günümüzde gelinen noktada ise hala daha çözülmesi gereken pek çok sorun olsa da büyük bir ilerleme kaydedildiği ise reddedilemez bir gerçek.

Her Veri Big Data Olarak Görülebilir?

Bu soruya cevabımız hem evet, hem de hayır. Kimi tanımlamalarda Big Data filtrelenmemiş veriyi sembolize ederken, kimi yaklaşımlar ise bir verinin Big Data olabilmesi için 6V kriterini sağlaması gerektiğiniz belirtir. Bu kriterler verinin işlenebilirliğini ve değerini ölçme odaklıdır.

1.Volume ( Hacim) 

Bir verinin ‘Big Data’ olmasının en önemli şartı o datanın yüksek oranda bir hacmi olmasıdır. Verinin boyutu ne kadar büyükse, değeri de o kadar fazladır. Bir verinin boyutunun gözlemlenen hızlı artış, o verinin daha güvenilir olduğunu ortaya koyar.

2.Variety ( Çeşitlilik)

Bir verinin işlenmeye değer olması ( ki bahsettiğimiz şeyin devasa bir veri çöplüğü olduğu düşünülürse) ve bu değerin ortaya çıkartılması çok önemlidir. O yüzden bir verinin çeşitliliği onun analiz etmeye değer olup olmadığını belirleme noktasında önemlidir. Burada çeşitlilikle kast edilen ise verinin farklı kaynaklar aracılığı ile doğrulanabilir olmasıdır. Bu sayede bir çok veri tipi tek bir standartla değerlendirilebilir hale gelir.

3.Veracity (Doğruluk)

Verinin doğruluğu o verinin değerini ölçen en temel kriterdir. Verinin bozulmamış olması gerekmektedir. Değişime uğramış bir veriyi analiz etmek hem bizi yanlış sonuçlara götürebilir, hem de ciddi vakit kayıplarına neden olabilir.

4. Velocity ( Hız)

Büyük bir veri düşük hızlarla elde edilemez. Verinin işlenebilmesi için hızlı ve sürekli olarak elde edilebilir olması gerekmektedir.

5. Validity ( Geçerlilik)

Bu kriter doğruluk kriteriyle ortaklaşa çalışan bir kriterdir. Verinin ‘Big Data’ içinde yorumlanabilmesi için geçerliliğini yitirmemiş olması gerekir. Aynı zamanda doğruluğunu da destekler.

Big Data Neden Önemli ?

Bilgi güçtür!

Francis Bacon

Big Data’nın attığımız her adımdan, yaptığımız her tercihe kadar mevcut verileri toplayabildiğine ve bize ait olan verilerin bir bütünü olduğuna daha önce de değinmiştik. İşte bu devasa veri deposu doğru bir şekilde işlenirse ortaya çıkacak olan şey inanılmaz bir analitik data olacaktır. Büyük firmaların müşteri odaklı yaklaşım geliştirebileceği, iş dünyasının rekabet ortamında firmaların müşterileri ve ürünleriyle ilgili en doğru bilgiye ulaşmasını sağlayacak olan Big Data teknolojisi çok farklı bir dünyanın kapılarını açıyor.

Örneğin bir turizm şirketi kimlerin nerelere seyahat etmek istediğini öğrenebilecekken, bir banka ise müşterisinin profiline ulaşıp ona özel düzenlemeler yapabilecektir. Müşterisinin tam olarak ne istediği bilen bir firmadan daha karlısı sizce olabilir mi! Şirketlerin hitap ettiği müşteri kitlesi her yanıyla tanıdığı, hatta artık seçimlerine müdahale edip onları yönlendirebildiği bir iş dünyasını düşünsenize. Herkesin gözünde ‘Truman Show’ ve ‘Azınlık Raporu’ canlanıyor olsa gerek..

Ancak Big Data sadece firmaların kullanım alanında gibi düşünmek doğru olmayacaktır. Her şeyi bilmenin verdiği güç elbette çok farklı şekillerde kullanılabilir. Devletler suç ve terörle mücadelede bu verileri kullanabilir, kadına şiddetin önüne geçebilir ve ya uyuşturucuyla mücadele edebilir Big Data sayesinde.

Örnekler Üzerinden Big Data’yı Anlamak

Big Data teknolojisini gelin daha somut bir hale sokalım. Farklı alanlarda yapılan çalışmaların bu teknolojiyi anlamamızda yardımcı olabileceğini düşünüyorum.

İlk örneğimiz hayvanların özne olarak yer aldığı bir çalışmaya ait olacak. İneklerle yapılan bu çalışmada amaç hayvanların yaklaşık 20-21 güne denk gelen ve yaklaşık 12-18 saat süren çiftleşme dönemlerini tespit edebilmek. Araştırmacılar 11 adet çiftlikteki tüm ineklerin ayaklarına sensör yerleştirerek, ineklerin her saniye için hareketlerini bir veri deposunda topluyorlar. Kayıt altına alınan bu hareketler sayesinde hayvanların çiftleşme dönemleri yaklaşık 16 saat önceden tespit edilebilir bir hale getirildi. Bu da hayvanların suni döllenme ile döllenebilmesi için uygun zamanların tespitini mümkün kılıyor. Yayınlanan sonuçlara göre bu işlem sonrasında hayvan sayısı çalışma öncesindeki döneme göre  %30 oranında artış göstermiş.

İkinci örneğimiz için müzik sektörüne doğru bir geçiş yapalım. İngiliz müzik ve prodüksiyon şirketi EMI’de Big Data teknolojilerini kullanan firmalar arasında. Firma ürün taleplerini ölçmek ve müşterilerinin ürün memnuniyetini öğrenebilmek için Big Data’ya başvuruyor. Bir şarkının dağıtımına başlanıldıktan sonra veya bilerek piyasaya sızdırıldığında, şirket sosyal medya ağları aracılığıyla dinleyicilerin tepkilerini ölçüyor. Aynı zamanda şirket Shazam gibi şarkı tanımlamaya yardımcı olan uygulamalardan da faydalanıyor. Elde ettiği bilgileri demografi, lokasyon ve kültür gibi etmenlere göre sınıflandıran firma, bu verileri kullanarak daha nokta atışı pazarlama teknikleri geliştiriyor. Aynı zamanda bu veriler yeni ürünlerin farklı farklı pazarlara nasıl ulaşacağına dair firmaya bilgi akışı da sağlıyor. En büyük faydası ise kamuoyu nabzının ölçülmesine olanak sağlanılması.

Bir diğer örnek ise spor dünyasına ait. Pek çok büyük spor klübü ve spor aktivitesi de Big Data analizlerinden yararlanmakta. Oyunlarda her oyuncunun performansını takip eden ve hareketlerini analiz eden kameralar bulunuyor. Benzer şekilde farklı spor ekipmanlarında bulunan sensörler de veri depolamaya yardımcı oluyor. Birçok büyük spor klübü ve takımı, spor ortamı dışında sporcularını takip etmek farklı teknolojiler kullanılır. Beslenme ve uyku davranışlarının takibine olanak sağlayan, sosyal medyadaki konuşmalarını takip altına alan bu sensörler sayesinde sporcuların duygusal hayatı da kontrol altına alınır. Bu duruma somut bir örnek olarak

NFL( Amerikan Ulusal Futbol Ligi) bünyesinde bulunan 32 takım için en doğru kararları verebilmek adına bir platform oluşturdu. Bu platform sahanın durumu, hava, oyuncuların üniversiteden bu yana sergilendikleri bireysel performansları gibi bilgileri bir çatı altında topluyor. Amaçsa oyuncuların yaralanma riskini azaltmak. Şu an için elde edilen verilere göreyse bu platform gerçekten oyuncuların yaralanma oranlarını azaltmayı başarmış durumda.

Bu örneklerin yanı sıra günümüzde mevcut pek çok lider firma Big Data teknolojisinden yararlanmaktadır. Özellikle medya, bilişim sektörü, finans dünyası gibi farklı alanlarda oldukça aktif kullanılan bu teknoloji kişisel kullanıcılarında deneyimlediği bir alan. Örneğin Dropbox buna başarılı bir örnek olarak gösterilebilir. Görüldüğü üzere Big Data dünyası önüne geçilemez bir hızla büyümeye devam etmekte. Önüne geçilemeyen bu büyümeyi nasıl kontrol edeceğimiz ve bu verileri nasıl kullanacağımız ise bizlere kalmış !

Etiketler

Yorum Sırası Sizde