BİG DATA NEDİR?

Big data ismi itibarıyla bize çok yüksek boyutlu dosyalar ve depolama işlemini anımsatsa da tam anlamıyla bu demek değil. Big data’nın tam anlamı dijitalleşmiş dünyada her gün üretilen tüm verilerin anlamlı ve işlenebilir halde depolanması olayıdır. Şöyle düşünelim size tahsis edilmiş bir çalışma kentiniz var ve bu kentte dünyada olup biten her şeyin depolandığı kitapların bulunduğu kütüphanelere sahipsiniz. Ancak bu verilerden yararlanmanız için istediğiniz verileri aramak bulmak ve diğer kitapların satırlarını karıştırarak bunları birbirleriyle karşılaştırmak ve nihayetinde bu çalışmalarınızı anlamlandırmak için bir rapor yazısı yazmak zorundasınız. Bu sadece bir çalışma için yapmanız gereken basamaklar ve sizin de işiniz bu çalışmaları isteyen insanlara rapor sunmak. Şüphesiz çok katlanılmaz bir iş olurdu. İşte big data işin görünmez kahramanı olarak tüm bu bilgileri topluyor anlamlandırıyor ve istendiği zaman belirli algoritmalar aracılığı ile size sunabiliyor.

Bu verileri nereden buluyor? Hâlihazırda kullandığınız sosyal medya hesaplarınız. Komik bulup beğendiğiniz videodan tutun size arkadaşlık isteği yollayan akrabalarınıza kadar her şey bir veri. Bunun dışında e-postalarınız, alışveriş sitesi gezintileriniz, sıkıldığınız zaman yaptığınız internet gezintileri… Kısaca elektronik ortamda attığınız her adım bir veri olarak kullanılabilir.-Yeri gelmişken benzetmeyi yapmadan geçemeyeceğim George Orwell’ın 1984 adlı romanındaki Big Brother’ı anımsatıyor bana tüm bunlar ama bağlantısı var mı bilmiyorum.

Şekil 1 Veri alım, işleme ve analizi şeması

Big Data Bileşenleri

Bu verilerle ilgili temel 3 bileşene sahip big data bunları 3V olarak da kodlamamız mümkün:

1)Volume yani hacim. Verilerin hacminden bahsediyoruz burada. Ve bu hacim gb lar boyutunun çok üzerinde bir hacim. Buna şöyle örnek verebilirim 2019 Mart ayında yayınlanan bir yazıda sadece  Google ve YouTube’un günlük olarak 24 Petabyte’lık veri işlediğinden bahsediliyor. (1 Petabyte=1.024 Terabyte)

2)Velocity yani hız. Burada da verilerin üretilme hızından bahsediyoruz. Bu konuda verilebilecek en iyi örnek sosyal medya. Yukarıda sosyal medya ile ilgili kullanım sayılarını görebileceğiniz bir tablo var bu kullanıcıların her an paylaştıkları en ufak şey bile bir veri değeri taşıdığını düşündüğünüz zaman hızı hayal edebilirsiniz belki.

Şunu da söylemeden geçmeyelim bu sadece sosyal medya için verilen bir örnek 🙂

3)Variety yani çeşitlilik. Bir çok farklı kaynaktan bir çok farklı veriyi bulundurabilir big data. Bunun için yine yukarıdaki sosyal medya örneğinden devam edersek instagram’da görüntü ile bir veri paylaşıyorsunuz Youtube’da video olarak Twitter’da metin olarak.

BİG DATA NEDEN BU ARALAR POPÜLER?

Çünkü artık insanlar verileri depolamakta eskisi kadar kötü değiller ve verilerini paylaşmakta da o kadar korkak davranmıyorlar.

-2000 yılında bulunan bilgilerin sadece %20 si dijitalmiş kalan %80 eski usul

-2015 ise %98…

Ama bunun ne kadarı kullanışlı dersek çok azı cevabını almamız uzun sürmüyor. Peki neden? Çünkü bilgiye ulaşmak için bir listeyi taramak belli bir veriyi oradan çekmek verimsiz. Çok fazla zaman alan bir işlem. Büyük veri bu olayın neresinde? Veriler bu listeleme olayını kullanmıyor. Büyük veride veriler bulut içinde gibi düşünebiliriz ve yazılan algoritmada bulutun içindeki hangi veriye ihtiyaç varsa oradan o veri çekiliyor.

Kullanım Alanları

Şimdi bunlardan sonra big data’nın kullanımına geçelim. Nerde kullanılır bu big data dediğimiz şey? Cevap veriyorum: HER YERDE. Örneğin şuanda bu yazıdan çıktıktan sonra gidip bir alışveriş sitesinde belirli bir başlık altında ürünleri inceleyin. Birkaç dakikalık incelemeden sonra internet gezintinize kaldığınız yerden devam edin. Her zaman girdiğiniz sitede her zaman yaptığınız şeyi yapın. Tesadüfe bakın ki az önce baktığınız ürünleri Google reklam olarak çıkartacaktır sizler için karşınıza.  Veya şöyle bir örnek verelim siz ikinci el bir araba satın almak istiyorsunuz ve bir satıcı ile anlaşmak üzeresiniz ancak biri çıkıyor ve diyor ki bu şahıs bu arabayı kullandığı süre boyunca birçok defa alışveriş sitelerinde araba parçaları aramış ve satın almış. Arabanın da hasar kaydını bilmediğinizi hayal edelim. Arabayı satın alma konusunda bir kere daha düşünürsünüz sanırım? Bu örnekten yola çıkarak sigorta şirketlerini düşünüp çalışmalarını bu yönde yapıp yapmadıkları konusunda bazı tahminlerde bulunmak zor değil. Veya hepimizin bildiği anket şirketleri var. Hepimiz bu sonuçlara nasıl ulaşıldığını düşünmüşüzdür. Sonuçta hiç kimse gelip size bir konuda fikrinizi sormamasına rağmen sizin de içerisinde bulunduğunuz bir kesim için bir olasılıktan bahsediyor değil mi? Acaba nasıl yapılıyor bu çalışmalar? İnternette attığımız her adımın izinin kaldığını düşünürsek illaki bu anketle ilgili de bir iz bırakmışızdır işte bu aşamadan sonra tek yapılan o izleri toplamak oluyor. Bunlar gibi birçok örnek vermek mümkün siz de bu örnekleri dilediğiniz kadar arttırabilirsiniz.

Tıpta ise büyük veri kendine, hastayı daha merkezi olarak konumlandırarak yer buluyor. Mevcut modelde hasta kayıtları sağlık çalışanları tarafından depolanıyor ve hasta ikincil konumda. Buna karşın büyük veri ile hastanın paylaşmış olduğu sağlıksal verileri depolayabilir ve zaman zaman hastalının lehine kullanabiliriz. Bunların en basiti olarak gösterebileceğimiz halk sağlığı alanında yapılabilecek olduğumuz önleyici çalışmalar olur. Büyük veri; Şeker, tansiyon, obezite gibi kronik rahatsızlıkları olan hastalarda daha etkin bir izleme kontrol mekanizması kurulmasında büyük imkânlar sunar.  Sağlıkla ilgili bilgilerinizi (kullandığı ilaç, aile öyküsü vs) diğer sistemlerden alınan bilgilerle (gelir, eğitim, mahalle vs) kıyaslama yaparak yatkın bireylerin takibini kolaylaştırmak için büyük bir şans sunar. Ancak tüm bunların dezavantajları da yok değil. Buradaki en büyük sorun bu bilgilerin gizlilik haklarının nasıl korunacağı ve mahremiyetin ne derecede sağlanabileceği olur. Sistemdeki hatalı yönlendirmeler de yaşanabilecek problem arasındadır.

Yanıt yok

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir