{"title":"Büyük Veri: Uygulama Alanları, Analitiği ve Güvenlik Boyutu","authors":"Ertuğrul Aktan","doi":"10.33721/BY.403010","DOIUrl":null,"url":null,"abstract":"Dunyadaki veri hacmi ve veri cesitliligi, insanlik tarihinde daha once hic gorulmedigi hizda artmaktadir. Internet teknolojilerinin ve sosyal medyanin hayatimizin her evresine ve hatta cep telefonlarimiza girmesiyle, insanlar gunluk faaliyetlerinde bile veri uretir duruma gelmistir. Dunun manuel olarak calisan arac gerecleri, bugun akilli cihazlar olarak anilmakta ve hemen hepsi sensorleri vasitasiyla veri uretmektedir. Bu kadar yogun ve farkli verinin farkli kaynaklardan giderek artan bir sekilde uretilmesi, yeni bir kavrami ortaya cikarmistir: “Buyuk Veri”. Buyuk veri yuksek hacim, hiz ve cesitlilikte uretilen yapisal, yari yapisal ve yapisal olmayan veri butunudur. Bircok endustriyel alan, yeni veri ureterek veya mevcut veriyi sayisallastirarak buyuk veriye kaynak olusturmaktadir. Organizasyonlarin rekabet avantaji kazanmasinda, bilgi onemli bir uretim faktorudur. Bu noktada buyuk verinin bilginin ham maddesi olmasi ve dolayisiyla karar verme sureclerini etkilemesi, buyuk veri analitiginin onemini artirmaktadir. Buyuk veriden ekonomik deger elde edilebilmesi icin, dogrulugu saglanmis verinin ileri analitik yontemlerle islenmesi gerekmektedir. Bugun, ekonomik ve ticari faaliyetlerden kamu yonetimine, ulusal guvenlikten bilimsel arastirmalara kadar bircok alanda, buyuk veri ve analitiginden yararlanilmaktadir. Hergun 2,5 eksabayt (1 eksabayt=1.073.741.824 gigabayt) hacminde verinin uretildigi gunumuzde, dunun iliskisel veritabani ve yapisal sorgulama dilleri ile buyuk veri analitiginin gerceklestirilmesi mumkun gozukmemektedir. Buyuk veriyi islemek adina basta Hadoop, Esle-Indirge (Map-Reduce) olmak uzere, Hive, Hcatalog, Hbase, MPP (Massively Parallel Processing), PIG, Mahout, NoSQL ve Cassandra gibi dagitik dosya sistemleri uzerinde calisan ileri analitik yontemlerden yararlanilmaktadir. Buyuk veri analitigi, sunmus oldugu faydalarin yani sira kisisel bilgilerin mahremiyetini tehlikeye atabilecek guvenlik zafiyetlerini de olusturabilmektedir. Bu calismada; buyuk veri olgusu, bilesenleri ve kaynaklari boyutunda ele alinmis, buyuk verinin uygulama alanlarinda sagladigi avantajlar uzerinde durulmus, buyuk veri analitigi surecleri ve ileri analitik yontemlerden, dagitik dosya sistemi uzerinde Esle-Indirge modelini calistiran Hadoop yazilim mimarisinin isleyisi incelenmistir. Bununla birlikte buyuk verinin sundugu avantajlarin yani sira olusturdugu guvenlik sorunlari da irdelenmis ve bu kapsamda alinmasi gereken guvenlik onlemleri degerlendirilmistir.","PeriodicalId":143631,"journal":{"name":"Bilgi Yönetimi","volume":"7 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-06-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"23","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Bilgi Yönetimi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33721/BY.403010","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Büyük Veri: Uygulama Alanları, Analitiği ve Güvenlik Boyutu
Dunyadaki veri hacmi ve veri cesitliligi, insanlik tarihinde daha once hic gorulmedigi hizda artmaktadir. Internet teknolojilerinin ve sosyal medyanin hayatimizin her evresine ve hatta cep telefonlarimiza girmesiyle, insanlar gunluk faaliyetlerinde bile veri uretir duruma gelmistir. Dunun manuel olarak calisan arac gerecleri, bugun akilli cihazlar olarak anilmakta ve hemen hepsi sensorleri vasitasiyla veri uretmektedir. Bu kadar yogun ve farkli verinin farkli kaynaklardan giderek artan bir sekilde uretilmesi, yeni bir kavrami ortaya cikarmistir: “Buyuk Veri”. Buyuk veri yuksek hacim, hiz ve cesitlilikte uretilen yapisal, yari yapisal ve yapisal olmayan veri butunudur. Bircok endustriyel alan, yeni veri ureterek veya mevcut veriyi sayisallastirarak buyuk veriye kaynak olusturmaktadir. Organizasyonlarin rekabet avantaji kazanmasinda, bilgi onemli bir uretim faktorudur. Bu noktada buyuk verinin bilginin ham maddesi olmasi ve dolayisiyla karar verme sureclerini etkilemesi, buyuk veri analitiginin onemini artirmaktadir. Buyuk veriden ekonomik deger elde edilebilmesi icin, dogrulugu saglanmis verinin ileri analitik yontemlerle islenmesi gerekmektedir. Bugun, ekonomik ve ticari faaliyetlerden kamu yonetimine, ulusal guvenlikten bilimsel arastirmalara kadar bircok alanda, buyuk veri ve analitiginden yararlanilmaktadir. Hergun 2,5 eksabayt (1 eksabayt=1.073.741.824 gigabayt) hacminde verinin uretildigi gunumuzde, dunun iliskisel veritabani ve yapisal sorgulama dilleri ile buyuk veri analitiginin gerceklestirilmesi mumkun gozukmemektedir. Buyuk veriyi islemek adina basta Hadoop, Esle-Indirge (Map-Reduce) olmak uzere, Hive, Hcatalog, Hbase, MPP (Massively Parallel Processing), PIG, Mahout, NoSQL ve Cassandra gibi dagitik dosya sistemleri uzerinde calisan ileri analitik yontemlerden yararlanilmaktadir. Buyuk veri analitigi, sunmus oldugu faydalarin yani sira kisisel bilgilerin mahremiyetini tehlikeye atabilecek guvenlik zafiyetlerini de olusturabilmektedir. Bu calismada; buyuk veri olgusu, bilesenleri ve kaynaklari boyutunda ele alinmis, buyuk verinin uygulama alanlarinda sagladigi avantajlar uzerinde durulmus, buyuk veri analitigi surecleri ve ileri analitik yontemlerden, dagitik dosya sistemi uzerinde Esle-Indirge modelini calistiran Hadoop yazilim mimarisinin isleyisi incelenmistir. Bununla birlikte buyuk verinin sundugu avantajlarin yani sira olusturdugu guvenlik sorunlari da irdelenmis ve bu kapsamda alinmasi gereken guvenlik onlemleri degerlendirilmistir.