Büyük Veri: Uygulama Alanları, Analitiği ve Güvenlik Boyutu

Bilgi Yönetimi Pub Date : 2018-06-22 DOI:10.33721/BY.403010
Ertuğrul Aktan
{"title":"Büyük Veri: Uygulama Alanları, Analitiği ve Güvenlik Boyutu","authors":"Ertuğrul Aktan","doi":"10.33721/BY.403010","DOIUrl":null,"url":null,"abstract":"Dunyadaki veri hacmi ve veri cesitliligi, insanlik tarihinde daha once hic gorulmedigi hizda artmaktadir. Internet teknolojilerinin ve sosyal medyanin hayatimizin her evresine ve hatta cep telefonlarimiza girmesiyle, insanlar gunluk faaliyetlerinde bile veri uretir duruma gelmistir. Dunun manuel olarak calisan arac gerecleri, bugun akilli cihazlar olarak anilmakta ve hemen hepsi sensorleri vasitasiyla veri uretmektedir. Bu kadar yogun ve farkli verinin farkli kaynaklardan giderek artan bir sekilde uretilmesi, yeni bir kavrami ortaya cikarmistir: “Buyuk Veri”. Buyuk veri yuksek hacim, hiz ve cesitlilikte uretilen yapisal, yari yapisal ve yapisal olmayan veri butunudur. Bircok endustriyel alan, yeni veri ureterek veya mevcut veriyi sayisallastirarak buyuk veriye kaynak olusturmaktadir. Organizasyonlarin rekabet avantaji kazanmasinda, bilgi onemli bir uretim faktorudur. Bu noktada buyuk verinin bilginin ham maddesi olmasi ve dolayisiyla karar verme sureclerini etkilemesi, buyuk veri analitiginin onemini artirmaktadir. Buyuk veriden ekonomik deger elde edilebilmesi icin, dogrulugu saglanmis verinin ileri analitik yontemlerle islenmesi gerekmektedir. Bugun, ekonomik ve ticari faaliyetlerden kamu yonetimine, ulusal guvenlikten bilimsel arastirmalara kadar bircok alanda, buyuk veri ve analitiginden yararlanilmaktadir. Hergun 2,5 eksabayt (1 eksabayt=1.073.741.824 gigabayt) hacminde verinin uretildigi gunumuzde, dunun iliskisel veritabani ve yapisal sorgulama dilleri ile buyuk veri analitiginin gerceklestirilmesi mumkun gozukmemektedir. Buyuk veriyi islemek adina basta Hadoop, Esle-Indirge (Map-Reduce) olmak uzere, Hive, Hcatalog, Hbase, MPP (Massively Parallel Processing), PIG, Mahout, NoSQL ve Cassandra gibi dagitik dosya sistemleri uzerinde calisan ileri analitik yontemlerden yararlanilmaktadir. Buyuk veri analitigi, sunmus oldugu faydalarin yani sira kisisel bilgilerin mahremiyetini tehlikeye atabilecek guvenlik zafiyetlerini de olusturabilmektedir. Bu calismada; buyuk veri olgusu, bilesenleri ve kaynaklari boyutunda ele alinmis, buyuk verinin uygulama alanlarinda sagladigi avantajlar uzerinde durulmus, buyuk veri analitigi surecleri ve ileri analitik yontemlerden, dagitik dosya sistemi uzerinde Esle-Indirge modelini calistiran Hadoop yazilim mimarisinin isleyisi incelenmistir. Bununla birlikte buyuk verinin sundugu avantajlarin yani sira olusturdugu guvenlik sorunlari da irdelenmis ve bu kapsamda alinmasi gereken guvenlik onlemleri degerlendirilmistir.","PeriodicalId":143631,"journal":{"name":"Bilgi Yönetimi","volume":"7 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-06-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"23","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Bilgi Yönetimi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33721/BY.403010","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 23

Abstract

Dunyadaki veri hacmi ve veri cesitliligi, insanlik tarihinde daha once hic gorulmedigi hizda artmaktadir. Internet teknolojilerinin ve sosyal medyanin hayatimizin her evresine ve hatta cep telefonlarimiza girmesiyle, insanlar gunluk faaliyetlerinde bile veri uretir duruma gelmistir. Dunun manuel olarak calisan arac gerecleri, bugun akilli cihazlar olarak anilmakta ve hemen hepsi sensorleri vasitasiyla veri uretmektedir. Bu kadar yogun ve farkli verinin farkli kaynaklardan giderek artan bir sekilde uretilmesi, yeni bir kavrami ortaya cikarmistir: “Buyuk Veri”. Buyuk veri yuksek hacim, hiz ve cesitlilikte uretilen yapisal, yari yapisal ve yapisal olmayan veri butunudur. Bircok endustriyel alan, yeni veri ureterek veya mevcut veriyi sayisallastirarak buyuk veriye kaynak olusturmaktadir. Organizasyonlarin rekabet avantaji kazanmasinda, bilgi onemli bir uretim faktorudur. Bu noktada buyuk verinin bilginin ham maddesi olmasi ve dolayisiyla karar verme sureclerini etkilemesi, buyuk veri analitiginin onemini artirmaktadir. Buyuk veriden ekonomik deger elde edilebilmesi icin, dogrulugu saglanmis verinin ileri analitik yontemlerle islenmesi gerekmektedir. Bugun, ekonomik ve ticari faaliyetlerden kamu yonetimine, ulusal guvenlikten bilimsel arastirmalara kadar bircok alanda, buyuk veri ve analitiginden yararlanilmaktadir. Hergun 2,5 eksabayt (1 eksabayt=1.073.741.824 gigabayt) hacminde verinin uretildigi gunumuzde, dunun iliskisel veritabani ve yapisal sorgulama dilleri ile buyuk veri analitiginin gerceklestirilmesi mumkun gozukmemektedir. Buyuk veriyi islemek adina basta Hadoop, Esle-Indirge (Map-Reduce) olmak uzere, Hive, Hcatalog, Hbase, MPP (Massively Parallel Processing), PIG, Mahout, NoSQL ve Cassandra gibi dagitik dosya sistemleri uzerinde calisan ileri analitik yontemlerden yararlanilmaktadir. Buyuk veri analitigi, sunmus oldugu faydalarin yani sira kisisel bilgilerin mahremiyetini tehlikeye atabilecek guvenlik zafiyetlerini de olusturabilmektedir. Bu calismada; buyuk veri olgusu, bilesenleri ve kaynaklari boyutunda ele alinmis, buyuk verinin uygulama alanlarinda sagladigi avantajlar uzerinde durulmus, buyuk veri analitigi surecleri ve ileri analitik yontemlerden, dagitik dosya sistemi uzerinde Esle-Indirge modelini calistiran Hadoop yazilim mimarisinin isleyisi incelenmistir. Bununla birlikte buyuk verinin sundugu avantajlarin yani sira olusturdugu guvenlik sorunlari da irdelenmis ve bu kapsamda alinmasi gereken guvenlik onlemleri degerlendirilmistir.
世界上的数据量和数据种类正在以人类历史上前所未有的速度增长。随着互联网技术和社交媒体渗透到我们生活的每个阶段,甚至渗透到我们的手机中,人们甚至在日常活动中也在产生数据。昨天的手动操作工具现在被称为智能设备,几乎所有这些设备都通过传感器产生数据。从不同来源产生的这种密集而多样的数据日益增多,催生了一个新的概念,即 "大数据":"大数据"。大数据是大量、高速、多样生成的结构化、半结构化和非结构化数据的集合。通过生成新数据或将现有数据数字化,许多工业领域都是大数据的来源。信息是企业获得竞争优势的重要生产要素。在这一点上,大数据是信息的原材料,因此会影响决策过程,这就增加了大数据分析的重要性。为了从大数据中获取经济价值,必须使用先进的分析方法处理准确的数据。如今,从经济和商业活动到公共管理,从国家安全到科学研究,许多领域都在利用大数据及其分析方法。在当今世界,每天产生 2.5 艾字节(1 艾字节 = 1.073.741.824 千兆字节)的数据,不可能再用过去的关系数据库和结构化查询语言来进行大数据分析。为了处理大数据,人们使用了 Hadoop、Map-Reduce、Hive、Hcatalog、Hbase、MPP(大规模并行处理)、PIG、Mahout、NoSQL 和 Cassandra 等先进的分析方法。除了大数据分析带来的好处外,它还可能产生安全漏洞,危及个人信息的隐私。本研究从大数据的组成部分和资源方面讨论了大数据现象,强调了大数据在应用领域的优势,研究了大数据分析流程和高级分析方法,以及在分布式文件系统上运行 Esle-Indirge 模型的 Hadoop 软件架构的功能。除了大数据带来的优势,还研究了大数据引起的安全问题,并评估了在此背景下应采取的安全措施。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信