Geoprocessamento com banco de dados NoSQL e MapReduce

Dayse Silveira De Almeida, Adriano Victor Lopes Da Silva
{"title":"Geoprocessamento com banco de dados NoSQL e MapReduce","authors":"Dayse Silveira De Almeida, Adriano Victor Lopes Da Silva","doi":"10.3895/rbgeo.v11n2.15927","DOIUrl":null,"url":null,"abstract":"Informação geoespacial tem sido de grande importância para diversas aplicações. No contexto de monitoramento de degradações ambientais, os dados geoespaciais, normalmente coletados por sensores presentes em satélites, mapeiam focos de queimadas, áreas desmatadas, entre outros. Esses dados são coletados continuamente por longos períodos de tempo e com riqueza de detalhes, gerando assim, grandes volumes. Ao longo das últimas décadas, esses dados foram armazenados principalmente em bancos de dados relacionais. Para atender aos requisitos atuais, de dados em larga escala advindos de diferentes fontes, de tempo real e de alta concorrência, os bancos de dados NoSQL vêm se mostrando como uma melhor alternativa. Esses sistemas de banco de dados normalmente são distribuídos, não requerem dados estruturados, e são desenvolvidos para escalabilidade horizontal. No entanto, há ainda certa deficiência dos bancos de dados NoSQL em termos de funções espaciais. Sendo assim, o objetivo neste artigo é fazer uma revisão sobre os bancos de dados NoSQL a fim de se verificar o suporte desses aos dados geoespaciais. Os bancos de dados NoSQL que têm se destacado na literatura e se mostrado mais adequados para o gerenciamento dos dados geográficos volumosos são os orientados aos documentos, devido ao maior suporte aos formatos de dados geométricos, aos índices, às funções geoespaciais, e devido também ao alto desempenho computacional. Além desses, se destaca também o modelo de processamento distribuído MapReduce pela possibilidade de se criar funções de mapeamento e de redução para dados geoespaciais e tirar proveito das plataformas de alto desempenho computacional que seguem esse modelo.","PeriodicalId":268785,"journal":{"name":"Revista Brasileira de Geomática","volume":"44 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-09-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Geomática","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3895/rbgeo.v11n2.15927","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Informação geoespacial tem sido de grande importância para diversas aplicações. No contexto de monitoramento de degradações ambientais, os dados geoespaciais, normalmente coletados por sensores presentes em satélites, mapeiam focos de queimadas, áreas desmatadas, entre outros. Esses dados são coletados continuamente por longos períodos de tempo e com riqueza de detalhes, gerando assim, grandes volumes. Ao longo das últimas décadas, esses dados foram armazenados principalmente em bancos de dados relacionais. Para atender aos requisitos atuais, de dados em larga escala advindos de diferentes fontes, de tempo real e de alta concorrência, os bancos de dados NoSQL vêm se mostrando como uma melhor alternativa. Esses sistemas de banco de dados normalmente são distribuídos, não requerem dados estruturados, e são desenvolvidos para escalabilidade horizontal. No entanto, há ainda certa deficiência dos bancos de dados NoSQL em termos de funções espaciais. Sendo assim, o objetivo neste artigo é fazer uma revisão sobre os bancos de dados NoSQL a fim de se verificar o suporte desses aos dados geoespaciais. Os bancos de dados NoSQL que têm se destacado na literatura e se mostrado mais adequados para o gerenciamento dos dados geográficos volumosos são os orientados aos documentos, devido ao maior suporte aos formatos de dados geométricos, aos índices, às funções geoespaciais, e devido também ao alto desempenho computacional. Além desses, se destaca também o modelo de processamento distribuído MapReduce pela possibilidade de se criar funções de mapeamento e de redução para dados geoespaciais e tirar proveito das plataformas de alto desempenho computacional que seguem esse modelo.
使用 NoSQL 数据库和 MapReduce 进行地理处理
地理空间信息在各种应用中都具有重要意义。在监测环境退化方面,地理空间数据通常由卫星上的传感器收集,用于绘制火灾、森林砍伐面积等地图。这些数据是长期、详细地连续收集的,因此产生了大量数据。过去几十年来,这些数据主要存储在关系数据库中。为了满足当今对来自不同来源的大规模数据、实时性和高并发性的要求,NoSQL 数据库被证明是更好的选择。这些数据库系统通常是分布式的,不需要结构化数据,并且设计用于横向扩展。不过,NoSQL 数据库在空间功能方面仍有些欠缺。因此,本文旨在回顾 NoSQL 数据库,以验证它们对地理空间数据的支持。在文献中脱颖而出并被证明最适合管理大量地理数据的 NoSQL 数据库是面向文档的数据库,因为它们对几何数据格式、索引、地理空间功能的支持更强,而且计算性能也很高。除此之外,MapReduce 分布式处理模型也很突出,因为它可以为地理空间数据创建映射和缩减功能,并利用遵循该模型的高性能计算平台。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信