Karen Torres Teixeira, M. Campos, J. P. S. D. Silva
{"title":"从文本源中提取数据:一种丰富互联开放数据的方法","authors":"Karen Torres Teixeira, M. Campos, J. P. S. D. Silva","doi":"10.5753/SEMISH.2018.3435","DOIUrl":null,"url":null,"abstract":"Na Web de Dados, itens de dados são interconectados e associados a anotações descritivas na forma de vocabulários, tirando vantagem de uma representação em triplas. Neste contexto, documentos e outras fontes textuais podem ser anotados para serem incorporados a este universo como recursos ou servindo também de base para extração de novas triplas. O objetivo deste artigo é apresentar uma abordagem para extração de dados e geração de triplas a partir de textos com estilos específicos visando o enriquecimento de dados abertos interligados, através de sua associação e ligação a bases existentes. A abordagem foi aplicada e avaliada no contexto de um portal com informações sobre o consumo de agrotóxicos no Brasil.","PeriodicalId":428524,"journal":{"name":"Anais do Seminário Integrado de Software e Hardware (SEMISH)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-07-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"Extração de dados de fontes textuais: uma abordagem para enriquecimento de dados abertos interligados\",\"authors\":\"Karen Torres Teixeira, M. Campos, J. P. S. D. Silva\",\"doi\":\"10.5753/SEMISH.2018.3435\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Na Web de Dados, itens de dados são interconectados e associados a anotações descritivas na forma de vocabulários, tirando vantagem de uma representação em triplas. Neste contexto, documentos e outras fontes textuais podem ser anotados para serem incorporados a este universo como recursos ou servindo também de base para extração de novas triplas. O objetivo deste artigo é apresentar uma abordagem para extração de dados e geração de triplas a partir de textos com estilos específicos visando o enriquecimento de dados abertos interligados, através de sua associação e ligação a bases existentes. A abordagem foi aplicada e avaliada no contexto de um portal com informações sobre o consumo de agrotóxicos no Brasil.\",\"PeriodicalId\":428524,\"journal\":{\"name\":\"Anais do Seminário Integrado de Software e Hardware (SEMISH)\",\"volume\":\"1 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2018-07-26\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais do Seminário Integrado de Software e Hardware (SEMISH)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/SEMISH.2018.3435\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do Seminário Integrado de Software e Hardware (SEMISH)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/SEMISH.2018.3435","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Extração de dados de fontes textuais: uma abordagem para enriquecimento de dados abertos interligados
Na Web de Dados, itens de dados são interconectados e associados a anotações descritivas na forma de vocabulários, tirando vantagem de uma representação em triplas. Neste contexto, documentos e outras fontes textuais podem ser anotados para serem incorporados a este universo como recursos ou servindo também de base para extração de novas triplas. O objetivo deste artigo é apresentar uma abordagem para extração de dados e geração de triplas a partir de textos com estilos específicos visando o enriquecimento de dados abertos interligados, através de sua associação e ligação a bases existentes. A abordagem foi aplicada e avaliada no contexto de um portal com informações sobre o consumo de agrotóxicos no Brasil.