{"title":"H-sim:用于识别产品匹配的混合相似度函数","authors":"Higor Moreira, Edimar Manica","doi":"10.5335/rbca.v16i1.14955","DOIUrl":null,"url":null,"abstract":"Uma empresa ao realizar compras de produtos de seus fornecedores, precisa importar as notas fiscais eletrônicas destes produtos para sua base de dados relacional para administrar o estoque de produtos, tributos e revenda. Esta não é uma tarefa trivial, pois as descrições dos produtos das notas fiscais e da base de dados apresentam variações. Este trabalhopropõe a função de similaridade H-sim que combina funções de similaridade semânticas com funções de similaridade baseadas em token ou distância de edição para identificar produtos correspondentes de diferentes bases de dados. Foramrealizados experimentos utilizando dados reais de produtos, onde a função H-sim obteve 87,7% de F1.","PeriodicalId":138408,"journal":{"name":"Revista Brasileira de Computação Aplicada","volume":"3 10","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-05-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"H-sim: uma função de similaridade híbrida para identificação de correspondência de produtos\",\"authors\":\"Higor Moreira, Edimar Manica\",\"doi\":\"10.5335/rbca.v16i1.14955\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Uma empresa ao realizar compras de produtos de seus fornecedores, precisa importar as notas fiscais eletrônicas destes produtos para sua base de dados relacional para administrar o estoque de produtos, tributos e revenda. Esta não é uma tarefa trivial, pois as descrições dos produtos das notas fiscais e da base de dados apresentam variações. Este trabalhopropõe a função de similaridade H-sim que combina funções de similaridade semânticas com funções de similaridade baseadas em token ou distância de edição para identificar produtos correspondentes de diferentes bases de dados. Foramrealizados experimentos utilizando dados reais de produtos, onde a função H-sim obteve 87,7% de F1.\",\"PeriodicalId\":138408,\"journal\":{\"name\":\"Revista Brasileira de Computação Aplicada\",\"volume\":\"3 10\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-05-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista Brasileira de Computação Aplicada\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5335/rbca.v16i1.14955\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Computação Aplicada","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5335/rbca.v16i1.14955","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
H-sim: uma função de similaridade híbrida para identificação de correspondência de produtos
Uma empresa ao realizar compras de produtos de seus fornecedores, precisa importar as notas fiscais eletrônicas destes produtos para sua base de dados relacional para administrar o estoque de produtos, tributos e revenda. Esta não é uma tarefa trivial, pois as descrições dos produtos das notas fiscais e da base de dados apresentam variações. Este trabalhopropõe a função de similaridade H-sim que combina funções de similaridade semânticas com funções de similaridade baseadas em token ou distância de edição para identificar produtos correspondentes de diferentes bases de dados. Foramrealizados experimentos utilizando dados reais de produtos, onde a função H-sim obteve 87,7% de F1.