Página 1 dos resultados de 1028 itens digitais encontrados em 0.065 segundos

Soluções aproximadas para algoritmos escaláveis de mineração de dados em domínios de dados complexos usando GPGPU; On approximate solutions to scalable data mining algorithms for complex data problems using GPGPU

Mamani, Alexander Victor Ocsa
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 22/09/2011 PT
Relevância na Pesquisa
116.16%
A crescente disponibilidade de dados em diferentes domínios tem motivado o desenvolvimento de técnicas para descoberta de conhecimento em grandes volumes de dados complexos. Trabalhos recentes mostram que a busca em dados complexos é um campo de pesquisa importante, já que muitas tarefas de mineração de dados, como classificação, detecção de agrupamentos e descoberta de motifs, dependem de algoritmos de busca ao vizinho mais próximo. Para resolver o problema da busca dos vizinhos mais próximos em domínios complexos muitas abordagens determinísticas têm sido propostas com o objetivo de reduzir os efeitos da maldição da alta dimensionalidade. Por outro lado, algoritmos probabilísticos têm sido pouco explorados. Técnicas recentes relaxam a precisão dos resultados a fim de reduzir o custo computacional da busca. Além disso, em problemas de grande escala, uma solução aproximada com uma análise teórica sólida mostra-se mais adequada que uma solução exata com um modelo teórico fraco. Por outro lado, apesar de muitas soluções exatas e aproximadas de busca e mineração terem sido propostas, o modelo de programação em CPU impõe restrições de desempenho para esses tipos de solução. Uma abordagem para melhorar o tempo de execução de técnicas de recuperação e mineração de dados em várias ordens de magnitude é empregar arquiteturas emergentes de programação paralela...

Mineração de dados em redes complexas: estrutura e dinâmica; Data mining in complex networks: structure and dynamics

Arruda, Guilherme Ferraz de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 02/04/2013 PT
Relevância na Pesquisa
116.05%
A teoria das redes complexas é uma área altamente interdisciplinar que oferece recursos para o estudo dos mais variados tipos de sistemas complexos, desde o cérebro até a sociedade. Muitos problemas da natureza podem ser modelados como redes, tais como: as interações protéicas, organizações sociais, o mercado financeiro, a Internet e a World Wide Web. A organização de todos esses sistemas complexos pode ser representada por grafos, isto é, vértices conectados por arestas. Tais topologias têm uma influencia fundamental sobre muitos processos dinâmicos. Por exemplo, roteadores altamente conectados são fundamentais para manter o tráfego na Internet, enquanto pessoas que possuem um grande número de contatos sociais podem contaminar um grande número de outros indivíduos. Ao mesmo tempo, estudos têm mostrado que a estrutura do cérebro esta relacionada com doenças neurológicas, como a epilepsia, que está ligada a fenômenos de sincronização. Nesse trabalho, apresentamos como técnicas de mineração de dados podem ser usadas para estudar a relação entre topologias de redes complexas e processos dinâmicos. Tal estudo será realizado com a simulação de fenômenos de sincronização, falhas, ataques e propagação de epidemias. A estrutura das redes será caracterizada através de métodos de mineração de dados...

Predição de tags usando linked data: um estudo de caso no banco de dados Arquigrafia; Tag prediction using linked data: a case study in the Arquigrafia database

Souza, Ricardo Augusto Teixeira de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 17/12/2013 PT
Relevância na Pesquisa
115.95%
Dada a grande quantidade de conteúdo criado por usuários na Web, uma proposta para ajudar na busca e organização é a criação de sistemas de anotações (tagging systems), normalmente na forma de palavras-chave, extraídas do próprio conteúdo ou sugeridas por visitantes. Esse trabalho aplica um algoritmo de mineração de dados em um banco de dados RDF, contendo instâncias que podem fazer referências à rede Linked Data do DBpedia, para recomendação de tags utilizando as medidas de similaridade taxonômica, relacional e literal de descrições RDF. O banco de dados utilizado é o Arquigrafia, um sistema de banco de dados na Web cujo objetivo é catalogar imagens de projetos arquitetônicos, e que permite que visitantes adicionem tags às imagens. Foram realizados experimentos para a avaliação da qualidade das recomendações de tags realizadas considerando diferentes modelos do Arquigrafia incluindo o modelo estendido do Arquigrafia que faz referências ao DBpedia. Os resultados mostram que a qualidade da recomendação de determinadas tags pode melhorar quando consideramos diferentes modelos (com referências à rede Linked Data do DBpedia) na fase de aprendizado.; Given the huge content created by users in the Web, a way to help in search and organization is the creation of tagging systems...

Analysis of microRNA precursors in multiple species by data mining techniques; Análise de precursores de microRNA em múltiplas espécies utilizando técnicas de mineração de dados

Lopes, Ivani de Oliveira Negrão
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 18/06/2014 EN
Relevância na Pesquisa
126%
RNA Sequencing has recently emerged as a breakthrough technology for microRNA (miRNA) discovery. This technology has allowed the discovery of thousands of miRNAs in a large number of species. However, despite the benefits of this technology, it also carries its own limitations, including the need for sequencing read libraries and of the genome. Differently, ab initio computational methods need only the genome as input to search for genonic locus likely to give rise to novel miRNAs. In the core of most of these methods, there are predictive models induced by using data mining techniques able to distinguish between real (positive) and pseudo (negative) miRNA precursors (pre-miRNA). Nevertheless, the applicability of current literature ab initio methods have been compromised by high false detection rates and/or by other computational difficulties. In this work, we investigated how the main aspects involved in the induction of predictive models for pre-miRNA affect the predictive performance. Particularly, we evaluate the discriminant power of feature sets proposed in the literature, whose computational costs and composition vary widely. The computational experiments were carried out using sequence data from 45 species, which covered species from eight phyla. The predictive performance of the classification models induced using large training set sizes (≥ 1; 608) composed of instances extracted from real and pseudo human pre-miRNA sequences did not differ significantly among the feature sets that lead to the maximal accuracies. Moreover...

Utilização de técnicas de mineração de dados na análise das informações de uma universidade

Herdt, Rudiney Marcos
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: x, 82 f.| grafs., tabs.
POR
Relevância na Pesquisa
106.2%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de Produção.; Uma realidade que está cada vez mais presente em todas as organizações é a necessidade na busca por informações. As técnicas de mineração de dados são apresentadas como revolucionárias porque geram suas próprias hipóteses e garantem informações com maior rapidez. O principal objetivo da mineração de dados é encontrar padrões de comportamento em um grande volume de dados. A mineração de dados é uma das etapas no processo de descoberta de conhecimento em banco de dados KDD. As principais etapas no processo de KDD são: definição de metas, seleção, pré-processamento, transformação, mineração de dados e interpretação. O data warehouse não é obrigatório, mas é de grande importância para uma mineração de dados eficiente. A mineração de dados pode ser utilizada na aplicação de várias técnicas. As principais são: clusterização, classificação e regras de associação. A Universidade do Sul de Santa Catarina (Unisul) possui um processo permanente de avaliação, denominado Avaliação Institucional, que é feito através de uma pesquisa com 65 questões...

Framework de integração para o modelo estratégico de colaboração e mineração de dados espaciais na WEB

Moraes, André Fabiano de
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Tese de Doutorado Formato: 300 p.| il., grafs., tabs.
POR
Relevância na Pesquisa
116.1%
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Civil, Florianópolis, 2011; Após o levantamento da situação de alguns municípios brasileiros com relação a produção e ao tratamento de dados espaciais, ficou detectada a carência de infraestruturas, de informações e por consequência, a falta de mecanismos colaborativos com suporte a mineração de dados para análise espacial. As dificuldades aumentam com a disseminação de diferentes estruturas de dados espaciais a exemplo de padrões CAD/GIS produzidas através do rápido avanço das tecnologias de informação, sendo reais os desafios para implementação de uma infraestrutura interoperável e foco de várias discussões. Entretanto o acesso a esses dados via internet e os problemas ocasionados na troca dos mesmos estão relacionados diretamente a natureza particular de cada padrão adotado, por isso devem ser analisados e adequados para colaboração. Inicialmente a hipótese do trabalho visa intensificar a interoperabilidade entre dados espaciais e a integração de sistemas, tornando possível estabelecer canais de comunicação para um ambiente colaborativo visando ações potenciais e cooperativas. A partir disso...

Pré-processamento para a mineração de dados

Schmitt, Jeovani
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: 146 f.| grafs. tab.
POR
Relevância na Pesquisa
106.14%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.; A mineração de dados em grandes bases pode requerer alto tempo computacional. Além do mais, é comum as bases de dados conterem variáveis mensuradas em diferentes níveis: intervalar, ordinal e nominal. Neste caso, técnicas desenvolvidas para variáveis quantitativas não poderiam ser aplicadas sob as variáveis originais. Como exemplo, pode-se citar a análise de agrupamentos pelo método das k-médias. Este exige que as variáveis de entradas sejam quantitativas. Este trabalho apresenta uma metodologia para a fase do pré-processamento em mineração de dados, que utiliza a análise de componentes principais (ACP) com escalonamento ótimo (EO). O pré-processamento é uma etapa fundamental que pode melhorar a performance dos algoritmos de análise, através da redução de dimensionalidade. O escalonamento ótimo permite analisar bases que contenham variáveis observadas em diferentes níveis de mensuração. Através da ACP é possível obter uma redução das variáveis originais em um número de componentes principais, gerando novas coordenadas, menor que o número de variáveis originais. As novas coordenadas podem ser utilizadas na mineração de dados propriamente dita...

Mineração de dados em base de germoplasma

Hiragi, Gilberto de Oliveira
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Dissertação
POR
Relevância na Pesquisa
106.16%
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2008.; Os bancos de germoplasma do SIBRARGEN (Sistema Brasileiro de Informações em Recursos Genéticos) funcionam como um grande catálogo das espécies vegetais e de seus acessos (tipos característicos dentro de um grupo ou variabilidades dentro da espécie), contendo mais de 100 mil acessos catalogados. Esses bancos incluem a identificação do acesso (passaporte), descrição dos aspectos genótipos (caracterização) e descrição dos aspectos fenótipos (avaliação) e permitem aos pesquisadores dessa área realizarem consultas SQL mas recuperando apenas os dados armazenados, resultantes da resolução das expressões booleanas utilizadas como critérios de busca. Essas consultas não facilitam a descoberta de novos conhecimentos ou a construção de modelos de previsão ou descrição. Essa pesquisa propõe uma metodologia de mineração de dados, derivada do modelo de referência CRISP/DM, que auxilie a exploração dessas bases de dados por pesquisadores não vinculados à área de informática (por exemplo, biólogos ou agrônomos) visando facilitar a realização de tarefas previstas nas seguintes fases do CRISP/DM: entendimento do negócio...

Preparação de dados para a modelagem de ocorrências da ferrugem asiática da soja.

MEGETO, G. A. S.; MEIRA, C. A. A.; OLIVEIRA, S. R. de M.; GODOY, C. V.; MASSRUHÁ, S. M. F. S.
Fonte: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7., 2009, Viçosa, MG. Anais... Viçosa, MG: UFV, 2009. Publicador: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7., 2009, Viçosa, MG. Anais... Viçosa, MG: UFV, 2009.
Tipo: Artigo em anais de congresso (ALICE) Formato: Não paginado.
PT_BR
Relevância na Pesquisa
115.98%
A ferrugem asiática da soja é uma das principais doenças da cultura. As perdas estimadas em grãos com a doença no Brasil são significativas. O objetivo deste trabalho foi realizar a preparação dos dados para a modelagem de ocorrências da ferrugem asiática, visando descobrir padrões que permitam predizer o risco do aparecimento de focos da doença. Os dados brutos se constituíram de registros de ocorrência da ferrugem em diferentes locais do Brasil, de 2004 a 2009, obtidos do Consórcio Antiferrugem, e de registros meteorológicos da base de dados do Agritempo. A integração dos dados meteorológicos com os registros de ocorrência foi feita com base no período latente do patógeno. Atributos novos foram criados, enquanto outros foram eliminados, por irrelevância ou por falta de dados. A tarefa de mineração de dados escolhida inicialmente foi a classificação, e os casos de ocorrência da ferrugem definiram a classe positiva. Os casos da classe negativa foram criados para uma data anterior à de ocorrência da ferrugem, supondo-se não ter havido ocorrência antes da identificação confirmada. A preparação dos dados resultou no conjunto de treinamento para a modelagem com 7076 exemplos, divididos igualmente em 3038 casos de ocorrência e de não ocorrência. O número de ocorrências diminuiu bastante em relação à quantidade original...

Mineração de dados para inferência de relações solo-paisagem em mapeamentos digitais de solo.

CRIVELENTI, R. C.; COELHO, R. M.; ADAMI, S. F.; OLIVEIRA, S. R. de M.
Fonte: Pesquisa Agropecuária Brasileira, Brasília, DF, v. 44, n. 12, p.1707-1715, dez. 2009 Publicador: Pesquisa Agropecuária Brasileira, Brasília, DF, v. 44, n. 12, p.1707-1715, dez. 2009
Tipo: Artigo em periódico indexado (ALICE)
PT_BR
Relevância na Pesquisa
116.08%
O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original.; 2009

Mineração de dados para a análise e o alerta da ferrugem asiática da soja.

MEGETO, G. A. S.; MEIRA, C. A. A.; OLIVEIRA, S. R. de M.
Fonte: In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 6., 2010, Campinas. Resumos... Campinas : Embrapa Informática Agropecuária, 2010. Publicador: In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 6., 2010, Campinas. Resumos... Campinas : Embrapa Informática Agropecuária, 2010.
Tipo: Resumo em anais de congresso (ALICE) Formato: p. 57-61.
PT_BR
Relevância na Pesquisa
126.01%
A proposta deste trabalho é utilizar técnicas de mineração de dados (data mining), também conhecida como processo de descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases, KDD), para encontrar padrões em bases de dados relacionadas com a cultura da soja, ferrugem asiática e variáveis climáticas, de maneira semelhante à realizada por Meira (2008).; 2010

Análise e mineração de dados de sensores orbitais para acompanhamento de safras de cana-de-açúcar.

AMARAL, B. F.; CHINO, D. Y.; ROMANI, L. A. S.; GONÇALVES, R. R. V.; SOUSA, E. P. M. de; TRAINA, A. J. M.
Fonte: In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO, 31; WORKSHOP DE COMPUTAÇÃO APLICADA À GESTÃO DO MEIO AMBIENTE E RECURSOS NATURAIS, 3., 2011, Natal. Computação para todos: no caminho da evolução social: anais. Natal: UFRN, 2O11. Publicador: In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO, 31; WORKSHOP DE COMPUTAÇÃO APLICADA À GESTÃO DO MEIO AMBIENTE E RECURSOS NATURAIS, 3., 2011, Natal. Computação para todos: no caminho da evolução social: anais. Natal: UFRN, 2O11.
Tipo: Artigo em anais de congresso (ALICE) Formato: p. 1472-1481.
PT_BR
Relevância na Pesquisa
115.92%
Resumo. O impacto causado por eventos climáticos extremos em todo o mundo tem motivado pesquisas para redução de gases de efeito estufa. No Brasil, a cana-de-açúcar é a principal fonte para produção de etanol, como alternativa a combustíveis fósseis. Nesse contexto, dados de sensoriamento remoto têm sido utilizados para monitorar safras de cana-de-açúcar e apoiar pesquisas científicas. Neste trabalho, é proposta uma metodologia baseada em agrupamento de dados para analisar séries temporais de NDVI obtidas de satélites AVHRR/NOAA. Os experimentos mostram que a abordagem proposta permite identificar áreas com padrões de desenvolvimento similares, considerando também os diferentes ciclos de vida da cultura.; 2011; WCAMA 2011.

Mineração de dados para classificação das fases fenológicas da cultura da cana-de-açúcar utilizando dados do sensor modis e de precipitação.

ANTUNES, J. F. G.; OLIVEIRA, S. R. de M.; RODRIGUES, L. H. A.
Fonte: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 8., 2011, Bento Gonçalves. Anais... Florianópolis: UFSC; Pelotas: UFPel, 2011. Publicador: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 8., 2011, Bento Gonçalves. Anais... Florianópolis: UFSC; Pelotas: UFPel, 2011.
Tipo: Artigo em anais de congresso (ALICE) Formato: Não paginado.
PT_BR
Relevância na Pesquisa
126.13%
RESUMO: Os dados do sensor MODIS (Moderate Resolution Imaging Spectroradiometer) fornecem coberturas de áreas com grande extensão e alta periodicidade, características fundamentais que possibilitam o monitoramento de culturas agrícolas estratégicas para o Brasil, como a da cana-de-açúcar. A mineração de dados é uma abordagem promissora para melhorar a análise de dados de sensoriamento remoto. O objetivo deste trabalho foi aplicar técnicas de mineração de dados para classificação das fases fenológicas da cana-de-açúcar no Estado de São Paulo, utilizando dados MODIS e, também, de precipitação que auxiliam na caracterização do ciclo de desenvolvimento da cultura. As abordagens de seleção de atributos mostraram que todos os atributos do conjunto de dados foram considerados relevantes para a classificação. O balanceamento de classes pelo método de amostragem foi fundamental para melhorar a acurácia do modelo de classificação gerado pelo algoritmo J48. A descoberta do conhecimento pode ser feita através de regras de decisão relevantes para especialistas, revelando a aderência de técnicas de mineração de dados em problemas de classificação de imagens de satélite.; 2011; SBIAgro 2011.

Mineração de dados: conceitos e um estudo de caso sobre certificação racial de ovinos.

VIEIRA, F. D.; OLIVEIRA, S. R. de M.
Fonte: In: MASSRUHÁ, S. M. F. S.; LEITE, M. A. de A.; LUCHIARI JUNIOR, A.; ROMANI, L. A. S. (Ed.). Tecnologias da informação e comunicação e suas relações com a agricultura. Brasília, DF: Embrapa, 2014. Cap. 14. Publicador: In: MASSRUHÁ, S. M. F. S.; LEITE, M. A. de A.; LUCHIARI JUNIOR, A.; ROMANI, L. A. S. (Ed.). Tecnologias da informação e comunicação e suas relações com a agricultura. Brasília, DF: Embrapa, 2014. Cap. 14.
Tipo: Capítulo em livro técnico-científico (ALICE) Formato: p. 273-292.
PT_BR
Relevância na Pesquisa
126.02%
Descoberta de conhecimento em banco de dados. Tarefas e técnicas de mineração de dados. Modelo do processo de descoberta de conhecimento em bases de dados. Estudo de caso. Modelagem para certificação racial de ovinos; 2014

Mapeamento pedológico digital da folha Botucatu (SF-22-Z-B-VI-3): treinamento de dados em mapa tradicional e validação de campo.

SILVA, C. C. da; COELHO, R. M.; OLIVEIRA, S. R. de M.; ADAMI, S. F.
Fonte: Revista Brasileira de Ciência do Solo, Campinas, v. 37, n. 4., p. 846-857, 2013. Publicador: Revista Brasileira de Ciência do Solo, Campinas, v. 37, n. 4., p. 846-857, 2013.
Tipo: Artigo em periódico indexado (ALICE)
PT_BR
Relevância na Pesquisa
116.04%
O mapeamento digital de solos permite prever padrões de ocorrência de solos com base em áreas de referência e no uso de técnicas de mineração de dados para modelar associações solo-paisagem. Os objetivos deste trabalho foram produzir um mapa pedológico digital por meio de técnicas de mineração de dados aplicadas a variáveis geomorfométricas e de geologia, com base em áreas de referência; e testar a confiabilidade desse mapa por meio de validação em campo com diferentes sistemas de amostragem. O mapeamento foi realizado na folha Botucatu (SF-22-Z-B-VI-3), utilizando-se as folhas 1:50.000, Dois Córregos e São Pedro, como áreas de referência. Variáveis descritoras do relevo e de geologia associadas às unidades de mapeamento pedológico das áreas de referência compuseram a matriz de dados de treinamento. A matriz foi analisada pelo algoritmo PART de árvore de decisão, do aplicativo Weka (Waikato Environment for Knowledge Analysis), que cria regras de classificação. Essas regras foram aplicadas aos dados geomorfométricos e geológicos da folha Botucatu, para predição de unidades de mapeamento pedológico. A validação de campo dos mapas digitais deu-se por meio de amostragem por transectos em uma unidade de mapeamento da folha São Pedro e de forma aleatório-estratificada na folha Botucatu. A avaliação da unidade de mapeamento na folha São Pedro verificou confiabilidade...

Processo de mineração de dados como apoio à decisão no controle de gastos públicos

Wanderley lubambo, Sandra; Crispim Vasconcelos, Germano (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
106.15%
Considerando que, cada vez mais, tanto a sociedade como as instituições da esfera governamental, vêm exigindo dos órgãos responsáveis uma atuação de controle de gestão mais eficiente. Resta, a essas instituições, a difícil missão de realizar suas tarefas que são fortemente dependentes de informações e de recursos adequados para tratamento das mesmas. A mineração de dados como parte de processo de descoberta de conhecimento em bases de dados vem se consolidando como opção para o tratamento de grandes volumes de dados, no sentido de extrair conhecimento dos mesmos. Essa dissertação apresenta, como principal contribuição, investigar uma solução de mineração de dados fundamentada na metodologia Cross-Industry Standard Process for Data Mining (CRISIP-DM), metodologia não proprietária que define um processo de mineração de dados de forma estruturada e não linear, e em indução de regras de associação como apoio à decisão no controle da gestão pública, mais especificamente controle de gastos públicos. Os recursos estudados e avaliados foram dispostos em conformidade com uma metodologia específica para processo de mineração de dados. Na investigação do problema, a escolha da técnica de inteligência artificial...

Mineração de dados aplicada à celeridade processual do tribunal de contas do estado de Pernambuco (TCE-PE)

Uilma Rodrigues dos Santos de Sousa, Maria; Jorge Leitão Adeodato, Paulo (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
116.12%
A celeridade processual das Cortes de Decisão indica grau de desenvolvimento das nações. A morosidade processual, por sua vez, pode ser usada para medir o seu nível de subdesenvolvimento, uma vez que causa prejuízos sociais, ao erário e, mais especificamente, ao cidadão que é parte em um processo. No Brasil, trata-se de um problema real, de larga escala, cuja solução ainda não foi investigada usando as técnicas de mineração de dados, conforme demonstra a pesquisa realizada em todos os 33 (trinta e três) Tribunais de Contas nacionais. Este trabalho investiga a aplicação de mineração de dados como metodologia de tecnologia da informação para apoio à solução do problema da morosidade processual e do retrabalho, que resultam em aumento dos estoques de processos nas Cortes de Decisão. As bases de dados foram integradas, os dados foram transformados, o conhecimento foi extraído e o desempenho dos modelos avaliado. Para extração do conhecimento, foram utilizadas técnicas de Inteligência Artificial, tradicionalmente aceitas: Regras de Classificação, para a descrição das condições que influenciam o problema e, Redes Neurais Artificiais, para a construção dos classificadores. A qualidade da solução desenvolvida e sua aceitação pelos especialistas no domínio mostraram a viabilidade de utilizar Mineração de Dados para apoio à decisão gerencial na administração do estoque de processos dos Tribunais de Contas. Para o estudo de caso foram utilizados os dados do Tribunal de Contas do Estado de Pernambuco

Mineração de padrões seqüênciais múltiplos

Furtado, Daniel Antônio
Fonte: Universidade Federal de Uberlândia Publicador: Universidade Federal de Uberlândia
Tipo: Dissertação
POR
Relevância na Pesquisa
106.15%
A descoberta de padrões seqüenciais constitui um importante problema em mineração de dados e possui aplicações nas mais diversas áreas tais como mercado financeiro, medicina, análise de mercado, telecomunicações, comércio eletrônico, etc. A maioria das pesquisas já realizadas sobre a mineração de padrões seqüenciais concentra-se na descoberta de padrões temporais que podem ser especificados, de alguma maneira, na Lógica Temporal Proposicional. Entretanto, existem alguns padrões seqüenciais interessantes que necessitam de um formalismo mais expressivo, o da Lógica Temporal de Primeira Ordem. Nesta dissertação estamos propondo um novo padrão temporal, que denominamos de padrão seqüencial múltiplo, que é um padrão temporal de primeira ordem e tem como ob- jetivo representar o perfil de indivíduos/objetos relacionados entre si, ao longo do tempo. Nosso padrão possui aplicações em várias áreas, como no mercado financeiro e no varejo. Propomos dois algoritmos para efetuar a mineração de todos esses padrões freqüentes em um banco de dados: o algoritmo PM (Projection Miner), que realiza a mineração decompondo o padrão de primeira ordem em componentes proposicionais e adapta idéias do algoritmo GSP (que minera padrões seqüenciais proposicionais); e o algoritmo SM (Simul- taneous Miner)...

CobMiner - Mineração de padrões arborescentes com restrições

Silva, Nyara de Araújo
Fonte: Universidade Federal de Uberlândia Publicador: Universidade Federal de Uberlândia
Tipo: Dissertação
POR
Relevância na Pesquisa
106.21%
Há muito trabalho em mineração de padrões com foco em estruturas de dados simples como itemsets ou seqüência de itemsets. Entretanto, recentes aplicações utilizam dados mais complexos como componentes químicos, estruturas proteicas, rede social, XML e logs da Web, exigindo estruturas de dados mais sofisticadas (árvores ou grafos) para serem especificadas. Aqui, padrões de interesse não envolvem apenas valores de objetos frequentes labels que aparecem em árvores (ou grafos), mas também topologias específicas frequentes encontradas nessas estruturas. A mineração de padrões de árvores frequentes tem sido bastante estudada, com a motivação do crescente interesse e aplicabilidade em diferentes áreas (Web Mining, Bioinformática, etc.). Porém, os sistemas convencionais de mineração de árvores permitiam ao usuário apenas definir o suporte mínimo como mecanismo de filtro dos padrões a serem minerados. Após o processo de mineração, um árduo trabalho é necessário para filtrar os padrões de interesse dos usuários. Nessa dissertação, propomos o algoritmo CobMiner, Constrained-based Miner, um algoritmo de mineração de padrões arborescentes, incorporando ao processo de mineração os Autômatos de Árvores...

Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados; Automatic discovery of associations by Apriori data mining technique

ALMEIDA, Derciley Cunha de
Fonte: Universidade Federal de Goiás; BR; UFG; Mestrado em Engenharia Elétrica e de Computação; Engenharia Publicador: Universidade Federal de Goiás; BR; UFG; Mestrado em Engenharia Elétrica e de Computação; Engenharia
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
116.17%
Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however...