Página 1 dos resultados de 227 itens digitais encontrados em 0.057 segundos

Árvores de decisão bicritério em análise de projectos

Godinho, Pedro Manuel Cortesão
Fonte: Universidade de Coimbra Publicador: Universidade de Coimbra
Tipo: Tese de Doutorado
POR
Relevância na Pesquisa
86.27%
O presente trabalho apresenta uma abordagem multicritério à análise e selecção de estratégias em projectos de investimento, que utiliza árvores de decisão e modelos discretos de opções reais e se baseia na identificação das estratégias não dominadas. Apenas se pormenoriza a utilização do tempo e do valor financeiro (ou o custo, que pode ser usado de forma análoga), mas a abordagem pode ser estendida a outros critérios. A dimensão das árvores de decisão correspondentes à abordagem pode levar a que a sua construção por um utilizador humano demore muito tempo, constituindo assim um entrave à sua aplicação. Há, no entanto, vários tipos de situações que podem ser modeladas utilizando um número limitado de parâmetros, o que permite que a construção das árvores seja automatizada em sistemas computacionais. Assim, apresenta-se um modelo bicritério, baseado na abordagem, para a análise de um tipo particular de tarefas que possam ser empreendidas através de um conjunto de diferentes processos. As árvores que correspondem ao modelo podem atingir dimensões que tornem a sua construção e avaliação impraticáveis, mesmo em sistemas computacionais. Tendo este facto em conta, é proposto um algoritmo para a identificação mais rápida das estratégias não dominadas do modelo...

LEGAL-Tree: um algoritmo genético multi-objetivo para indução de árvores de decisão; LEGAL-Tree: a lexocographic genetic algorithm for learning decision trees

Basgalupp, Márcio Porto
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 23/02/2010 PT
Relevância na Pesquisa
116.3%
Dentre as diversas tarefas em que os algoritmos evolutivos têm sido empregados, a indução de regras e de árvores de decisão tem se mostrado uma abordagem bastante atrativa em diversos domínios de aplicação. Algoritmos de indução de árvores de decisão representam uma das técnicas mais populares em problemas de classificação. Entretanto, os algoritmos tradicionais de indução apresentam algumas limitações, pois, geralmente, usam uma estratégia gulosa, top down e com particionamento recursivo para a construção das árvores. Esses fatores degradam a qualidade dos dados, os quais podem gerar regras estatisticamente não significativas. Este trabalho propõe o algoritmo LEGAL-Tree, uma nova abordagem baseada em algoritmos genéticos para indução de árvores de decisão. O algoritmo proposto visa evitar a estratégia gulosa e a convergência para ótimos locais. Para isso, esse algoritmo adota uma abordagem multi-objetiva lexicográfica. Nos experimentos realizados sobre bases de dados de diversos problemas de classificação, a função de fitness de LEGAL-Tree considera as duas medidas mais comuns para avaliação das árvores de decisão: acurácia e tamanho da árvore. Os resultados obtidos mostraram que LEGAL-Tree teve um desempenho equivalente ao algoritmo SimpleCart (implementação em Java do algoritmo CART) e superou o tradicional algoritmo J48 (implementação em Java do algoritmo C4.5)...

Uma abordagem para a indução de árvores de decisão voltada para dados de expressão gênica; An Approach for the Induction of Decision Trees Focused on Gene Expression Data

Perez, Pedro Santoro
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 18/04/2012 PT
Relevância na Pesquisa
106.27%
Estudos de expressão gênica têm sido de extrema importância, permitindo desenvolver terapias, exames diagnósticos, medicamentos e desvendar uma infinidade de processos biológicos. No entanto, estes estudos envolvem uma série de dificuldades: grande quantidade de genes, sendo que geralmente apenas um pequeno número deles está envolvido no problema estudado; presença de ruído nos dados analisados; entre muitas outras. O projeto de pesquisa deste mestrado consiste no estudo de algoritmos de indução de árvores de decisão; na definição de uma metodologia capaz de tratar dados de expressão gênica usando árvores de decisão; e na implementação da metodologia proposta como algoritmos capazes de extrair conhecimento a partir desse tipo de dados. A indução de árvores de decisão procura por características relevantes nos dados que permitam modelar precisamente um conceito, mas tem também a preocupação com a compreensibilidade do modelo gerado, auxiliando os especialistas na descoberta de conhecimento, algo importante nas áreas médica e biológica. Por outro lado, tais indutores apresentam relativa instabilidade, podendo gerar modelos bem diferentes com pequenas mudanças nos dados de treinamento. Este é um dos problemas tratados neste mestrado. Mas o principal problema tratado se refere ao comportamento destes indutores em dados de alta dimensionalidade...

Uma adaptação do método Binary Relevance utilizando árvores de decisão para problemas de classificação multirrótulo aplicado à genômica funcional; An Adaptation of Binary Relevance for Multi-Label Classification applied to Functional Genomics

Tanaka, Erica Akemi
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 30/08/2013 PT
Relevância na Pesquisa
86.03%
Muitos problemas de classificação descritos na literatura de aprendizado de máquina e mineração de dados dizem respeito à classificação em que cada exemplo pertence a um único rótulo. Porém, vários problemas de classificação, principalmente no campo de Bioinformática são associados a mais de um rótulo; esses problemas são conhecidos como problemas de classificação multirrótulo. O princípio básico da classificação multirrótulo é similar ao da classificação tradicional (que possui um único rótulo), sendo diferenciada no número de rótulos a serem preditos, na qual há dois ou mais rótulos. Na área da Bioinformática muitos problemas são compostos por uma grande quantidade de rótulos em que cada exemplo pode estar associado. Porém, algoritmos de classificação tradicionais são incapazes de lidar com um conjunto de exemplos mutirrótulo, uma vez que esses algoritmos foram projetados para predizer um único rótulo. Uma solução mais simples é utilizar o método conhecido como método Binary Relevance. Porém, estudos mostraram que tal abordagem não constitui uma boa solução para o problema da classificação multirrótulo, pois cada classe é tratada individualmente, ignorando as possíveis relações entre elas. Dessa maneira...

On the automatic design of decision-tree induction algorithms; Sobre o projeto automático de algoritmos de indução de árvores de decisão

Barros, Rodrigo Coelho
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 06/12/2013 EN
Relevância na Pesquisa
116.26%
Decision-tree induction is one of the most employed methods to extract knowledge from data. There are several distinct strategies for inducing decision trees from data, each one presenting advantages and disadvantages according to its corresponding inductive bias. These strategies have been continuously improved by researchers over the last 40 years. This thesis, following recent breakthroughs in the automatic design of machine learning algorithms, proposes to automatically generate decision-tree induction algorithms. Our proposed approach, namely HEAD-DT, is based on the evolutionary algorithms paradigm, which improves solutions based on metaphors of biological processes. HEAD-DT works over several manually-designed decision-tree components and combines the most suitable components for the task at hand. It can operate according to two different frameworks: i) evolving algorithms tailored to one single data set (specific framework); and ii) evolving algorithms from multiple data sets (general framework). The specific framework aims at generating one decision-tree algorithm per data set, so the resulting algorithm does not need to generalise beyond its target data set. The general framework has a more ambitious goal, which is to generate a single decision-tree algorithm capable of being effectively applied to several data sets. The specific framework is tested over 20 UCI data sets...

Indução automática de árvores de decisão

Paula, Maurício Braga de
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: ii, 85 f.| il., tabs.
POR
Relevância na Pesquisa
116.12%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.; Com o considerável aumento da quantidade de informações disponíveis, as capacidades de aquisição automática de conhecimento têm se tornado muito importante. A capacidade de aprendizagem e de aplicação do conhecimento é uma das características da inteligência humana e uma das principais áreas de análise da Inteligência Artificial. As atividades humanas mais comuns exibem a aplicação do conhecimento adquirido pelo homem, podendo ser consideradas tarefas de classificação; termo no qual decorre da necessidade de uma tomada de decisão ou da realização de uma previsão com base em informações disponíveis. O Aprendizado de Máquina (AM), um dos nichos da Inteligência Artificial, é uma das eficazes maneiras de adquirir inteligência de qualquer sistema computacional. Este trabalho consiste na construção de um procedimento de indução automática de árvores de decisão simbólica a partir de amostras de dados com atributos não binários. O objetivo deste, é extrair informações de um conjunto de treinamento de instâncias possivelmente conhecidas do problema e subseqüentemente classificar novas instâncias em suas respectivas classes.

Árvores de decisão aplicadas à detecção de fraudes bancárias

Ramos, José Abílio de Paiva
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Dissertação
POR
Relevância na Pesquisa
95.96%
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014.; A oferta de produtos e serviços bancários através de canais virtuais tem aumentado nos últimos anos e, apesar do uso de diversas tecnologias de segurança, ainda existem transações fraudulentas que são concluídas com sucesso. Além disso, frequentemente os atacantes se adaptam a novas tecnologias mais rapidamente que as empresas alvejadas. Como proposta para aprimorar e agilizar as reações a fraudes, este trabalho visa indução automática de árvores de decisão a partir de amostras de dados transacionais para a identificação de transações fraudulentas. Os resultados são superiores aos alcançados pelo sistema vigente na instituição financeira, indicando que sua adoção, acompanhada de medidas reativas, podem reduzir os prejuízos financeiros, aumentar a recuperação de valores e diminuir o risco de dano à imagem da instituição, bem como o desgaste junto aos clientes. ________________________________________________________________________________ ABSTRACT; The offer of products and services by banks through virtual channels has increased in recent years and, despite the use of various technologies for security...

Modelação da qualidade da água em sistemas de abastecimento público

Dias, Susana Rute Guerra
Fonte: Universidade de Évora Publicador: Universidade de Évora
Tipo: Dissertação de Mestrado
POR
Relevância na Pesquisa
95.96%
A problemática relacionada com a modelação da qualidade da água destinada ao abastecimento público pode ser abordada de diversos pontos de vista. Neste trabalho recorre-se a metodologias de resolução de problemas que emanam da Área Científica da Inteligência Artificial, assim como a ferramentas utilizadas na procura de soluções como as Árvores de Decisão, as Redes Neuronais Artificiais e a Aproximação de Vizinhanças. Actualmente os métodos de avaliação da qualidade da água são muito restritivos já que não permitem aferir a qualidade da água em tempo real. O desenvolvimento de modelos de previsão baseados em técnicas de Descoberta de Conhecimento em Bases de Dados, mostrou ser uma alternativa tendo em vista um comportamento pró-activo que pode contribuir decisivamente para diagnosticar e melhorar a qualidade da água disponibilizada às populações. No decurso do trabalho, foi utilizada a aprendizagem não-supervisionada tendo em vista encontrar grupos distintos de águas com propriedades físico-químicas semelhantes; ABSTRACT:The problems related to the modelling of water quality for public supply can be approached from different viewpoints. This work resorts to methods of resolving problems emanating from the Scientific Area of Artificial Intelligence as well as to tools used in the search for solutions such as Decision Trees...

Utilização de imagens de satélite de alta resolução para a extracção de elementos em ambiente urbano

Martins, Nuno Miguel Nogueira
Fonte: Universidade de Lisboa Publicador: Universidade de Lisboa
Tipo: Dissertação de Mestrado
Publicado em //2012 POR
Relevância na Pesquisa
86.13%
Tese de mestrado em Engenharia Geográfica, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012; Pretende-se, com a elaboração desta dissertação, explorar o potencial das imagens do satélite WorldView-2 para a extração de elementos em ambiente urbano em comparação com os resultados obtidos com outras imagens de muito alta resolução espacial, tais como as dos satélites QuickBird e Ikonos. Para tal, foi realizado um estudo comparativo recorrendo à utilização de diversos métodos de classificação supervisionada e não-supervisionada de imagens satélite, os quais se baseiam apenas nas características espetrais das imagens e também à construção de árvores de decisão, utilizando índices de vegetação e um modelo digital de superfície normalizado da área de estudo. Neste trabalho, os resultados obtidos no método de classificação de árvores de decisão foram mais precisos porque apenas neste método é que foram utilizados os respetivos dados auxiliares. As principais dificuldades encontradas na execução deste trabalho estão relacionados com os erros de classificação resultantes das características complexas dos ambientes urbanos, sendo que a existência de sombras e de rebatimentos nas estruturas mais elevadas correspondem também a limitações deste tipo de imagens. Neste estudo verificou-se que...

Árvores de decisão e redes neuronais: aplicação a web mining

Henriques, Marcos André Pais
Fonte: Instituto Universitário de Lisboa Publicador: Instituto Universitário de Lisboa
Tipo: Dissertação de Mestrado
Publicado em //2010 POR
Relevância na Pesquisa
106.09%
Projecto de Mestrado em Prospecção e Análise de Dados/C44; C45; M31; A evolução do conceito de Marketing coloca a relação com o cliente no centro da estratégia da empresa. O fácil acesso a informação torna os clientes mais exigentes e susceptíveis à mudança de marcas com que se relacionam. Assim, as empresas sentem a necessidade de implementar estratégias de CRM – Customer Relationship Managemen que permitam obter informação e enviar estímulos aos clientes em todos os pontos de contacto destes com a empresa. Este trabalho explora o potencial da Internet enquanto ferramenta que permite obter conhecimento sobre os consumidores, centrando-se na análise de dados obtidos através do site de um Clube de Fidelização de uma marca de Grande Consumo. Assim, propõe-se com este trabalho uma metodologia de Web Mining de utilização que permita predizer comportamentos futuros, através de dados previamente recolhidos acerca dos comportamentos de utilização por parte dos utilizadores registados. Para tal, a metodologia proposta assenta em duas etapas: segmentação e modelação. Na segmentação dos utilizadores recorre-se ao algoritmo Two-Step, reflectindo os comportamentos ao longo de três anos após a data de registo. Para a modelação...

Estratégia multi-temporal para produção automática de cartografia de ocupação do solo com imagens AWiFS

Costa, Hugo Alexandre Gomes da
Fonte: Universidade Nova de Lisboa Publicador: Universidade Nova de Lisboa
Tipo: Dissertação de Mestrado
Publicado em 17/02/2009 POR
Relevância na Pesquisa
86.09%
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Ciência e Sistemas de Informação Geográfica; A produção de cartografia de ocupação do solo por métodos tradicionais (interpretação visual de imagens aéreas e de satélite) é um processo com custos que inviabilizam a sua rápida produção e frequente actualização. Esta realidade é bastante lesante para diversas aplicações que necessitam deste género de informação actualizada. Uma solução viável para fazer face à problemática da desactualização da cartografia de ocupação do solo é a criação de um produto menos detalhado do que a cartografia produzida pelos programas operacionais já existente. Isto permite que o novo produto seja mais barato e possa ser produzido por métodos automáticos, realizável regularmente, que ofereça informação actual e seja útil para diversas aplicações. Neste sentido, foi explorado um conjunto de dados intra-anual composto por três imagens AWiFS (Abril, Julho e Outubro de 2006) para avaliar as imagens e métodos automáticos de produção que possam derivar cartografia de ocupação do solo de Portugal Continental no âmbito de um novo programa operacional anual. Foram testados dois classificadores: um classificador paramétrico convencional (classificador da máxima verosimilhança) e um classificador não paramétrico (árvores de decisão). Foram desenhados vários testes para avaliar a melhor abordagem de classificação...

Modelos de alerta para o controle da ferrugem-do-cafeeiro em lavouras com alta carga pendente

Meira,Carlos Alberto Alves; Rodrigues,Luiz Henrique Antunes; Moraes,Sérgio Almeida de
Fonte: Embrapa Informação Tecnológica; Pesquisa Agropecuária Brasileira Publicador: Embrapa Informação Tecnológica; Pesquisa Agropecuária Brasileira
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/03/2009 PT
Relevância na Pesquisa
86.12%
O objetivo deste trabalho foi desenvolver árvores de decisão como modelos de alerta da ferrugem-do-cafeeiro em lavouras de café (Coffea arabica L.) com alta carga pendente de frutos. Dados de incidência mensal da doença no campo coletados durante oito anos foram transformados em valores binários considerando limites de 5 e 10 pontos percentuais na taxa de infecção. Foi gerado um modelo para cada taxa de infecção binária a partir de dados meteorológicos e do espaçamento entre plantas. O alerta é indicado quando a taxa de infecção, prevista para o prazo de um mês, atingir ou ultrapassar o respectivo limite. A acurácia do modelo para o limite de 5 pontos percentuais foi de 81%, por validação cruzada, chegando até 89% segundo estimativa otimista. Esse modelo apresentou bons resultados para outras medidas de avaliação importantes, como sensitividade (80%), especificidade (83%) e confiabilidades positiva (79%) e negativa (84%). O modelo para o limite de 10 pontos percentuais teve acurácia de 79%, e não apresentou o mesmo equilíbrio entre as demais medidas. Em conjunto, esses modelos podem auxiliar na tomada de decisão referente ao controle da ferrugem-do-cafeeiro no campo. A indução de árvores de decisão é alternativa viável às técnicas convencionais de modelagem e facilita a compreensão dos modelos.

Avaliação de cinco algoritmos de árvores de decisão e três tipos de modelos digitais de elevação para mapeamento digital de solos a nível semidetalhado na Bacia do Lageado Grande, RS, Brasil

Giasson,Elvio; Hartemink,Alfred Eduard; Tornquist,Carlos Gustavo; Teske,Rodrigo; Bagatini,Tatiane
Fonte: Universidade Federal de Santa Maria Publicador: Universidade Federal de Santa Maria
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/11/2013 PT
Relevância na Pesquisa
86.15%
O mapeamento digital de solos (MDS) tem como base a geração de sistemas de informações que permitem estabelecer relações matemáticas entre variáveis ambientais e solos e, dessa forma, predizer a distribuição espacial das classes ou propriedades dos solos. Dentre as abordagens mais utilizadas, as árvores de decisão têm se destacado por apresentar bons resultados no MDS. Por outro lado, dada a disponibilidade de novas fontes de informação sobre a elevação, torna-se necessário o teste e avaliação de modelos digitais de elevação (MDE) quanto ao seu uso para o MDS. Este estudo testa cinco algoritmos de árvores de decisão (Simple Chart, Random Tree, REP Tree, BF Tree e J48) e três MDE (Aster GDEM, SRTM e SRTM V3) para o MDS a nível semidetalhado, em situações em que o principal fator diferenciador entre os tipos de solo é o relevo. O uso do MDE Aster GDEM e árvore de decisão com algoritmo J48, Simple Tree e BF Tree foram os que produziram modelos de árvore de decisão capazes de produzir mapas de solo com maior similaridade ao mapa de referência.

Modelos de alerta para o controle da ferrugem-do-cafeeiro em lavouras com alta carga pendente.

MEIRA, C.A.A.; RODRIGUES, L.H.A.; MORAES, S.A. de.
Fonte: Pesquisa Agropecuária Brasileira, Brasília, v.44, n. 3, p. 233-242, mar. 2009. Publicador: Pesquisa Agropecuária Brasileira, Brasília, v.44, n. 3, p. 233-242, mar. 2009.
Tipo: Artigo em periódico indexado (ALICE)
PT_BR
Relevância na Pesquisa
86.12%
O objetivo deste trabalho foi desenvolver árvores de decisão como modelos de alerta da ferrugem-do-cafeeiro em lavouras de café (Coffea arabica L.) com alta carga pendente de frutos. Dados de incidência mensal da doença no campo coletados durante oito anos foram transformados em valores binários considerando limites de 5 e 10 pontos percentuais na taxa de infecção. Foi gerado um modelo para cada taxa de infecção binária a partir de dados meteorológicos e do espaçamento entre plantas. O alerta é indicado quando a taxa de infecção, prevista para o prazo de um mês, atingir ou ultrapassar o respectivo limite. A acurácia do modelo para o limite de 5 pontos percentuais foi de 81%, por validação cruzada, chegando até 89% segundo estimativa otimista. Esse modelo apresentou bons resultados para outras medidas de avaliação importantes, como sensitividade (80%), especificidade (83%) e confiabilidades positiva (79%) e negativa (84%). O modelo para o limite de 10 pontos percentuais teve acurácia de 79%, e não apresentou o mesmo equilíbrio entre as demais medidas. Em conjunto, esses modelos podem auxiliar na tomada de decisão referente ao controle da ferrugem-do-cafeeiro no campo. A indução de árvores de decisão é alternativa viável às técnicas convencionais de modelagem e facilita a compreensão dos modelos.; 2009

Árvores de decisão induzidas pelo weka para alerta da ferrugem do cafeeiro em lavouras com alta carga pendente.

MEIRA, C. A. A.; RODRIGUES, L. H. A.
Fonte: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7., 2009, Viçosa, MG. Anais... Viçosa, MG: UFV, 2009. Publicador: In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7., 2009, Viçosa, MG. Anais... Viçosa, MG: UFV, 2009.
Tipo: Artigo em anais de congresso (ALICE) Formato: Não paginado.
PT_BR
Relevância na Pesquisa
106.22%
O objetivo deste trabalho foi desenvolver árvores de decisão com o software livre Weka para alerta da ferrugem do cafeeiro em lavouras com alta carga pendente de frutos e comparar esses modelos com as árvores de decisão induzidas por um software proprietário. Dados de incidência mensal da doença no campo coletados durante oito anos foram transformados em valores binários considerando limites de 5 e 10 pontos percentuais (p.p.) na taxa de infecção. Foi gerado um modelo para cada taxa de infecção binária, a partir de dados meteorológicos e do espaçamento entre plantas. O alerta é indicado quando a taxa de infecção, prevista para o prazo de um mês, atingir ou ultrapassar o respectivo limite. As árvores de decisão induzidas pelo Weka tiveram desempenho semelhante às induzidas pelo software proprietário. Os modelos de alerta para o limite de 5 p.p. induzidos pelas duas ferramentas são praticamente iguais. O modelo considerando o limite de 10 p.p. induzido pelo Weka é mais simples e compacto que o induzido pelo software proprietário.; 2009; SBIAgro 2009.

Mineração de dados para inferência de relações solo-paisagem em mapeamentos digitais de solo.

CRIVELENTI, R. C.; COELHO, R. M.; ADAMI, S. F.; OLIVEIRA, S. R. de M.
Fonte: Pesquisa Agropecuária Brasileira, Brasília, DF, v. 44, n. 12, p.1707-1715, dez. 2009 Publicador: Pesquisa Agropecuária Brasileira, Brasília, DF, v. 44, n. 12, p.1707-1715, dez. 2009
Tipo: Artigo em periódico indexado (ALICE)
PT_BR
Relevância na Pesquisa
95.96%
O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original.; 2009

Mineração de dados baseada em árvores de decisão para análise do perfil de contribuintes

Carla Araújo Simões, Adriana; Crispim Vasconcelos, Germano (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
106.24%
Um dos principais problemas enfrentados por órgãos públicos atualmente está associado à ineficiência no uso de informações contidas em grandes volumes de dados para a gestão e otimização de recursos públicos nos procedimentos de tomada de decisão. Em particular, um dos problemas enfrentados por órgãos reguladores como secretarias de fazenda de Estados é como identificar comportamentos fraudulentos e de sonegação fiscal por parte de contribuintes. A Descoberta de Conhecimento em Bases de Dados (KDD) tem sido cada vez mais explorada como uma ferramenta poderosa na otimização dos procedimentos de tomada de decisão e na extração automática de informações escondidas nos dados de corporações. Em particular, técnicas baseadas em árvores de decisão têm sido investigadas e aplicadas como uma das opções de ferramental tecnológico em problemas de mineração de dados pela sua simplicidade e facilidade de interpretação do conhecimento descoberto, que é próximo da linguagem humana. Neste trabalho, árvores de decisão baseadas nos algoritmos ID3, SPRINT e SLIQ são investigadas e comparadas para a solução do problema de análise do perfil de contribuintes com respeito à sonegação fiscal em uma situação complexa em larga escala envolvendo um grande número de variáveis e dados corporativos da Secretaria da Fazenda do Estado de Pernambuco (SEFAZPE). Os resultados obtidos objetivamente com os modelos investigados quanto à precisão das árvores construídas...

Algoritmo para indução de árvores de classificação para dados desbalanceados; Algorithm for induction of classification trees for unbalanced data

Frizzarini, Cláudio
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 21/11/2013 PT
Relevância na Pesquisa
86.09%
As técnicas de mineração de dados, e mais especificamente de aprendizado de máquina, têm se popularizado enormemente nos últimos anos, passando a incorporar os Sistemas de Informação para Apoio à Decisão, Previsão de Eventos e Análise de Dados. Por exemplo, sistemas de apoio à decisão na área médica e ambientes de \textit{Business Intelligence} fazem uso intensivo dessas técnicas. Algoritmos indutores de árvores de classificação, particularmente os algoritmos TDIDT (Top-Down Induction of Decision Trees), figuram entre as técnicas mais comuns de aprendizado supervisionado. Uma das vantagens desses algoritmos em relação a outros é que, uma vez construída e validada, a árvore tende a ser interpretada com relativa facilidade, sem a necessidade de conhecimento prévio sobre o algoritmo de construção. Todavia, são comuns problemas de classificação em que as frequências relativas das classes variam significativamente. Algoritmos baseados em minimização do erro global de classificação tendem a construir classificadores com baixas taxas de erro de classificação nas classes majoritárias e altas taxas de erro nas classes minoritárias. Esse fenômeno pode ser crítico quando as classes minoritárias representam eventos como a presença de uma doença grave (em um problema de diagnóstico médico) ou a inadimplência em um crédito concedido (em um problema de análise de crédito). Para tratar esse problema...

Aplicação de mineração de dados na identificação de áreas cultivadas com cana-de-açúcar em imagens de sensoriamento remoto no Estado de São Paulo; Application of data mining for identifying sugar cane crop plantations in remote sensing images of the state of São Paulo

Robson Tavares Nonato
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 07/07/2010 PT
Relevância na Pesquisa
86.15%
O surgimento e a evolução das geotecnologias, que podem ser entendidas como tecnologias originadas de estudos e pesquisas na área de sensoriamento remoto, mais especificamente da utilização de sensores situados na órbita do planeta Terra, têm permitido o desenvolvimento de metodologias inovadoras para o mapeamento da cobertura do solo e o monitoramento agrícola. O emprego dessas novas tecnologias tem permitido, também, uma melhoria das metodologias utilizadas na estimativa da produtividade agrícola e na previsão de safras. Mesmo assim, no Brasil, muitas das metodologias empregadas no mapeamento agrícola ainda utilizam as imagens de satélite como material auxiliar, principalmente, em levantamentos amostrais. Isto se deve, em parte, aos avanços necessários no processo de extração de informações das imagens. Dentre estes avanços, deve-se destacar a necessidade de melhoria dos métodos utilizados para identificação e classificação digital de regiões contendo a cultura agrícola de interesse dentro da imagem. Amplamente utilizadas na resolução de problemas de classificação automatizada de dados, nas mais diversas áreas do conhecimento, as técnicas de mineração de dados se apresentam como uma alternativa promissora na resolução de problemas de identificação e classificação de regiões cultivadas com cana-de-açúcar. Dentro desse contexto...

Decision trees for digital soil mapping on subtropical basaltic steeplands; Árvores de decisão para o mapeamento digital de solos em encostas basálticas subtropicais

Giasson, Elvio; Sarmento, Eliana Casco; Weber, Eliseu; Flores, Carlos Alberto; Hasenack, Heinrich
Fonte: Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz Publicador: Universidade de São Paulo. Escola Superior de Agricultura Luiz de Queiroz
Tipo: info:eu-repo/semantics/article; info:eu-repo/semantics/publishedVersion; ; ; ; ; Formato: application/pdf
Publicado em 01/04/2011 ENG
Relevância na Pesquisa
86.21%
When soil surveys are not available for land use planning activities, digital soil mapping techniques can be of assistance. Soil surveyors can process spatial information faster, to assist in the execution of traditional soil survey or predict the occurrence of soil classes across landscapes. Decision tree techniques were evaluated as tools for predicting the ocurrence of soil classes in basaltic steeplands in South Brazil. Several combinations of types of decicion tree algorithms and number of elements on terminal nodes of trees were compared using soil maps with both original and simplified legends. In general, decision tree analysis was useful for predicting occurrence of soil mapping units. Decision trees with fewer elements on terminal nodes yield higher accuracies, and legend simplification (aggregation) reduced the precision of predictions. Algorithm J48 had better performance than BF Tree, RepTree, Random Tree, and Simple Chart.; Quando levantamentos de solos não estão disponíveis para atividades de planejamento de uso das terras, técnicas de mapeamento digital de solos podem ser úteis. Mapeadores de solos podem processar as informações espaciais rapidamente, auxiliando na execução de levantamentos de solos tradicionais ou prevendo a ocorrência de classes de solos na paisagem. Avaliaram-se técnicas de análise de decisão na predição da ocorrência de classes de solos em áreas de encostas basálticas no Sul do Brasil. Várias combinações de tipos de algoritmos de árvore de decisão e quantidade de elementos nos nós terminais das árvores de decisão foram testadas usando mapas de solos com a legenda original e com legenda simplificada. Em geral...