Página 1 dos resultados de 610 itens digitais encontrados em 0.073 segundos

Identificação da mudança de uso da terra usando técnicas de agrupamento de séries temporais de imagens de satélite

Scrivani, Rachel; Amaral, Bruno Ferraz do; Gonçalves, Renata Ribeiro do Valle; Sousa, Elaine Parros Machado de; Zullo Junior, Jurandir; Romani, Luciana Alvim Santos
Fonte: Embrapa Informática Agropecuária; Instituto Nacional de Pesquisas Espaciais - INPE; Universidade do Estado de Mato Grosso - UNEMAT; Universidade Federal do Mato Grosso do Sul - UFMS; Universidade Católica Dom Bosco - UCDB; Campo Grande Publicador: Embrapa Informática Agropecuária; Instituto Nacional de Pesquisas Espaciais - INPE; Universidade do Estado de Mato Grosso - UNEMAT; Universidade Federal do Mato Grosso do Sul - UFMS; Universidade Católica Dom Bosco - UCDB; Campo Grande
Tipo: Conferência ou Objeto de Conferência
POR
Relevância na Pesquisa
95.87%
A disponibilidade de dados orbitais, aliada à necessidade crescente de monitoramento de grandes extensões e de preservação de regiões ambientalmente sensíveis, gera uma oportunidade para o desenvolvimento/adaptação de métodos computacionais. A fim de gerar informações de avaliação temporal e espacial que possam constituir importante ferramenta de planejamento e de orientação à tomada de decisão para o manejo e conservação destas áreas, o objetivo deste trabalho é propor uma abordagem baseada em métodos de agrupamento de séries de imagens de satélite para auxiliar na análise espaço-temporal da mudança do uso da terra, identificando de forma automática, com alta probabilidade de serem áreas inundáveis, floresta, culturas agrícolas e pastagem em escala regional. Séries temporais de imagens do sensor MODIS com valores dos índices de vegetação NDVI e EVI, do período de 2008/2009 a 2013/2014, foram agrupadas por meio do algoritmo K-means. Para uma avaliação da qualidade dos agrupamentos obtidos foi utilizado o coeficiente de Silhueta. Séries temporais de precipitação do satélite TRMM foram utilizadas a fim de correlacionar com os demais resultados obtidos para avaliar a pré-classificação gerada pelo método de agrupamento em anos secos...

Agrupamento híbrido de dados utilizando algoritmos genéticos; Hybrid clustering techniques with genetic algorithms

Naldi, Murilo Coelho
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 16/10/2006 PT
Relevância na Pesquisa
86.07%
Técnicas de Agrupamento vêm obtendo bons resultados quando utilizados em diversos problemas de análise de dados, como, por exemplo, a análise de dados de expressão gênica. Porém, uma mesma técnica de agrupamento utilizada em um mesmo conjunto de dados pode resultar em diferentes formas de agrupar esses dados, devido aos possíveis agrupamentos iniciais ou à utilização de diferentes valores para seus parâmetros livres. Assim, a obtenção de um bom agrupamento pode ser visto como um processo de otimização. Esse processo procura escolher bons agrupamentos iniciais e encontrar o melhor conjunto de valores para os parâmetros livres. Por serem métodos de busca global, Algoritmos Genéticos podem ser utilizados durante esse processo de otimização. O objetivo desse projeto de pesquisa é investigar a utilização de Técnicas de Agrupamento em conjunto com Algoritmos Genéticos para aprimorar a qualidade dos grupos encontrados por algoritmos de agrupamento, principalmente o k-médias. Esta investigação será realizada utilizando como aplicação a análise de dados de expressão gênica. Essa dissertação de mestrado apresenta uma revisão bibliográfica sobre os temas abordados no projeto, a descrição da metodologia utilizada...

Um framework para análise de agrupamento baseado na combinação multi-objetivo de algoritmos de agrupamento; A framework for cluster analysis based in the multi-objective combination of clustering algorithms

Faceli, Katti
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 08/11/2006 PT
Relevância na Pesquisa
85.98%
Esta Tese apresenta um framework para análise exploratória de dados via técnicas de agrupamento. O objetivo é facilitar o trabalho dos especialistas no domínio dos dados. O ponto central do framework é um algoritmo de ensemble multi-objetivo, o algoritmo MOCLE, complementado por um método para a visualização integrada de um conjunto de partições. Pela aplicação conjunta das idéias de ensemble de agrupamentos e agrupamento multi-objetivo, o MOCLE efetua atomaticamente importantes passos da análise de agrupamento: executa vários algoritmos conceitualmente diferentes com várias configurações de parâmetros, combina as partições resultantes desses algoritmos e seleciona as partições com os melhores compromissos de diferentes medidas de validação. MOCLE é uma abordagem robusta para lidar com diferentes tipos de estrutura que podem estar presentes em um conjunto de dados. Ele resulta em um conjunto conciso e estável de estruturas alternativas de alta qualidade, sem a necessidade de conhecimento prévio sobre os dados e nem conhecimento profundo em análise de agrupamento. Além disso, para facilitar a descoberta de estruturas mais complexas, o MOCLE permite a integração automática de conhecimento prévio de uma estrutura simples por meio das suas funções objetivo. Finalmente...

Técnicas de combinação para agrupamento centralizado e distribuído de dados; Ensemble techniques for centralized and distributed clustering

Naldi, Murilo Coelho
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 24/01/2011 PT
Relevância na Pesquisa
86.16%
A grande quantidade de dados gerada em diversas áreas do conhecimento cria a necessidade do desenvolvimento de técnicas de mineração de dados cada vez mais eficientes e eficazes. Técnicas de agrupamento têm sido utilizadas com sucesso em várias áreas, especialmente naquelas em que não há conhecimento prévio sobre a organização dos dados. Contudo, a utilização de diferentes algoritmos de agrupamento, ou variações de um mesmo algoritmo, pode gerar uma ampla variedade de resultados. Tamanha variedade cria a necessidade de métodos para avaliar e selecionar bons resultados. Uma forma de avaliar esses resultados consiste em utilizar índices de validação de agrupamentos. Entretanto, uma grande diversidade de índices de validação foi proposta na literatura, o que torna a escolha de um único índice de validação uma tarefa penosa caso os desempenhos dos índices comparados sejam desconhecidos para a classe de problemas de interesse. Com a finalidade de obter um consenso entre resultados, é possível combinar um conjunto de agrupamentos ou índices de validação em uma única solução final. Combinações de agrupamentos (clustering ensembles) foram bem sucedidas em obter soluções robustas a variações no cenário de aplicação...

Avaliação de algoritmos de agrupamento em grafos para segmentação de imagens; Evaluation of graph clustering algorithms for images segmentation

Belizario, Ivar Vargas
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 12/11/2012 PT
Relevância na Pesquisa
86.13%
A segmentação de imagens e, em visão computacional, uma tarefa de grande importância, para a qual existem várias abordagem. A complexidade de tais abordagens está relacionada à natureza da imagem e também ao grau de precisão da segmentação, que e um conceito bastante subjetivo, normalmente associado a semelhança que apresenta a segmentaçã produzida pela visão humana. Na segmentação de imagens baseada em algoritmos de agrupamento em grafos, geralmente os pixels da imagem compôem os nós do grafo e as arestas representam a similaridade entre estes nós. Assim, a segmentação pode ser obtida por meio do agrupamento dos nós do grafo. É importante salientar, no entanto, que as técnicas de agrupamento em grafos surgiram no contexto de reconhecimento de padrões, cujo objetivo primario era o tratamento de dados diversos que não envolviam imagens. O uso de tais tecnicas para a segmentação de imagens e relativamente recente e revela alguns problemas desaadores. O primeiro deles é a deficiente escalabilidade de alguns métodos, o que impede o seu uso efetivo em imagens de altas dimensões. Outra questão é a falta de estudos que avaliam as medidas de similaridade na montagem do grafo e critérios que aferem a qualidade do agrupamento para a área específica de segmentação de imagens. Em outras palavras...

Definição automática da quantidade de atributos selecionados em tarefas de agrupamento de dados; Automatic feature quantification in data clustering tasks

Andrade Filho, José Augusto
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 17/09/2013 PT
Relevância na Pesquisa
86.05%
Conjuntos de dados reais muitas vezes apresentam um grande número de atributos preditivos ou de entrada, o que leva a uma grande quantidade de informação. Entretanto, essa quantidade de informação nem sempre significa uma melhoria em termos de desempenho de técnicas de agrupamento. Além disso, alguns atributos podem estar correlacionados ou adicionar ruído, reduzindo a qualidade do agrupamento de dados. Esse problema motivou o desenvolvimento de técnicas de seleção de atributos, que tentam encontrar um subconjunto com os atributos mais relevantes para agrupar os dados. Neste trabalho, o foco está no problema de seleção de atributos não supervisionados. Esse é um problema difícil, pois não existe informação sobre rótulos das classes. Portanto, não existe um guia para medir a qualidade do subconjunto de atributos. O principal objetivo deste trabalho é definir um método para identificar quanto atributos devem ser selecionados (após ordená-los com base em algum critério). Essa tarefa é realizada por meio da técnica de Falsos Vizinhos Mais Próximos, que tem sua origem na teoria do caos. Resultados experimentais mostram que essa técnica informa um bom número aproximado de atributos a serem selecionados. Quando comparado a outras técnicas...

Uma Metodologia para identificação de curvas semelhantes de tráfego rodoviário através de técnicas de agrupamento

Tomé, Paôla Tatiana Felippi
Fonte: Universidade Federal de Santa Catarina Publicador: Universidade Federal de Santa Catarina
Tipo: Dissertação de Mestrado Formato: 146 p.| il., grafs., tabs.
POR
Relevância na Pesquisa
96%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Produção, Florianópolis, 2010; O conhecimento do volume de tráfego das rodovias é uma informação valiosa para o planejamento do sistema rodoviário, porém demanda custos elevados, inviabilizando muitas vezes a implementação de um robusto programa de contagem. Neste sentido, este trabalho apresenta uma metodologia para identificar grupos de trechos de rodovias com curvas de tráfego homogêneas ao longo de determinado período, através de técnicas de agrupamento. Baseada em dados coletados de tráfego, inicialmente é realizada uma análise para determinar o número ideal de grupos através de métodos hierárquicos de agrupamento, de forma que seja possível identificar o menor número de grupos, mas que ainda atenda um nível mínimo de precisão desejado. Após esta etapa, são utilizados métodos não-hierárquicos para a realização do agrupamento em si. Dessa forma, cada um dos grupos apresenta uma curva de tráfego característica que representa todos os trechos pertencentes ao mesmo grupo. Essa idéia é explorada com o intuito de reduzir os custos associados à implementação de programas de contagem...

Emprego de modelos gráficos na seleção de genitores de milho para hibridização e mapeamento genético

Vieira,Eduardo Alano; Zimmer,Paulo Dejalma; Oliveira,Antonio Costa de; Carvalho,Fernando Irajá Félix de; Malone,Gaspar; Benin,Giovani
Fonte: Universidade Federal de Santa Maria Publicador: Universidade Federal de Santa Maria
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/10/2005 PT
Relevância na Pesquisa
96.05%
A dissimilaridade genética estimada por meio de marcadores moleculares, quando acompanhada de informações fenotípicas, é importante para a seleção de genótipos para o melhoramento e o mapeamento genético. Desta forma, os objetivos deste estudo foram: i) estimar a dissimilaridade genética entre 30 linhagens de milho contrastantes para a tolerância ao encharcamento; ii) selecionar genitores para mapeamento e melhoramento genético; iii) comparar diferentes métodos de visualização gráfica das distâncias. Foram utilizados 21 iniciadores de RAPD. A dissimilaridade genética foi estimada por meio do complemento do coeficiente de similaridade de Dice, posteriormente foi construído um dendrograma pelo método de agrupamento da distância média e calculado o coeficiente de correlação cofenética entre a matriz de dissimilaridade e o dendrograma gerado. O complemento da matriz de similaridade foi submetido também à análise de componentes principais e de escala multidimensional. Para ambas as análises, foi testada a eficiência das projeções, por meio da correlação entre as distâncias originais e as representadas nos gráficos. As técnicas de agrupamento não revelaram um bom ajuste entre as distâncias apresentadas graficamente e a matriz original de distâncias...

Utilização de técnicas estatísticas multivariadas para definição de ambiente de produção do peso ao sobreano para o estudo da interação genótipo-ambiente em bovinos Canchim.

MATTAR, M.; ALENCAR, M. M. de; CARDOSO, F. F.; FERRAUDO, A. S.; SILVA, L. O. C.; ESPASANDIN, A. C.
Fonte: In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 45., 2008, Lavras, MG. Anais... Lavras: SBZ: UFLA, 2008 Publicador: In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 45., 2008, Lavras, MG. Anais... Lavras: SBZ: UFLA, 2008
Tipo: Artigo em anais de congresso (ALICE) Formato: 1 CD-ROM.
PT_BR
Relevância na Pesquisa
95.96%
As respostas diferentes de genótipos às variações ambientais são investigadas nos estudos de interação genótipo-ambiente. A definição de ambiente nesses estudos ainda é um desafio, pois muitos fatores não genéticos podem causar efeito sobre a expressão de um conjunto de genes. Neste estudo, com as técnicas de estatística multivariada foram definidos ambientes de produção de bovinos Canchim, por meio de variáveis ambientais, formando grupos homogêneos de municípios do estado de São Paulo com informações de peso ao sobreano desta raça. As técnicas de Agrupamento Hierárquico e não Hierárquico foram eficientes para a simplificação e formação de quatro clusters homogêneos com membros de municípios paulistas, e heterogêneos entre si. Já, a técnica de componentes principais (CP) permitiu discriminar para cada cluster os fatores ambientais mais relevantes em sua formação, através de dois CP que preservaram 81,52% da variabilidade contida no conjunto das variáveis ambientais originais. As técnicas de estatística multivariada foram, portanto, ferramentas eficientes para discriminar ambientes de produção em estudos da interação genótipo-ambiente de bovinos Canchim.; 2008

Acompanhamento de safras de cana-de-açúcar por meio de técnicas de agrupamento em séries temporais de NDVI.

ROMANI, L. A. S.; GONÇALVES, R. R. do V.; AMARAL, B. F. do; ZULLO JUNIOR, J.; TRAINA JUNIOR, C.; SOUSA, E. P. M. de; TRAINA, A. J. M.
Fonte: In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 15., 2011, Curitiba. Anais... São José dos Campos: INPE, 2011. Publicador: In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 15., 2011, Curitiba. Anais... São José dos Campos: INPE, 2011.
Tipo: Artigo em anais de congresso (ALICE) Formato: p. 1-8.
PT_BR
Relevância na Pesquisa
95.87%
Este artigo propõe o uso da técnica de agrupamento de dados (clustering) para auxiliar no acompanhamento de safras de cana-de-açúcar a partir de séries temporais de NDVI obtidas do satélite AVHRR/NOAA para o estado de São Paulo, Brasil. Os experimentos realizados em uma região do estado que concentra áreas com produção alta de cana mostraram que é possível acompanhar a evolução da cultura ao longo da safra identificando regiões com padrões semelhantes. Além disso, pode-se obter uma classificação mensal dos valores de NDVI por região, o que pode servir de subsídio para pesquisas futuras. O restante desse artigo descreve a Metodologia do Trabalho na Seção 2, discute os Resultados na Seção 3 e apresenta as Conclusões na Seção 4.; 2011; SBSR 2011.

Reconstrução de Sinais em Redes de Sensores sem Fios com Técnicas de Geoestatística.; Signal Reconstruction in Wireless Sensor Networks with Geotatistics Techniches.

Vieira, Bruno Lopes
Fonte: Universidade Federal de Alagoas; BR; Modelagem Computacional de Conhecimento; Programa de Pós-Graduação em Modelagem Computacional de Conhecimento; UFAL Publicador: Universidade Federal de Alagoas; BR; Modelagem Computacional de Conhecimento; Programa de Pós-Graduação em Modelagem Computacional de Conhecimento; UFAL
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
85.96%
Wireless sensor networks are formed by mobile devices that collect and process data from an enviroment, and transmit them to a data center wich is responsible for taking decisions. This work aims to analyze the signal reconstruction in these networks using geostatistic techniques. Three processes of kriging are used: simple, ordinary and bayesian. Three approaches to simple krigingwere found in the literature, according to the way themean of the data is estimated,were assessed themall. A newBayesian approach is proposed: use general least square to estimate the mean, and set it as a constant into the Bayesian inference. The effect of clustering techniques is assessed, namely without clusters and with clusters formed by LEACH and SKATER algorithms. Bayesian kriging presents the best qualitative results in almost all scenarios, but it is not available to systems that require fast aswers; in this case we recommend ordinary kriging. The proposed variant of Bayesian kriging reduces the time required, without hampering the quality of the reconstructed signal, but the time reduction is not enough for real-time systems; Coordenação de Aperfeiçoamento de Pessoal de Nível Superior; As Redes de Sensores sem Fios (RSsF) são conjuntos de dispositivos que obtêmamostras de fenômenos ambientais...

Metodos de Agrupamento de Dados Simbolicos Baseados em funções de Dissimilaridades

Patrícia da Silva, kelly; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
85.98%
Com a crescente quantidade de informacões produzidas pelas diversas atividades humanas, tem se tornado cada vez mais importante agregar, tratar e manipular grandes massas de dados de modo a definir conceitos e extrair conhecimento destes dados. Esses conceitos podem ser descritos por dados mais complexos, chamados dados simbolicos. Nesse contexto, surge a necessidade de estender metodos exploratorios, estatisticos e representações graficas para lidar com esse tipo de dados, em que cada variavel pode assumir como valor um conjunto de categorias, intervalos ou distribuicões de probabilidades. A analise de dados simbolicos e definida como a extensão dos metodos de analise de dados classicos para tal tipo de dados. Com o intuito de estender metodos estatisticos e tecnicas de aprendizado de maquina a esse tipo de dados, e necessario definir medidas de distância apropriadas. Diversas medidas de distância têm sido propostas na literatura. No entanto, ainda existe na literatura uma carência de analises comparativas dos desempenhos de medidas de distância para dados simbolicos. A principal contribuicão desta Dissertacão e prover uma avaliacão empirica de funções de dissimilaridade para dados simbolicos no contexto de analise de agrupamento. Alem disso...

Mineração de regras para seleção de técnicas de agrupamento para dados de expressão gênica de câncer

Câmara Alves do Nascimento, André; Bastos Cavalcante Prudêncio, Ricardo (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
96.1%
Diferentes algoritmos têm sido usados para agrupar dados de expressão gênica, porém não há um único algoritmo que possa ser considerado o melhor independentemente dos dados a serem analisados. Neste trabalho, aplicamos técnicas de Meta-aprendizado para relacionar características de conjuntos de dados de expressão gênica ao desempenho de algoritmos de agrupamento. No nosso contexto, cada meta-exemplo representa características descritivas de uma base de dados de expressão gênica e um rótulo indicando o algoritmo de agrupamento que obteve os melhores resultados quando aplicado aos dados. Um conjunto destes metaexemplos é fornecido como entrada para um algoritmo de aprendizado (o meta-aprendiz), que, por sua vez, é responsável por adquirir conhecimento relativo às características descritivas e os melhores algoritmos. Neste trabalho, realizamos experimentos em um estudo de caso no qual um meta-aprendiz foi utilizado para discriminar entre três algoritmos de agrupamento candidatos, bem como para extrair conhecimento interpretável a partir dos experimentos. O conhecimento extraído pelo meta-aprendiz foi útil para o entendimento da aplicabilidade de cada algoritmo de agrupamento para problemas específicos

Métodos robustos em análise de agrupamento para dados simbólicos

Cristina de Assis, Elaine; Maria Cardoso Rodrigues de Souza, Renata (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
85.97%
Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias completas, enquanto métodos de particionamento procuram obter uma simples partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy). Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos. Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente aos dados, variáveis podem assumir conjuntos de categorias ou intervalos...

Técnicas de agrupamento de dados na mineração de dados químicos

de Aguiar Loureiro, Juliana; César Frery Orgambide, Alejandro (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
96.12%
O processo de descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases KDD) tem por objetivo extrair informações úteis (conhecimento) a partir de uma extensa quantidade de dados. Este processo, por sua vez, se constitui de várias etapas, entre elas, a atividade de mineração dos dados, representada neste estudo sob forma de an´ alise de agrupamento. Um problema característico dessa etapa é identificar qual ou quais métodos de agrupamento podem realmente apresentar uma classificação útil e válida para o conjunto de dados em estudo. Entre os mecanismos de apoio à triagem e estudo das técnicas de análise de agrupamento está o conhecimento adquirido sobre o conjunto de dados, o conhecimento de técnicas estatísticas para realizar a análise exploratória dos dados e principalmente conhecer bem quais algoritmos são adequados ao problema de interesse. A presente dissertação visa considerar os procedimentos de KDD apropriados para a aplicação das técnicas de análise de agrupamento a um conjunto de dados químicos

Algoritmos de agrupamento tradicionais versus sistemas de comitê de agrupamentos: análise de dados de expressão gênica

Santos Nepomuceno, Vilmar; Bernarda Ludermir, Teresa (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
86.07%
Este trabalho investiga o impacto do uso de comitês de agrupamentos para a análise de dados de expressão gênica. Mais especificamente, é realizada uma comparação dos desempenhos obtidos com algoritmos de combinação (comitês) com aqueles dos algoritmos de agrupamento individuais (algoritmos base). Para isso, são utilizados três métodos de comitês de agrupamento mais estabelecidos na literatura: matriz de co-associação, re-rotulagem e votação e comitês baseados em particionamento de grafos. As técnicas de agrupamento individuais escolhidas para realizar a comparação são: k-médias, mistura finita de gaussianas e o algoritmo hierárquico. Além de representarem diferentes paradigmas de agrupamento, estes algoritmos estão sendo muito utilizados no contexto de expressão gênica. Os resultados obtidos indicam que os algoritmos de comitê conseguem recuperar melhor a estrutura real dos dados, quando comparados aos algoritmos individuais. Outro aspecto observado na análise desenvolvida é que os comitês homogêneos conseguem, em geral, um melhor desempenho do que os comitês heterogêneos. De forma geral, os resultados dos experimentos indicam que, tanto os algoritmos individuais, quanto as técnicas de comitê apresentaram pequenas diferenças entre o número de grupos gerados...

Contribuições a técnicas de agrupamento e visualização de dados multivariados utilizando mapas auto-organizáveis

Silva, Leonardo Enzo Brito da
Fonte: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Engenharia Elétrica; Automação e Sistemas; Engenharia de Computação; Telecomunicações Publicador: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Engenharia Elétrica; Automação e Sistemas; Engenharia de Computação; Telecomunicações
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
95.93%
Self-organizing maps (SOM) are artificial neural networks widely used in the data mining field, mainly because they constitute a dimensionality reduction technique given the fixed grid of neurons associated with the network. In order to properly the partition and visualize the SOM network, the various methods available in the literature must be applied in a post-processing stage, that consists of inferring, through its neurons, relevant characteristics of the data set. In general, such processing applied to the network neurons, instead of the entire database, reduces the computational costs due to vector quantization. This work proposes a post-processing of the SOM neurons in the input and output spaces, combining visualization techniques with algorithms based on gravitational forces and the search for the shortest path with the greatest reward. Such methods take into account the connection strength between neighbouring neurons and characteristics of pattern density and distances among neurons, both associated with the position that the neurons occupy in the data space after training the network. Thus, the goal consists of defining more clearly the arrangement of the clusters present in the data. Experiments were carried out so as to evaluate the proposed methods using various artificially generated data sets...

Algoritmos de agrupamento aplicados a dados de expressão gênica de câncer: um estudo comparativo

Araújo, Daniel Sabino Amorim de
Fonte: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação Publicador: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
96.17%
The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data...

Divergência genética em genótipos de cana-deaçúcar (Saccharum spp.) através de caracteres morfoagronômicos e por marcadores moleculares.; Genetic divergence in sugarcane genotypes (Saccharum spp.) through morphoagronomical characters and molecular markers.

Silva, Paulo Pedro da
Fonte: Universidade Federal de Alagoas; BR; Agronomia; Produção vegetal; Proteção de plantas; Programa de Pós-Graduação em Agronomia; UFAL Publicador: Universidade Federal de Alagoas; BR; Agronomia; Produção vegetal; Proteção de plantas; Programa de Pós-Graduação em Agronomia; UFAL
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
86.1%
This study had as objective to estimate the genetic divergence among sugarcane genotypes by means of morphoagronomical characters and molecular markers, and to verify the relation between these procedures. An experiment was conducted in Rio Largo, AL, using a randomized block design with four repetitions. The multivariated analysis of Principal Components, the genetic divergence based on the Mahalanobis 2 ii' D Generalized Distance, and the Average Euclidean Distance Standardized were used for the analysis of the quantitative characters. Based on these distances, a grouping analysis was performed by the More Distant Neighbor method and the UPGMA method, besides Tocher for 2 ii' D . Jaccard coefficient and UPGMA grouping were used in the evaluation of the genetic divergence by molecular markers and morphologic characters. The inconsistency as to formation of different groups between the Standardized Average Euclidean Distance and 2 ii' D of Mahalanobis characterize these two estimates as measures of different dissimilarity. In the same way, the grouping techniques by the More Distant Neighbor method and by UPGMA show graphical dispersions that are not coincident, with differences in relation to the number of groups and in the grouping pattern...

Identificação da mudança de uso da terra usando técnicas de agrupamento de séries temporais de imagens de satélite.

SCRIVANI, R.; AMARAL, B. F. do; GONÇALVES, R. R. do V.; SOUSA, E. P. M. de; ZULLO JÚNIOR, J.; ROMANI, L. A. S.
Fonte: In: SIMPÓSIO DE GEOTECNOLOGIAS NO PANTANAL, 5., 2014, Campo Grande, MS. Anais... São José dos Campos: INPE, 2014. Publicador: In: SIMPÓSIO DE GEOTECNOLOGIAS NO PANTANAL, 5., 2014, Campo Grande, MS. Anais... São José dos Campos: INPE, 2014.
Tipo: Artigo em anais de congresso (ALICE) Formato: 1 CD-ROM.; p. 554-563.
PT_BR
Relevância na Pesquisa
95.87%
Resumo. A disponibilidade de dados orbitais, aliada à necessidade crescente de monitoramento de grandes extensões e de preservação de regiões ambientalmente sensíveis, gera uma oportunidade para o desenvolvimento/adaptação de métodos computacionais. A fim de gerar informações de avaliação temporal e espacial que possam constituir importante ferramenta de planejamento e de orientação à tomada de decisão para o manejo e conservação destas áreas, o objetivo deste trabalho é propor uma abordagem baseada em métodos de agrupamento de séries de imagens de satélite para auxiliar na análise espaço-temporal da mudança do uso da terra, identificando de forma automática, com alta probabilidade de serem áreas inundáveis, floresta, culturas agrícolas e pastagem em escala regional. Séries temporais de imagens do sensor MODIS com valores dos índices de vegetação NDVI e EVI, do período de 2008/2009 a 2013/2014, foram agrupadas por meio do algoritmo K-means. Para uma avaliação da qualidade dos agrupamentos obtidos foi utilizado o coeficiente de Silhueta. Séries temporais de precipitação do satélite TRMM foram utilizadas a fim de correlacionar com os demais resultados obtidos para avaliar a pré-classificação gerada pelo método de agrupamento em anos secos...