Página 1 dos resultados de 169 itens digitais encontrados em 0.002 segundos

Métodos Bayesianos aplicados em taxonomia molecular; Bayesian methods applied in molecular taxonomy

Villanueva Talavera, Edwin Rafael
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 31/08/2007 PT
Relevância na Pesquisa
46.95%
Neste trabalho são apresentados dois métodos de agrupamento de dados visados para aplicações em taxonomia molecular. Estes métodos estão baseados em modelos probabilísticos, o que permite superar alguns problemas apresentados nos métodos não probabilísticos existentes, como a dificuldade na escolha da métrica de distância e a falta de tratamento e aproveitamento do conhecimento a priori disponível. Os métodos apresentados combinam por meio do teorema de Bayes a informação extraída dos dados com o conhecimento a priori que se dispõe, razão pela qual são denominados métodos Bayesianos. O primeiro método, método de agrupamento hierárquico Bayesiano, está baseado no algoritmo HBC (Hierarchical Bayesian Clustering). Este método constrói uma hierarquia de partições (dendrograma) baseado no critério da máxima probabilidade a posteriori de cada partição. O segundo método é baseado em um tipo de modelo gráfico probabilístico conhecido como redes Gaussianas condicionais, o qual foi adaptado para problemas de agrupamento. Ambos métodos foram avaliados em três bancos de dados donde se conhece a rótulo da classe. Os métodos foram usados também em um problema de aplicação real: a taxonomia de uma coleção brasileira de estirpes de bactérias do gênero Bradyrhizobium (conhecidas por sua capacidade de fixar o 'N IND.2' do ar no solo). Este banco de dados é composto por dados genotípicos resultantes da análise do RNA ribossômico. Os resultados mostraram que o método hierárquico Bayesiano gera dendrogramas de boa qualidade...

Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico; Contributions to topic taxonomy construction in a specific domain using statistical learning

Moura, Maria Fernanda
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 26/10/2009 PT
Relevância na Pesquisa
46.84%
A mineração de textos vem de encontro à realidade atual de se compreender e utilizar grandes massas de dados textuais. Uma forma de auxiliar a compreensão dessas coleções de textos é construir taxonomias de tópicos a partir delas. As taxonomias de tópicos devem organizar esses documentos, preferencialmente em hierarquias, identificando os grupos obtidos por meio de descritores. Construir manual, automática ou semi-automaticamente taxonomias de tópicos de qualidade é uma tarefa nada trivial. Assim, o objetivo deste trabalho é construir taxonomias de tópicos em domínios de conhecimento restrito, por meio de mineração de textos, a fim de auxiliar o especialista no domínio a compreender e organizar os textos. O domínio de conhecimento é restrito para que se possa trabalhar apenas com métodos de aprendizado estatístico não supervisionado sobre representações bag of words dos textos. Essas representações independem do contexto das palavras nos textos e, conseqüentemente, nos domínios. Assim, ao se restringir o domínio espera-se diminuir erros de interpretação dos resultados. A metodologia proposta para a construção de taxonomias de tópicos é uma instanciação do processo de mineração de textos. A cada etapa do processo propôem-se soluções adaptadas às necessidades específicas de construçao de taxonomias de tópicos...

Selecionando candidatos a descritores para agrupamentos hierárquicos de documentos utilizando regras de associação; Selecting candidate labels for hierarchical document clusters using association rules

Santos, Fabiano Fernandes dos
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 17/09/2010 PT
Relevância na Pesquisa
46.61%
Uma forma de extrair e organizar o conhecimento, que tem recebido muita atenção nos últimos anos, é por meio de uma representação estrutural dividida por tópicos hierarquicamente relacionados. Uma vez construída a estrutura hierárquica, é necessário encontrar descritores para cada um dos grupos obtidos pois a interpretação destes grupos é uma tarefa complexa para o usuário, já que normalmente os algoritmos não apresentam descrições conceituais simples. Os métodos encontrados na literatura consideram cada documento como uma bag-of-words e não exploram explicitamente o relacionamento existente entre os termos dos documento do grupo. No entanto, essas relações podem trazer informações importantes para a decisão dos termos que devem ser escolhidos como descritores dos nós, e poderiam ser representadas por regras de associação. Assim, o objetivo deste trabalho é avaliar a utilização de regras de associação para apoiar a identificação de descritores para agrupamentos hierárquicos. Para isto, foi proposto o método SeCLAR (Selecting Candidate Labels using Association Rules), que explora o uso de regras de associação para a seleção de descritores para agrupamentos hierárquicos de documentos. Este método gera regras de associação baseadas em transações construídas à partir de cada documento da coleção...

Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas; Unsupervised learning of topic hierarchies from dynamic text collections

Marcacini, Ricardo Marcondes
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 19/05/2011 PT
Relevância na Pesquisa
37.05%
A necessidade de extrair conhecimento útil e inovador de grandes massas de dados textuais, tem motivado cada vez mais a investigação de métodos para Mineração de Textos. Dentre os métodos existentes, destacam-se as iniciativas para organização de conhecimento por meio de hierarquias de tópicos, nas quais o conhecimento implícito nos textos é representado em tópicos e subtópicos, e cada tópico contém documentos relacionados a um mesmo tema. As hierarquias de tópicos desempenham um papel importante na recupera ção de informação, principalmente em tarefas de busca exploratória, pois permitem a análise do conhecimento de interesse em diversos níveis de granularidade e exploração interativa de grandes coleções de documentos. Para apoiar a construção de hierarquias de tópicos, métodos de agrupamento hierárquico têm sido utilizados, uma vez que organizam coleções textuais em grupos e subgrupos, de forma não supervisionada, por meio das similaridades entre os documentos. No entanto, a maioria dos métodos de agrupamento hierárquico não é adequada em cenários que envolvem coleções textuais dinâmicas, pois são exigidas frequentes atualizações dos agrupamentos. Métodos de agrupamento que respeitam os requisitos existentes em cenários dinâmicos devem processar novos documentos assim que são adicionados na coleção...

Organização flexível de documentos; Flexible organization of documents

Rios, Tatiane Nogueira
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 25/03/2013 PT
Relevância na Pesquisa
36.72%
Diversos métodos têm sido desenvolvidos para a organização da crescente quantidade de documentos textuais. Esses métodos frequentemente fazem uso de algoritmos de agrupamento para organizar documentos que referem-se a um mesmo assunto em um mesmo grupo, supondo que conteúdos de documentos de um mesmo grupo são similares. Porém, existe a possibilidade de que documentos pertencentes a grupos distintos também apresentem características semelhantes. Considerando esta situação, há a necessidade de desenvolver métodos que possibilitem a organização flexível de documentos, ou seja, métodos que possibilitem que documentos sejam organizados em diferentes grupos com diferentes graus de compatibilidade. O agrupamento fuzzy de documentos textuais apresenta-se como uma técnica adequada para este tipo de organização, uma vez que algoritmos de agrupamento fuzzy consideram que um mesmo documento pode ser compatível com mais de um grupo. Embora tem-se desenvolvido algoritmos de agrupamento fuzzy que possibilitam a organização flexível de documentos, tal organização é avaliada em termos do desempenho do agrupamento de documentos. No entanto, considerando que grupos de documentos devem possuir descritores que identifiquem adequadamente os tópicos representados pelos mesmos...

Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections; Agrupamento hierárquico semissupervisionado ativo baseado em confiança e sua aplicação para extração de hierarquias de tópicos a partir de coleções de documentos

Nogueira, Bruno Magalhães
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 16/12/2013 EN
Relevância na Pesquisa
57.14%
Topic hierarchies are efficient ways of organizing document collections. These structures help users to manage the knowledge contained in textual data. These hierarchies are usually obtained through unsupervised hierarchical clustering algorithms. By not considering the context of the user in the formation of the hierarchical groups, unsupervised topic hierarchies may not attend the user's expectations in some cases. One possible solution for this problem is to employ semi-supervised clustering algorithms. These algorithms incorporate the user's knowledge through the usage of constraints to the clustering process. However, in the context of semi-supervised hierarchical clustering, the works in the literature do not efficient explore the selection of cases (instances or cluster) to add constraints, neither the interaction of the user with the clustering process. In this sense, in this work we introduce two semi-supervised hierarchical clustering algorithms: HCAC (Hierarchical Confidence-based Active Clustering) and HCAC-LC (Hierarchical Confidence-based Active Clustering with Limited Constraints). These algorithms employ an active learning approach based in the confidence of cluster merges. When a low confidence merge is detected, the user is invited to decide...

Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos; Machine learning with privileged information: approaches for hierarchical text clustering

Marcacini, Ricardo Marcondes
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 14/10/2014 PT
Relevância na Pesquisa
67.2%
Métodos de agrupamento hierárquico de textos são muito úteis para analisar o conhecimento embutido em coleções textuais, organizando os documentos textuais em grupos e subgrupos para facilitar a exploração do conhecimento em diversos níveis de granularidade. Tais métodos pertencem à área de aprendizado não supervisionado de máquina, uma que vez obtêm modelos de agrupamento apenas pela observação de regularidades existentes na coleção textual, sem supervisão humana. Os métodos tradicionais de agrupamento assumem que a coleção textual é representada apenas pela informação técnica, ou seja, palavras e frases extraídas diretamente dos textos. Por outro lado, em muitas tarefas de agrupamento existe conhecimento adicional e valioso a respeito dos dados, geralmente extraído por um processo avançado com apoio de usuários especialistas do domínio do problema. Devido ao alto custo para obtenção desses dados, esta informação adicional é definida como privilegiada e usualmente está disponível para representar apenas um subconjunto dos documentos textuais. Recentemente, um novo paradigma de aprendizado de máquina denominado LUPI (Learning Using Privileged Information) foi proposto por Vapnik para incorporar informação privilegiada em métodos aprendizado supervisionado. Neste trabalho de doutorado...

Corte em grafos e segmentação de imagens utilizando um algoritmo aglomerativo de agrupamento hierárquico; Graph cut and image segmentation using an hierarquical agglomerative clustering algorithm

Elaine Ayumi Chiba
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 21/02/2014 PT
Relevância na Pesquisa
46.61%
Representar os elementos de uma imagem em forma de grafos torna a estrutura organizada permitindo formular problemas de forma flexível e ser computacionalmente mais eficiente. Existem muitas técnicas da teoria de grafos sendo utilizadas em processamento digital de imagens. Em particular, o particionamento em grafos ou corte em grafos tem sido estudada por diversos autores como uma ferramenta de segmentação de imagens. Particionamento de um grafo refere-se à sua divisão em vários subgrafos tais que cada um deles representa um objeto de interesse na imagem. Neste trabalho, propomos um algoritmo de agrupamento hierárquico aglomerativo dos nós do grafo com base nas métricas de corte e corte médio. As segmentações foram avaliadas usando o benchmark da Berkeley BSDS500 que compara e classifica as segmentações em relação à outras técnicas existentes na literatura. Os resultados obtidos são promissores e nos permite concluir de que a combinação das métricas de corte e corte médio possibilitou melhores segmentações.; Representing the elements of an image in graphs makes the structure organized allowing to formulate problems in a flexible manner and can be more computationally efficient. There are many techniques of graph theory that are used in digital image processing. In particular...

Identificação de genes associados com o potencial invasivo de Streptococcus pneumoniae

Sêco, Luísa Moreira
Fonte: Universidade de Lisboa Publicador: Universidade de Lisboa
Tipo: Dissertação de Mestrado
Publicado em //2012 POR
Relevância na Pesquisa
46.61%
Tese de mestrado em Bioestatística, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012; O Streptococcus pneumoniae e uma espécie bacteriana que integra a flora comensal da nasofaringe humana e constitui uma causa frequente de doença invasiva nas vias respiratórias. A sua diversidade genética e fenotípica e muito elevada, conhecendo-se estirpes invasivas (patogénicas) e estirpes colonizadoras (assintomáticas). A rápida evolução do genoma desta espécie originada por transformação genética, e o consequente aparecimento de novas estirpes conduz a necessidade de identificar os genes que estão associados a sua capacidade invasiva. Esta dissertação tem como objetivo identificar genes associados ao potencial invasivo de Streptococcus pneumoniae a partir de dados de hibridação genómica comparativa em que foi pesquisada a presença de 3620 genes em 72 estirpes, classificadas como invasivas, colonizadoras ou neutras com base em estudos epidemiológicos. A pesquisa de genes associados a invasibilidade foi efetuada através de classificação não supervisionada através de agrupamento hierárquico, e classificação supervisionada através da construção de modelos em arvore. A classificação não supervisionada das estirpes com base no seu conteúdo genético demonstrou não ser um método eficaz para detetar genes associados ao seu potencial invasivo. Os resultados da classificação supervisionada revelaram que a construção de modelos de classificação em árvore...

Avaliação da temperatura média prevista pelos modelos climáticos globais no sudeste do Brasil.

HAMADA, E.; GHINI, R.; MAIA, A. de H. N.; PEDRO JÚNIOR, M. J.
Fonte: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 16, 2009, Belo Horizonte. Anais... Viçosa, MG: UFV; Sete Lagoas: Embrapa Milho e Sorgo, 2009. Publicador: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 16, 2009, Belo Horizonte. Anais... Viçosa, MG: UFV; Sete Lagoas: Embrapa Milho e Sorgo, 2009.
Tipo: Artigo em anais de congresso (ALICE) Formato: 1 CD-ROM.; Não paginado.
PT_BR
Relevância na Pesquisa
46.61%
Os modelos climáticos globais são considerados a melhor ferramenta para gerar cenários prováveis de alterações climáticas futuras, apesar das incertezas. As projeções são diferentes para cada região e variam ao longo das estações do ano. O objetivo deste trabalho foi avaliar a similaridade entre projeções dos modelos climáticos globais do IPCC-AR4 para temperatura média na região Sudeste do Brasil, no período de 2071 a 2100, cenário A2. Para tanto, foram realizadas análise de componentes principais e análise de agrupamento hierárquico para agrupar os modelos de comportamentos semelhantes. Adotando-se quatro grupos de modelos, os valores médios de temperatura variaram de 23,7°C a 25,4°C.; 2009; CBA 2009.

Avaliação da precipitação projetada pelos modelos climáticos globais para o nordeste brasileiro.

HAMADA, E.; MAIA, A. de H. N.; THOMAZ, M. C.
Fonte: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 17., 2011, Guarapari. Riscos climáticos e cenários agrícolas futuros: anais. Guarapari: Incaper, 2011. 1 CD ROM. Publicador: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 17., 2011, Guarapari. Riscos climáticos e cenários agrícolas futuros: anais. Guarapari: Incaper, 2011. 1 CD ROM.
Tipo: Artigo em anais de congresso (ALICE)
PT_BR
Relevância na Pesquisa
46.61%
O objetivo deste trabalho foi avaliar a similaridade entre projeções de precipitação pluviométrica dos modelos climáticos globais do Quarto Relatório do IPCC para a região Nordeste do Brasil, no período de 2071 a 2100, cenário A2. Os modelos climáticos globais são considerados a melhor ferramenta para gerar cenários prováveis de alterações climáticas futuras, apesar das incertezas. Foram realizadas análise de componentes principais e análise de agrupamento hierárquico para agrupar os modelos quanto à similaridade espacial das projeções da chuva acumulada (mm) para os períodos de janeiro a junho e julho a dezembro. Adotando-se quatro grupos de modelos, os valores da precipitação projetada para o período variaram de 528.26 mm a 964,94 mm (jan-jun), e de 137,59 mm a 324,06 mm (juldez).; 2011

Temperaturas médias projetadas pelos modelos climáticos globais para o nordeste brasileiro.

HAMADA, E.; MAIA, A. de H. N.; THOMAZ, M. C.
Fonte: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 17., 2011, Guarapari. Riscos climáticos e cenários agrícolas futuros: anais. Guarapari: Incaper, 2011. 1 CD ROM. Publicador: In: CONGRESSO BRASILEIRO DE AGROMETEOROLOGIA, 17., 2011, Guarapari. Riscos climáticos e cenários agrícolas futuros: anais. Guarapari: Incaper, 2011. 1 CD ROM.
Tipo: Artigo em anais de congresso (ALICE)
PT_BR
Relevância na Pesquisa
46.61%
As informações necessárias para avaliação dos impactos das mudanças climáticas são derivadas de projeções de modelos climáticos. As projeções são diferentes para cada região do mundo e variam ao longo das estações do ano. O objetivo deste trabalho foi avaliar a similaridade espacial entre modelos climáticos globais do Quarto Relatório de Avaliação do IPCC, quanto às projeções de temperatura média para a região Nordeste do Brasil, no período de 2071 a 2100, cenário A2. Para tanto, foram realizadas análise de componentes principais e análise de agrupamento hierárquico para identificar os modelos de comportamentos semelhantes. Adotando-se quatro grupos de modelos, a temperatura média projetada para os grupos variou de 28,19°C a 30,28°C de janeiro a junho e de 27,98°C a 30,10°C de julho a dezembro. Todos os modelos indicam aumentos de temperatura no futuro.; 2011

Precipitações projetadas pelos modelos climáticos globais do quarto relatório do IPCC para o nordeste brasileiro.

HAMADA, E.; MAIA, A. de H. N.; THOMAZ, M. C.
Fonte: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 1 cd rom. 6 p. Publicador: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 1 cd rom. 6 p.
Tipo: Artigo em anais de congresso (ALICE)
PT_BR
Relevância na Pesquisa
46.61%
O objetivo deste trabalho foi avaliar a similaridade entre projeções de precipitação pluviométrica dos modelos climáticos globais do Quarto Relatório do IPCC para a região Nordeste do Brasil, no período de 2071 a 2100, cenário A2. Os modelos climáticos globais são considerados a melhor ferramenta para gerar cenários prováveis de alterações climáticas futuras, apesar das incertezas. Foram realizadas análise de componentes principais e análise de agrupamento hierárquico para agrupar os modelos quanto à similaridade espacial das projeções da chuva acumulada (mm) para os períodos de janeiro a junho e julho a dezembro. Adotando-se quatro grupos de modelos, os valores da precipitação projetada para o período variaram de 528.26 mm a 964,94 mm (jan-jun), e de 137,59 mm a 324,06 mm (jul-dez).; 2012

Precipitações projetadas pelos modelos climáticos globais do quarto relatório do IPCC para o sudeste do Brasil.

HAMADA, E.; MAIA, A. de H. N.; GHINI, R.; THOMAZ, M. C.; GONÇALVES, R. R. V.; LANA, J. T. de O.; ALMEIDA, E. G. de
Fonte: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 1 CD ROM. 9 p. Publicador: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 1 CD ROM. 9 p.
Tipo: Artigo em anais de congresso (ALICE)
PT_BR
Relevância na Pesquisa
46.61%
Modelos climáticos globais (GCM) são considerados a melhor ferramenta para projetar cenários de mudanças climáticas, apesar de suas incertezas. Projeções para cada região são diferentes e variam entre as estações. O objetivo deste estudo foi avaliar as projeções de precipitação de 15 GCMs do IPCC-AR4 para a região Sudeste do Brasil no período de 2071-2100, cenário A2. Um banco de dados geográfico foi estruturado com dados climáticos projetados e dados observados obtidos do Climate Research Unit. A similaridade entre os modelos foi avaliada utilizando análise de componentes principais e análise de agrupamento hierárquico, com base na similaridade espacial da precipitação acumulada, após correção de viés. Os modelos foram agrupados de acordo com similaridade espacial das projeções, para cada estação. Similaridades espaciais variaram entre as estações.; 2012

Temperaturas médias projetadas pelos modelos climáticos globais do quarto relatório do IPCC para o Nordeste Brasileiro.

HAMADA, E.; MAIA, A. de H. N.; THOMAZ, M. C.
Fonte: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 6 p. Publicador: In: WORKSHOP SOBRE MUDANÇAS CLIMÁTICAS E PROBLEMAS FITOSSANITÁRIOS, 2012, Jaguariúna. Anais... Jaguariúna: Embrapa Meio Ambiente, 2012. 6 p.
Tipo: Artigo em anais de congresso (ALICE)
PT_BR
Relevância na Pesquisa
46.61%
As informações necessárias para avaliação dos impactos das mudanças climáticas são derivadas de projeções de modelos climáticos. As projeções são diferentes para cada região do mundo e variam ao longo das estações do ano. O objetivo deste trabalho foi avaliar a similaridade espacial entre modelos climáticos globais do Quarto Relatório de Avaliação do IPCC, quanto às projeções de temperatura média para a região Nordeste do Brasil, no período de 2071 a 2100, cenário A2. Para tanto, foram realizadas análise de componentes principais e análise de agrupamento hierárquico para identificar os modelos de comportamentos semelhantes. Adotando-se quatro grupos de modelos, a temperatura média projetada para os grupos variou de 28,19°C a 30,28°C de janeiro a junho e de 27,98°C a 30,10°C de julho a dezembro. Todos os modelos indicam aumentos de temperatura no futuro.; 2012

Seleção local de características em agrupamento hierárquico de documentos

Nunes Ribeiro, Marcelo; Bastos Cavalcante Prudêncio, Ricardo (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
57.06%
O agrupamento hierárquico de documentos é utilizado para prover interface de navegação em coleções de documentos, ajudando na atividade de recuperação de informação. Como os vetores que representam os documentos possuem uma alta dimensionalidade, a presença de termos irrelevantes confunde o algoritmo de agrupamento. O uso da seleção de características em agrupamento de documentos é capaz de melhorar a precisão e o tempo de execução do agrupamento. Esta dissertação discute vários métodos de seleção de características já aplicados e aborda a forma como a seleção de características interage com o algoritmo de agrupamento, que pode ser classificada de forma global, quando um único subconjunto de características é considerado, ou local, quando cada grupo é descrito por subconjuntos de características distintas. Por conta da diversidade de visões das características proporcionada pela seleção local, o algoritmo de agrupamento é capaz de revelar grupos ocultos nos dados. Nesta dissertação, é aplicado o mesmo princípio de seleção local para o caso de agrupamento hierárquico divisivo de documentos, com a realização de uma nova seleção de características a cada passo de divisão dos grupos. Este método foi batizado de ZOOM-IN. Foram feitos experimentos com as bases de documentos Reuters-21578 e RCV2 e foi comprovado um ganho de precisão no resultado do agrupamento quando a heurística de escolha do número de termos do método ZOOM-IN é capaz de eliminar os termos irrelevantes. Também é desenvolvida uma aplicação dos métodos discutidos para agrupar documentos do resultado de uma consulta ao Google...

Sistema para segmentação de imagens por agrupamento hierárquico baseado no comportamento superparamagnético do modelo de Potts

Matos Horta, Michelle; César Frery Orgambide, Alejandro (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
66.98%
Recentemente foi estabelecida uma analogia entre o problema de agrupamento e a procura de configurações típicas de um modelo físico, o modelo de Potts. Para ilustrar essa analogia foi desenvolvido um programa, em linguagem C, pelo Professor Eytan Domany, do Departamento de Física de Sistemas Complexos, do Weizmann Institute of Science, de Israel. A função principal desse programa é a realização do agrupamento hierárquico de dados baseado no comportamento superparamagnético do modelo de Potts (SPC - Superparamagnetic Clustering). Essa coleção de agrupamentos é obtida simulando ocorrências de um modelo de Potts não-homogêneo em um estágio intermediário entre as fases ferromagnética e paramagnética. O foco deste trabalho é o desenvolvimento de um sistema que permite a aplicação dessa técnica à segmentação de imagens. Para tanto, foi desenvolvida uma interface, utilizando IDL e ENVI, para auxiliar o usuário na utilização dessa e de outras técnicas de agrupamento e na compreensão dos resultados provenientes de técnicas hierárquicas de agrupamento de dados. Os agrupamentos obtidos s.ao ilustrados através de imagens, de gráficos hierárquicos (dendrogramas) interativos e por animações

Metodos de agrupamento

Celinski, Tatiana Montes
Fonte: Universidade Federal do Paraná Publicador: Universidade Federal do Paraná
Tipo: Teses e Dissertações Formato: application/pdf
PORTUGUêS
Relevância na Pesquisa
36.7%
Resumo: Este trabalho apresenta um estudo comparativo sobre métodos de agrupamento, incluindo diferentes abordagens para segmentação de conjuntos de dados que utilizam métodos de agrupamento. As abordagens são baseadas nas duas técnicas de agrupamento mais populares, agrupamento particional e agrupamento hierárquico, e vêm introduzir heurísticas que, de alguma forma, levem à obtenção de um melhor resultado para o agrupamento. A partir das implementações de diversos métodos de agrupamento, este trabalho introduz uma nova heurística para a segmentação de imagens de profundidade por agrupamento, com o objetivo de melhorar o resultado da segmentação obtendo uma partição melhor para o agrupamento. A abordagem desenvolvida é baseada na extração de informações, para inicialização dos algoritmos de agrupamento, a partir de uma pré-segmentação da imagem usando deteção de bordas.

Algoritmos de agrupamento aplicados a dados de expressão gênica de câncer: um estudo comparativo

Araújo, Daniel Sabino Amorim de
Fonte: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação Publicador: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
36.66%
The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data...

DFA e análise de agrupamento aplicadas a perfis de porosidade neutrônico em poços de petróleo

Silva, Francisco Wilton de Freitas
Fonte: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Ciência e Engenharia do Petróleo; Pesquisa e Desenvolvimento em Ciência e Engenharia de Petróleo Publicador: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Ciência e Engenharia do Petróleo; Pesquisa e Desenvolvimento em Ciência e Engenharia de Petróleo
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
36.72%
Peng was the first to work with the Technical DFA (Detrended Fluctuation Analysis), a tool capable of detecting auto-long-range correlation in time series with non-stationary. In this study, the technique of DFA is used to obtain the Hurst exponent (H) profile of the electric neutron porosity of the 52 oil wells in Namorado Field, located in the Campos Basin -Brazil. The purpose is to know if the Hurst exponent can be used to characterize spatial distribution of wells. Thus, we verify that the wells that have close values of H are spatially close together. In this work we used the method of hierarchical clustering and non-hierarchical clustering method (the k-mean method). Then compare the two methods to see which of the two provides the best result. From this, was the parameter � (index neighborhood) which checks whether a data set generated by the k- average method, or at random, so in fact spatial patterns. High values of � indicate that the data are aggregated, while low values of � indicate that the data are scattered (no spatial correlation). Using the Monte Carlo method showed that combined data show a random distribution of � below the empirical value. So the empirical evidence of H obtained from 52 wells are grouped geographically. By passing the data of standard curves with the results obtained by the k-mean...