Página 1 dos resultados de 174 itens digitais encontrados em 0.073 segundos

O uso de provérbios: uma abordagem estatística.

Mendes, Armando B.; Funk, Gabriela; Funk, Matthias; Sousa, Áurea
Fonte: Câmara Municipal de Ponta Delgada Publicador: Câmara Municipal de Ponta Delgada
Tipo: Parte de Livro
Publicado em //2007 POR
Relevância na Pesquisa
95.96%
4º Encontro de Cultura Popular, Ponta Delgada, 18 e 19 de Maio de 2006.; Neste artigo, apresentam-se os resultados, ainda parciais, do projecto de análise de uma base de dados construída para identificação de provérbios. Esta base de dados integra informação sobre 25.000 expressões idiomáticas e mais de um milhar de respostas válidas a inquéritos de reconhecimento de provérbios. Os objectivos do projecto incluem várias actividades desde a compreensão do domínio e dos dados até à extracção de conhecimento que permita caracterizar utilizadores de grupos de provérbios e prever a região geográfica onde estes têm vivido. A metodologia CRISP-DM é utilizada e ilustrada, de acordo com estes objectivos. Dá-se especial ênfase às fases de preparação e pré-processamento, limpeza de dados e à modelação e análise de dados. Utilizam-se métodos de análise de dados como as árvores de regressão e classificação e a análise de clusters. Utilizam-se igualmente dados simbólicos tendo em conta a estrutura complexa e a existência de variabilidade interna. Os resultados já obtidos são comparados com o conhecimento de domínio paremiológico.

Análise Classificatória de Dados de Natureza Complexa: Uma aplicação do Coeficiente de Afinidade

Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, Osvaldo
Fonte: Sociedade Portuguesa de Matemática Publicador: Sociedade Portuguesa de Matemática
Tipo: Conferência ou Objeto de Conferência
Publicado em /07/2012 POR
Relevância na Pesquisa
96.06%
Encontro Nacional da Sociedade Portuguesa de Matemática (ENSPM 12). Universidade do Algarve, Faro, 9 a 11 de julho de 2012.; A Análise de Dados Simbólicos (ADS) é um domínio recente na área da descoberta do conhecimento e da gestão de dados. O seu primeiro passo consiste na extracção de informações úteis a partir de bases de dados de elevada dimensão, como em Data Mining, de modo a sumariar esses dados em termos dos seus conceitos mais relevantes. O segundo passo em ADS é aplicar novas ferramentas às informações extraídas, visando estender o Data Mining ao Knowledge Mining.O coeficiente de afinidade generalizado ponderado é uma medida de semelhança apropriada à Análise Classificatória (Cluster Analysis) de dados de natureza complexa (dados simbólicos), mesmo no caso de dados heterogéneos e de elevada dimensão. Neste trabalho, é dada uma atenção especial às medidas de proximidade entre objectos simbólicos, entre as quais o coeficiente de afinidade generalizado ponderado. É ilustrada a aplicação da Análise Classificatória Hierárquica Ascendente (ACHA) a dados de natureza complexa, retirados da literatura, com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos...

Classes de objectos simbólicos: dados da indústria automóvel

Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, Osvaldo
Fonte: Fernanda Sousa, Catarina Marques, Isabel Silva, José Gonçalves Dias, Nuno Lavado, Carlos Marcelo Publicador: Fernanda Sousa, Catarina Marques, Isabel Silva, José Gonçalves Dias, Nuno Lavado, Carlos Marcelo
Tipo: Conferência ou Objeto de Conferência
Publicado em /04/2014 POR
Relevância na Pesquisa
76.02%
XXI Jornadas de Classificação e Análise de Dados (JOCLAD 2014). 10-12 Abril, 2014, INE, Lisboa, Portugal (Comunicação).; Neste trabalho, é abordada a Análise Classificatória Hierárquica Ascendente (ACHA) de dados simbólicos ou complexos (generalizações de dados clássicos), com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL. São apresentados os principais resultados obtidos com a ACHA de 33 modelos de carros (dados simbólicos na área da indústria automóvel), com base no coeficiente de afinidade generalizado ponderado, centrado e reduzido pelo método de Wald e Wolfowitz, comparando-se os resultados obtidos com os de outros autores e com a partição definida a priori pelas categorias ("Utilitário", "Berlina", "Desportivo", "Luxo") a que os modelos de carros pertencem.

Análise simbólica de dados e a sua aplicação na extracção de informação de estatísticas oficiais: análise do inquérito à ocupação do tempo

Campos, Vera Maria Fernandez
Fonte: Universidade Nova de Lisboa Publicador: Universidade Nova de Lisboa
Tipo: Dissertação de Mestrado
Publicado em 07/04/2008 POR
Relevância na Pesquisa
126.11%
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Estatística e Gestão de Informação; Pretende-se com o presente trabalho estudar e aplicar as técnicas da Análise de Dados Simbólicos. O tema tem como objectivo descrever e estudar métodos de Análise de Dados Simbólicos e a sua aplicação nas Estatísticas Oficiais. Como aplicação prática é analisado o estudo do Inquérito à Ocupação do Tempo, realizado pelo INE. Neste trabalho faz-se uma exposição dos conceitos gerais da Análise de Dados Simbólicos, nomeadamente nos conceitos básicos, os tipos de variáveis simbólicas, a geração dos objectos simbólicos, as estatísticas descritivas e alguns métodos de classificação hierárquica e não-hierárquica. A análise dos dados parte de uma base de micro-dados que será trabalhada agregando os dados segundo diferentes níveis (macro-dados), de forma a caracterizar as regiões de Portugal, segmentadas por sexo e grupo etário, quanto à forma como ocupam o seu tempo diário, associando ainda o sentimento de pressa vivido nestas áreas.

Soluções em personalização de conteúdo baseadas em classificadores simbólicos modais

Leite Dantas Bezerra, Byron; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
115.93%
Engenhos de Personalização são ferramentas úteis para se encontrar informações do interesse de uma pessoa de forma efetiva. Para isso, eles capturam informações sobre os usuários de um sistema para aprender sobre suas preferências. De posse destas informações, os Engenhos de Personalização adotam técnicas de filtragem de informação baseadas normalmente em classificadores com aprendizagem supervisionada. As técnicas mais comuns definem as correlações entre os usuários da comunidade e, a partir daí, disparam um processo conhecido popularmente como boca-à-boca . Outra técnica realiza uma filtragem com base no conteúdo descritivo dos itens no repositório como, o elenco e o gênero de um filme. Finalmente, existem abordagens híbridas que procuram combinar diferentes técnicas absorvendo o que há de melhor em cada uma. No presente trabalho fazemos uma leitura crítica do estado da arte relacionado aos Engenhos de Personalização e, a partir daí, apresentamos três novos métodos baseados em conceitos e ferramentas do domínio de Análise de Dados Simbólicos, em que cada um deles segue uma técnica diferente: o método Content Modal Based Filtering realiza filtragem de informação baseada no conteúdo; o método Social Modal Collaborative Filtering realiza filtragem colaborativa; e o método Hybrid Modal Based Filtering realiza filtragem híbrida. Definimos um processo de avaliação de desempenho das tecnologias de personalização e o aplicamos para efeito de comparação dos nossos métodos com abordagens clássicas. Em nossas análises consideramos dimensões relevantes para sistemas reais...

Modelos de regressão para dados simbólicos de natureza intervalar

de Andrade Lima Neto, Eufrasio; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
106.05%
O processo de descoberta de conhecimento tem por objetivo a extração de informações úteis (conhecimento) em bases de dados. As ferramentas utilizadas para execução do processo de extração de conhecimento são genéricas e derivadas de diferentes áreas de conhecimento tais como da estatística, aprendizagem de máquina e banco de dados. Dentre as técnicas estatísticas, os modelos de regressão procuram classificar ou prever o comportamento de uma variável dependente (resposta) a partir das informações provenientes de um conjunto de variáveis independentes (explicativas). A análise de dados simbólicos (SDA) (Bock & Diday 2000) tem sido introduzida como uma novo domínio relacionado à análise multivariada, reconhecimento de padrões e inteligência artificial com o objetivo de estender os métodos estatísticos e de análise exploratória de dados para dados simbólicos. O objetivo deste trabalho é propor métodos de regressão linear e não-linear para dados simbólicos que apresentem uma performance de predição superior ao método proposto por Billard & Diday (2000), no caso de variáveis simbólicas tipo intervalo; Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

Metodos de Agrupamento de Dados Simbolicos Baseados em funções de Dissimilaridades

Patrícia da Silva, kelly; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
136.14%
Com a crescente quantidade de informacões produzidas pelas diversas atividades humanas, tem se tornado cada vez mais importante agregar, tratar e manipular grandes massas de dados de modo a definir conceitos e extrair conhecimento destes dados. Esses conceitos podem ser descritos por dados mais complexos, chamados dados simbolicos. Nesse contexto, surge a necessidade de estender metodos exploratorios, estatisticos e representações graficas para lidar com esse tipo de dados, em que cada variavel pode assumir como valor um conjunto de categorias, intervalos ou distribuicões de probabilidades. A analise de dados simbolicos e definida como a extensão dos metodos de analise de dados classicos para tal tipo de dados. Com o intuito de estender metodos estatisticos e tecnicas de aprendizado de maquina a esse tipo de dados, e necessario definir medidas de distância apropriadas. Diversas medidas de distância têm sido propostas na literatura. No entanto, ainda existe na literatura uma carência de analises comparativas dos desempenhos de medidas de distância para dados simbolicos. A principal contribuicão desta Dissertacão e prover uma avaliacão empirica de funções de dissimilaridade para dados simbolicos no contexto de analise de agrupamento. Alem disso...

Métodos robustos em regressão linear para dados simbólicos do tipo intervalo

Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
126.15%
A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica...

Extensão de técnicas clássicas para análise de séries temporais do tipo intervalo

Luis Santiago Maia, André; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
126.06%
Os dados simbólicos apresentam, em sua estrutura, formas interessantes para se transformar grandes bases de dados clássicos em novos conjuntos de dados de tamanho reduzido, facilitando a manipulação e proporcionando novas técnicas de análise dos mesmos. No entanto, mesmo com os recentes avanços promovidos por pesquisadores nesta área, o volume de técnicas de manipulação e, consequentemente, de análise de dados simbólicos (ADS) ainda é incipiente. Uma série temporal do tipo intervalo (STI), no campo de dados simbólicos, pode ser definida como um conjunto de intervalos observados sequencialmente no tempo, em que cada intervalo é descrito por um vetor bidimensional com elementos em IR representados pelo limite superior e pelo limite inferior. O desenvolvimento de técnicas para previsão de STI é uma área de pesquisa muito promissora e os poucos resultados relatados na literatura surgiram muito recentemente. Nesta tese, estendemos técnicas clássicas de análise de séries temporais para descrição, modelagem e previsão de STI no domínio de ADS. Neste contexto, nós apresentamos técnicas para descrição de uma STI, envolvendo cálculo de estatísticas sumárias e representação gráfica dos dados. Na modelagem...

Métodos de cluster para intervalos usando algoritmos do tipo nuvens dinâmicas

Maria Cardoso Rodrigues de Souza, Renata; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
115.9%
A análise de dados simbólicos (Symbolic Data Analysis) é uma nova abordagem na área de descoberta automática de conhecimentos que visa desenvolver métodos para dados descritos por varáveis onde existem conjuntos de categorias, intervalos ou distribuições de probabilidade nas células das tabelas de dados. O objetivo deste trabalho é introduzir métodos de cluster para intervalos usando algoritmos de nuvens dinâmicas. Estes algoritmos consistem em obter, simultaneamente, uma partição em classes e identificar um conjunto de representantes das classes minimizando um critério que mede a adequação entre as classes e os protótipos. Os algoritmos de nuvens dinâmicas com distâncias adaptativas também encontram uma partição e um conjunto de representantes minimizando uma função critério, mas em cada interação existe uma distância diferente para comparar cada classe com o seu protótipo. A vantagem das distâncias adaptativas é que o algoritmo de agrupamento é capaz de reconhecer classes de formas e tamanhos diferentes. Neste trabalho, foi desenvolvido um método de nuvens dinâmicas usando a distância L1 para intervalos. Além deste método, foram também introduzidos três métodos com, respectivamente, as distâncias L1 (City-Block)...

Agrupamento de dados simbólicos intervalares usando funções de Kenel

Fabiano Batista Ferreira da Costa, Anderson; Maria Cardoso Rodrigues de Souza, Renata (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
136.04%
A Análise de dados simbólicos (ADS) ou Symbolic Data Analysis é uma nova abordagem na área de descoberta automática de conhecimentos que visa desenvolver métodos para dados descritos por variáveis onde existem conjuntos de categorias, intervalos ou distribuições de probabilidade. O objetivo deste trabalho é estender métodos de agrupamento clássicos para dados simbólicos intervalares baseados em funções de kernel. A aplicação de funções de kernel tem sido amplamente utilizado na classificação não supervisionada para dados clássicos e apresenta bons resultados quando o conjunto apresenta uma disposição não-linear dos dados. No entanto, na literatura de ADS ainda necessita de métodos para identificar grupos não lineares. Este trabalho engloba os paradigmas de agrupamento rígido (hard) e difuso (fuzzy), e realiza tais agrupamentos utilizando as funções de kernel em um espaço de alta dimensão, conhecido como espaço de características. Os métodos propostos neste trabalho consideram duas variantes comumente utilizadas em abordagens de kernel, onde uma considera que o protótipo dos grupos está definido neste espaço de características de alta dimensão e outra que considera o protótipo definido no espaço original de entradas. Os métodos propostos são comparados com variações do método K-médias existentes na literatura de ADS através de experimentos realizados com dados simulados e dados reais intervalares fazendo uso do experimento Monte Carlo e métricas estatísticas que evidenciam o desempenho superior dos métodos propostos

Uma solução em filtragem de informação para sistemas de recomendação baseada em análise de dados simbólicos

Leite Dantas Bezerra, Byron; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
146.01%
Sistemas de Recomendação permitem que sites de Comércio Eletrônico sugiram produtos aos consumidores provendo informações relevantes que os ajudem no processo de compra. Para isso é necessária a aquisição e a adequada utilização do perfil do usuário. O processo de aquisição pode ser implícito (comprar um livro ou consultar um item em uma loja on-line) ou explícito (dar uma nota a um filme ou recomendar um artigo a um amigo). Já as soluções propostas para o segundo problema podem ser classificadas em duas categorias principais com relação ao tipo de filtragem adotada: Filtragem Baseada em Conteúdo (baseia-se na análise da correlação entre o conteúdo dos itens com o perfil do usuário) e Filtragem Colaborativa (baseada na correlação de perfis de usuários). Tais técnicas possuem limitações, como escalabilidade na primeira abordagem e latência na segunda. Contudo, elas são complementares, o que impulsiona o surgimento de filtragens híbridas, cujo foco é aproveitar o melhor de cada método. Todavia, as filtragens híbridas não superam completamente os problemas principais de ambos os métodos. A motivação deste trabalho surge do desafio de superar os problemas principais existentes nos métodos de Filtragem Baseada em Conteúdo. Para isso...

Métodos robustos em análise de agrupamento para dados simbólicos

Cristina de Assis, Elaine; Maria Cardoso Rodrigues de Souza, Renata (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
126.17%
Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias completas, enquanto métodos de particionamento procuram obter uma simples partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy). Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos. Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente aos dados, variáveis podem assumir conjuntos de categorias ou intervalos...

Classificação Supervisionada Usando Dados Simbólicos de Semântica Modal

César Donato Silva, Fábio; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
126.07%
A Análise de Dados Simbólicos (Symbolic Data Analysis) é um domínio na área de descoberta automática de conhecimento que visa desenvolver métodos para dados descritos por variáveis que podem assumir como valor conjuntos ou listas de categorias, intervalos ou distribuições de probabilidade. Essas variáveis permitem levar em conta a variabilidade e/ou a incerteza presente nos dados. Este trabalho apresenta um classificador simbólico de semântica modal para dados simbólicos de tipo intervalo. O classificador proposto apresenta duas etapas básicas, a aprendizagem e a alocação, onde ambas necessitam de uma etapa precedente de préprocessamento que transforma os dados simbólicos do tipo intervalo em dados simbólicos modal. Cada exemplo do conjunto de aprendizagem é descrito por um vetor de intervalos. Após o pré-processamento, cada exemplo passa a ser descrito por um vetor de distribuições de pesos. Após a etapa de aprendizagem, cada classe é também descrita por um vetor de distribuições de pesos que sintetiza as informações dos exemplos da classe. Cada novo exemplo a ser atribuído a uma classe (etapa de alocação), representado por um vetor de intervalos, após a fase de pré-processamento passa a ser descrito por um vetor de distribuições de pesos. A alocação de um exemplo a uma classe é realizada através de funções de dissimilaridade que comparam pares de vetores de distribuições de pesos. Algumas funções de dissimilaridade desse tipo são consideradas nesse trabalho. A avaliação do desempenho desse classificador é realizada através da aplicação do mesmo a conjuntos de dados sintéticos em uma experiência Monte Carlo e a conjuntos de dados reais usando a técnica de validação cruzada leave-one-out. O desempenho é medido pela taxa (média) de erro de classificação e pelo tempo de execução das etapas de aprendizagem e classificação. Além disso...

Abordagem Kernelizada Para Análise Discriminante Generalizada

Queiroz, Diego Cesar Florencio de; Souza, Renata Maria Cardoso Rodrigues de (Orientadora); Cysneiros, Francisco José de Azevêdo (Coorientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Dissertação
BR
Relevância na Pesquisa
105.96%
Diferentes modelos clássicos já foram estendidos para a classificação de dados simbólicos de natureza intervalar, como regressão logística e discriminante linear, entre vários outros, contudo a maior parte desses classificadores foi desenvolvida para a resolução de problemas linearmente separáveis, não possuindo um bom desempenho face à problemas não-linearmente separáveis. Esse trabalho introduz duas abordagens baseadas no modelo de discriminante linear generalizado para classificar dados simbólicos intervalares. Nessas abordagens duas famílias de funções de kernel foram utilizadas separadamente para transpor os dados para um espaço de alta dimensão, permitindo a classificação de problemas não linearmente separáveis. Tal transposição é realizada através do kernel trick utilizando o produto escalar convencional e o produto escalar kernelizado para dados intervalares. Experimentos com conjuntos de dados sintéticos, híbrido entre sintético e real e uma aplicação com um conjunto de dados intervalares real demonstram a funcionalidade e eficiência dessa abordagem.

Uma abordagem adaptativa de learning vector quantization para classificação de dados intervalares

Silva Filho, Telmo de Menezes e; Souza, Renata Maria Cardoso Rodrigues de (orientadora)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Dissertação
BR
Relevância na Pesquisa
126.01%
A Análise de Dados Simbólicos lida com tipos de dados complexos, capazes de modelar a variabilidade interna dos dados e dados imprecisos. Dados simbólicos intervalares surgem naturalmente de valores como variação de temperatura diária, pressão sanguínea, entre outros. Esta dissertação introduz um algoritmo de Learning Vector Quantization para dados simbólicos intervalares, que usa uma distância Euclidiana intervalar ponderada e generalizada para medir a distância entre instâncias de dados e protótipos. A distância proposta tem quatro casos especiais. O primeiro caso é a distância Euclidiana intervalar e tende a modelar classes e clusters com formas esféricas. O segundo caso é uma distância intervalar baseada em protótipos que modela subregiões não-esféricas e de tamanhos similares dentro das classes. O terceiro caso permite à distância lidar com subregiões não-esféricas e de tamanhos variados dentro das classes. O último caso permite à distância modelar classes desbalanceadas, compostas de subregiões de várias formas e tamanhos. Experimentos são feitos para avaliar os desempenhos do Learning Vector Quantization intervalar proposto, usando todos os quatro casos da distância proposta. Três conjuntos de dados intervalares sintéticos e um conjunto de dados intervalares reais são usados nesses experimentos e seus resultados mostram a utilidade de uma distância localmente ponderada.

Abordagem híbrida para representação de forma e textura baseada em dados simbólicos

Almeida, Carlos Wilson Dantas de; Souza, Renata Maria C. R. De (orientadora)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Tese de Doutorado
BR
Relevância na Pesquisa
126.08%
A análise de dados simbólicos (Symbolic Data Analysis) é uma nova abordagem na área de descoberta automática de conhecimento que visa desenvolver métodos para dados descritos por variáveis onde existem conjuntos de categorias, intervalos ou distribuições de probabilidade nas células das tabelas de dados. Os dados clássicos passam a ser agregados a fim de representar variáveis mais complexas como intervalos reais, conjuntos de categorias, histogramas, distribuições de probabilidade, entre outras. Esta tese introduz um novo algoritmo de agrupamento denominado Fuzzy Kohonen Clustering Network para dados simbólicos do tipo intervalo. São apresentadas duas versões do algoritmo. Na primeira versão, é introduzido o algoritmo clássico utilizando a abordagem da análise de dados simbólicos. Na segunda versão, é introduzido o cálculo de pesos para cada classe e para cada atributo da classe como principal alteração do algoritmo original. Um outro ponto abordado se refere ao desenvolvimento de novos descritores de imagens. Nos últimos anos, o uso de documentos e imagens digitais vêm tomando um espaço cada vez maior na sociedade. Em resposta a esses desafios, iremos investigar uma nova estratégia, desenvolvendo descritores de forma e textura junto com os algoritmos de agrupamento. Estes descritores são desenvolvidos nesta tese como uma abordagem baseada em dados simbólicos de tipo intervalo.; CNPq

Métodos de regressão robusta e kernel para dados intervalares

Fagundes, Roberta Andrade de Araújo; Souza, Renata Maria Cardoso Rodrigues de (orientadora); Cysneiros, Francisco José de Azevêdo
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Tese de Doutorado
BR
Relevância na Pesquisa
95.87%
O processo de descoberta de conhecimento tem o objetivo de extrair de informa¸c˜oes ´uteis (conhecimento) em bases de dados. As abordagens usadas na execu¸c˜ao do processo de extra¸c˜ao do conhecimento s˜ao gen´ericas e derivadas das diferentes ´areas de conhecimento, tais como da estat´ıstica, aprendizagem de m´aquina e banco de dados. A An´alise de Dados Simb´olicos (ADS) [Bock e Diday, (2000)] ´e introduzida como abordagem na ´area de descoberta autom´atica de conhecimento que visa desenvolver m´etodos para dados descritos por vari´aveis atrav´es de conjuntos de categorias, lista de valores, intervalos ou distribui¸c˜ao de probabilidade. Dentre as t´ecnicas estat´ısticas, os modelos de regress˜ao procuram prever o comportamento da vari´avel resposta (dependente) a partir de informa¸c˜oes provenientes do conjunto de vari´aveis preditoras (independentes). O objetivo deste trabalho ´e propor duas metodologias para an´alise de dados intervalares. A primeira metodologia aborda o m´etodo robusto em regress˜ao, que ´e uma alternativa para o uso do m´etodo dos m´ınimos quadrados quando os dados contˆem outliers. Enquanto a segunda aborda regress˜ao por kernel, que ´e um m´etodo que prover uma rela¸c˜ao n˜ao param´etrica entre as vari´aveis...

Algoritmos de agrupamentos fuzzy intervalares e índice de validação para agrupamento de dados simbólicos do tipo intervalo; An interval fuzzy clustering and validation index for clusteinf in interval symbolic data

Moura, Ronildo Pinheiro de Araújo
Fonte: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação Publicador: Universidade Federal do Rio Grande do Norte; BR; UFRN; Programa de Pós-Graduação em Sistemas e Computação; Ciência da Computação
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
146%
Symbolic Data Analysis (SDA) main aims to provide tools for reducing large databases to extract knowledge and provide techniques to describe the unit of such data in complex units, as such, interval or histogram. The objective of this work is to extend classical clustering methods for symbolic interval data based on interval-based distance. The main advantage of using an interval-based distance for interval-based data lies on the fact that it preserves the underlying imprecision on intervals which is usually lost when real-valued distances are applied. This work includes an approach allow existing indices to be adapted to interval context. The proposed methods with interval-based distances are compared with distances punctual existing literature through experiments with simulated data and real data interval; Coordenação de Aperfeiçoamento de Pessoal de Nível Superior; A Análise de Dados Simbólicos (SDA) tem como objetivo prover mecanismos de redução de grandes bases de dados para extração do conhecimento e desenvolver métodos que descrevem esses dados em unidades complexas, tais como, intervalos ou um histograma. O objetivo deste trabalho é estender métodos de agrupamento clássicos para dados simbólicos intervalares baseados em distâncias essencialmente intervalares. A principal vantagem da utilização de uma distância essencialmente intervalar está no fato da preservação da imprecisão inerente aos intervalos...

Classificador simbólico baseado em regiões de tipo casca convexa

Tupinambá D'Oliveira Júnior, Simith; de Assis Tenório Carvalho, Francisco (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
116.12%
Com os progressos recentes nas tecnologias das ciências de informacão, diferentes tecnicas são introduzidas para sintetizar, analisar e extrair conhecimentos das informações armazenadas em enormes bases de dados. A analise de dados simbolicos (SDA) e um dominio na area de descoberta automatica de conhecimentos (KDD), relacionada com analise de dados multivariados, reconhecimento de padrões, inteligência artificial e banco de dados. SDA visa generalizar os metodos da analise exploratoria de dados e as tecnicas estatisticas (analise fatorial, regress~ao, classificac~ao etc.) par dados simbolicos. Esses novos dados são mais complexos do que os dados classicos, pois contêm variação interna e são estruturados. Este trabalho introduz um classificador para dados descritos por vetores de valores quantitativos baseado em regi~oes de tipo casca convexa. A ideia central desta abordagem e construir regiões que descrevem e discriminem classes de exemplos observados. Nos classificadores para dados simbolicos baseados em regi~oes existentes na literatura de SDA, a etapa de aprendizagem fornece a descric~ao de uma classe por uma região (ou conjunto de regiões), definida pelo hiper-cubo formado pelos objetos pertencentes a esta classe. Esta descricão e obtida atraves de um operador simbolico (junção) e um Grafo de Vizinhos Mutuos. Na etapa de alocação...