Página 1 dos resultados de 258 itens digitais encontrados em 0.001 segundos

O processo de extração de conhecimento de base de dados apoiado por agentes de software.; The process of knowledge discovery in databases supported by software agents.

Oliveira, Robson Butaca Taborelli de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 01/12/2000 PT
Relevância na Pesquisa
27.03%
Os sistemas de aplicações científicas e comerciais geram, cada vez mais, imensas quantidades de dados os quais dificilmente podem ser analisados sem que sejam usados técnicas e ferramentas adequadas de análise. Além disso, muitas destas aplicações são voltadas para Internet, ou seja, possuem seus dados distribuídos, o que dificulta ainda mais a realização de tarefas como a coleta de dados. A área de Extração de Conhecimento de Base de Dados diz respeito às técnicas e ferramentas usadas para descobrir automaticamente conhecimento embutido nos dados. Num ambiente de rede de computadores, é mais complicado realizar algumas das etapas do processo de KDD, como a coleta e processamento de dados. Dessa forma, pode ser feita a utilização de novas tecnologias na tentativa de auxiliar a execução do processo de descoberta de conhecimento. Os agentes de software são programas de computadores com propriedades, como, autonomia, reatividade e mobilidade, que podem ser utilizados para esta finalidade. Neste sentido, o objetivo deste trabalho é apresentar a proposta de um sistema multi-agente, chamado Minador, para auxiliar na execução e gerenciamento do processo de Extração de Conhecimento de Base de Dados.; Nowadays, commercial and scientific application systems generate huge amounts of data that cannot be easily analyzed without the use of appropriate tools and techniques. A great number of these applications are also based on the Internet which makes it even more difficult to collect data...

Descoberta do conhecimento em base de dados como ferramenta aplicada em processos sucroalcooleiros; A proposal to use KDD as a tool to discovery alcohol and sugar production plant behavior

Cunha, Márcio José da
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 11/02/2011 PT
Relevância na Pesquisa
37.77%
Nos dias atuais, a quantidade de dados armazenados na indústria é considerada extensa e contínua. Nas indústrias de produção de açúcar e álcool, nem sempre todas as variáveis do processo são analisadas devido a imensa quantidade de dados, a diversidade dos setores no processo e pela grande diculdade em saber como se deve analisar tais dados. Este trabalho propõe a utilização do processo da Descoberta do Conhecimento em Base de Dados, o processo KDD, como uma ferramenta para ser aplicada em processos industriais, especicamente no processo de produção de açúcar e álcool. Os experimentos foram realizados com dados obtidos do processo de fermentação, durante a safra sucroalcooleira. Os resultados mostram que é possível aplicar o processo de KDD para este tip o de indústria, podendo ser aplicado como uma ferramenta de previsão de produção de açúcar e álcool.; Nowadays, the amount of data stored in the industry is considered large and continuous. In the sugar and alcohol industrial production, not always all the pro cess variables are analyzed due to the immense amount of data, the diversity of sectors in the process and the great diculty in knowing how to analyze such data. This work proposes the use of proposes the use of the process of Knowledge Discovery in Databases...

Aplicação do processo de descoberta de conhecimento em dados do poder judiciário do estado do Rio Grande do Sul; Applying the Knowledge Discovery in Database (KDD) Process to Data of the Judiciary Power of Rio Grande do Sul

Schneider, Luís Felipe
Fonte: Universidade Federal do Rio Grande do Sul Publicador: Universidade Federal do Rio Grande do Sul
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
37.83%
Para explorar as relações existentes entre os dados abriu-se espaço para a procura de conhecimento e informações úteis não conhecidas, a partir de grandes conjuntos de dados armazenados. A este campo deu-se o nome de Descoberta de Conhecimento em Base de Dados (DCBD), o qual foi formalizado em 1989. O DCBD é composto por um processo de etapas ou fases, de natureza iterativa e interativa. Este trabalho baseou-se na metodologia CRISP-DM . Independente da metodologia empregada, este processo tem uma fase que pode ser considerada o núcleo da DCBD, a “mineração de dados” (ou modelagem conforme CRISP-DM), a qual está associado o conceito “classe de tipo de problema”, bem como as técnicas e algoritmos que podem ser empregados em uma aplicação de DCBD. Destacaremos as classes associação e agrupamento, as técnicas associadas a estas classes, e os algoritmos Apriori e K-médias. Toda esta contextualização estará compreendida na ferramenta de mineração de dados escolhida, Weka (Waikato Environment for Knowledge Analysis). O plano de pesquisa está centrado em aplicar o processo de DCBD no Poder Judiciário no que se refere a sua atividade fim, julgamentos de processos, procurando por descobertas a partir da influência da classificação processual em relação à incidência de processos...

Extração do fator qualidade de uma clínica odontológica utilizando algoritmos genéticos aplicados ao processo de KDD

Tenório Junior, Nelson Nunes
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: i, 54 f.| il., tabs., grafs.
POR
Relevância na Pesquisa
27.32%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.; Este trabalho modela e implementa um Algoritmo Genético (AG) capaz de extrair o fator qualidade de uma clínica odontológica baseado em informações de prontuários clínicos devidamente armazenados em um Banco de Dados. Para tanto são abordados: um estudo sobre a área de Knowledge Discovery in Database (KDD); conceito de Mineração de Dados (Data Mining) no contexto de Algoritmos Genéticos; a implementação de um Sistema de Controle de Prontuários Odontológicos - SCoPO - que avalia e retorna o fator qualidade da clínica; e, por fim um estudo de casos com seus respectivos resultados obtidos. O estudo da área de KDD, que envolve todo o processo de descoberta de conhecimento útil em banco de dados, abrange: definição do problema; seleção dos dados; limpeza dos dados; pré-processamento dos dados; codificação dos dados; enriquecimento dos dados; mineração dos dados e a interpretação dos resultados. Em particular, este estudo trata a fase de Mineração de Dados (Data Mining) destacando os algoritmos e técnicas empregadas que utilizam-se dos Modelos Estatísticos e Algoritmos Genéticos e...

Modelo de data mining para deteção de embolias pulmonares

Ramalho, Virgínia Valente
Fonte: Instituto Politécnico de Lisboa Publicador: Instituto Politécnico de Lisboa
Tipo: Dissertação de Mestrado
Publicado em /09/2013 POR
Relevância na Pesquisa
27.32%
Este trabalho surge na sequência de um desafio proposto no KDD Cup 2006, detetar a presença de embolia pulmonar a partir de imagens médicas. A embolia pulmonar é o bloqueio da artéria pulmonar ou de um de seus ramos. A rapidez no diagnóstico e tratamento de doentes com embolia pulmonar aguda permite reduzir a sua mortalidade. O desafio clínico, num cenário de emergência, é diagnosticar corretamente o indivíduo que apresenta a patologia, para se dar início ao tratamento. É neste ponto que técnicas de Data Mining podem ser usadas para produzir modelos que auxiliam o médico, radiologista, a tomar decisões. Este trabalho tem como objetivo apresentar modelos de classificação que tenham baixos rácios de falsos positivos na identificação de embolias pulmonares num indivíduo, mas apresentando valores altos de sensibilidade. Foi criado um conjunto de dados, dividido em conjuntos de treino e de teste, que resultam da aplicação de técnicas de Feature Selection e de equilíbrio entre os números de casos de cada classe. Cada par foi utilizado em diferentes algoritmos de classificação. A cada combinação, conjunto de dados e algoritmo, foram aplicadas técnicas de pós-processamento, nomeadamente a alteração do ponto operacional...

Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados

Steiner,Maria Teresinha Arns; Soma,Nei Yoshihiro; Shimizu,Tamio; Nievola,Júlio Cesar; Steiner Neto,Pedro José
Fonte: Universidade Federal de São Carlos Publicador: Universidade Federal de São Carlos
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/05/2006 PT
Relevância na Pesquisa
37.32%
A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.

Framework Híbrido para Integração de Ferramentas e Reuso do Conhecimento em Problemas Binários de Mineração de Dados

Carneiro Leão Vieira da Cunha, Rodrigo; Jorge Leitão Adeodato, Paulo (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
27.77%
Data Mining surgiu da necessidade de extração do conhecimento a partir de volumosas massas de dados geradas pelas empresas/instituições. Com o crescimento da área e o aumento do poder de processamento dos computadores, as organizações que prestam serviços em KDD (Knowledge Discovery in Database) têm guardado, cada vez mais, um grande número de documentos e processos referentes a projetos executados no passado. Por outro lado, hoje, o desenvolvimento de projetos de Data Mining exige do especialista o uso de diversas ferramentas, linguagens de programação e metodologias associadas à sua experiência para resolução do problema. Um dos maiores problemas práticos de KDD é como prover a interoperabilidade entre diferentes plataformas existentes, de tal forma que os processos fiquem centralizados e documentados em um único ambiente. Outro grande problema, hoje, é a falta de reuso de conhecimento devido à complexidade e forte dependência do usuário. Neste contexto, as experiências adquiridas em projetos anteriores não são devidamente documentadas, gerenciadas e controladas, gerando como conseqüência a repetição de erros dos projetos anteriores. Em outras palavras, outro grande problema prático é a falta de plataformas capazes de fazer o reuso do conhecimento adquirido em projetos realizados no passado. O principal objetivo deste trabalho é criar um framework híbrido para desenvolvimento de soluções em Mineração de Dados que integra diversas ferramentas disponíveis no mercado e disponibiliza um ambiente integrado para reuso do conhecimento na área de KDD. Este ambiente possibilita a centralização e padronização dos artefatos gerados ao longo do processo de KDD...

Uma arquitetura de software para descoberta de regras de associação multidimensional, multinível e de outliers em cubos OLAP: um estudo de caso com os algoritmos APriori e FPGrowth

Moreira Tanuro, Carla; do Nascimento Fidalgo, Robson (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
27.32%
O processo tradicional de descoberta de conhecimento em bases de dados (KDD Knowledge Discovery in Databases) não contempla etapas de processamento multidimensional e multinível (i.e., processamento OLAP - OnLine Analytical Processing) para minerar cubos de dados. Por conseqüência, a maioria das abordagens de OLAM (OLAP Mining) propõe adaptações no algoritmo minerador. Dado que esta abordagem provê uma solução fortemente acoplada ao algoritmo minerador, ela impede que as adaptações para mineração multidimensional e multinível sejam utilizadas com outros algoritmos. Além disto, grande parte das propostas de OLAM para regras de associação não considera o uso de um servidor OLAP e não tira proveito de todo o potencial multidimensional e multinível presentes nos cubos OLAP. Por estes motivos, algum retrabalho (e.g., re-implementação de operações OLAP) é realizado e padrões possivelmente fortes decorrentes de generalizações não são identificados. Diante desse cenário, este trabalho propõe a arquitetura DOLAM (Decoupled OLAM) para mineração desacoplada de regras de associação multidimensional, multinível e de outliers em cubos OLAP. A arquitetura DOLAM deve ser inserida no processo de KDD (Knowledge Discovery in Databases) como uma etapa de processamento que fica entre as etapas de Pré-Processamento e Transformação de Dados. A arquitetura DOLAM define e implementa três componentes: 1) Detector de Outliers...

DMPML: uma aplicação XML para a fase de preparação de dados do processo de KDD

Mauricio Gonçalves Júnior, Paulo; Souto Maior de Barros, Roberto (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
37.32%
Nesta dissertação a linguagem DMPML é proposta como alternativa para a padronização da fase de preparação de dados em um processo de KDD. A DMPML é baseada em XML e utiliza transformações XSL para transformar dados. Devido às características da linguagem XML tais como extensibilidade, robustez e independência de plataforma, projetos de preparação de dados gerados com a utilização da DMPML podem ser compartilhados de forma eficiente através da Internet, promovendo o reuso de trabalho e a troca de experiência entre projetos semelhantes. Outros benefícios da aplicabilidade da DMPML são: (a) não necessidade de utilização de banco de dados relacionais para armazenar informações geradas pelas subfases de tratamento de dados; (b) não necessidade de implementação de código especial para transformar dados brutos em dados prontos para aplicação em um algoritmo específico de mineração de dados; (c) possibilidade de criação de regras específicas de transformação de dados para algoritmos específicos de mineração de dados sem necessariamente ser preciso redefinir o projeto de preparação de dados e (d) grande potencialidade de reutilização de projetos de preparação de dados entre massas de dados com atributos semelhantes

Uma metodologia para classificação de dados nominais baseada no processo KDD

Souza, Rodrigo Clemente Thom de
Fonte: Universidade Federal do Paraná Publicador: Universidade Federal do Paraná
Tipo: Tese de Doutorado Formato: application/pdf
PORTUGUêS
Relevância na Pesquisa
27.03%
Resumo: A classificação de padrões é um problema de aprendizado supervisionado do campo da ciência conhecido como Reconhecimento de Padrões (RP), através do qual se deseja discriminar instâncias de dados em diferentes classes. A solução para este problema é obtida por meio de algoritmos (classificadores) que buscam por padrões de relacionamento entre classes em casos conhecidos (treinamento), usando tais relações para classificar casos desconhecidos (teste). O desempenho em termos de acurácia preditiva dos algoritmos que se propõem a realizar tal tarefa depende muito da qualidade e dos tipos de dados contidos nas bases. Visando melhorar a qualidade dos dados e dar tratamento adequado aos tipos de dados utilizados, o presente trabalho faz uso do processo de Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases; KDD), no qual a classificação é uma das tarefas da etapa conhecida como Mineração de Dados (Data Mining; DM). As etapas aqui aplicadas antes da classificação são a seleção de atributos wrapper e um processo de transformação de atributos baseado em Análise Geométrica de Dados (Geometric Data Analysis; GDA). Para a seleção de atributos é proposta uma nova técnica baseada em Algoritmo de Estimação de Distribuição (Estimation of Distribution Algorithm; EDA) e em Algoritmos Culturais (AC) batizada de Belief-Based Incremental Learning (BBIL). Para a transformação de atributos é aqui proposta a utilização de uma alternativa à clássica Análise de Componentes Principais (Principal Component Analysis; PCA) para lidar especificamente com dados nominais: a Análise de Correspondência Múltipla (Multiple Correspondence Analysis; MCA). Na etapa de DM...

Processo de KDD para auxílio à reconfiguração de ambientes virtualizados

Winck, Ana Trindade
Fonte: Pontifícia Universidade Católica do Rio Grande do Sul; Porto Alegre Publicador: Pontifícia Universidade Católica do Rio Grande do Sul; Porto Alegre
Tipo: Dissertação de Mestrado
PORTUGUêS
Relevância na Pesquisa
27.32%
Xen é um paravirtualizador que permite a execução simultânea de diversas máquinas virtuais (VM), cada uma com seu próprio sistema operacional. O consumo dessas VMs se dá em diferentes níveis de recursos. Com o objetivo de melhorar a performance do Xen, é interessante verificar qual a melhor alocação de recursos para uma dada máquina Xen, quando várias VMs são executadas, e quais são os respectivos parâmetros. Para auxiliar a eventual reconfiguração de parâmetros, este trabalho propõe um processo completo de descoberta de conhecimento em banco de dados (processo de KDD) para capturar dados de desempenho das VMs, organizá-los em um modelo analítico e aplicar técnicas de mineração para sugerir novos parâmetros. Inicialmente são obtidos dados de desempenho de cada VM, onde a estratégia empregada é a execução de benchmarks sobre cada sistema operacional.Esses dados são armazenados em um data warehouse propriamente modelado para armazenar registros de captura de métricas de benchmarks. Os dados armazenados são convenientemente preparados para serem utilizados por algoritmos de mineração de dados. Os modelos preditivos gerados podem, então, ser enriquecidos com instruções em alto nível de reconfigurações. Tais modelos buscam sugerir...

How fast is -fast? Performance analysis of KDD applications using hardware performance counters on UltraSPARC-III

Czezowski, Adam; Christen, Peter
Fonte: Universidade Nacional da Austrália Publicador: Universidade Nacional da Austrália
Tipo: Working/Technical Paper Formato: 302255 bytes; 356 bytes; application/pdf; application/octet-stream
EN_AU
Relevância na Pesquisa
27.03%
Modern processors and computer systems are designed to be eÆcient and achieve high performance with applications that have regular memory access patterns. For example, dense linear algebra routines can be implemented to achieve near peak performance. While such routines have traditionally formed the core of many scientific and engineering applications, commercial workloads like database and web servers, or decision support systems (data warehouses and data mining) are one of the fastest growing market segments on high-performance computing platforms. Many of these commercial applications are characterised by more complex codes and irregular memory access patterns, which often result in a decrease of performance that is achieved. Due to their complexity and the lack of source code, performance analysis of commercial applications is not an easy task. Hardware performance counters allow detailed analysis of program behaviour, like number of instructions of various types, memory and cache access, hit and miss rates, or branch mispredictions. In this paper we describe experiments and present results conducted with various KDD applications on an UltraSPARC-III platform, and we compare these applications with an optimized dense matrix-matrix multiplication. We focus on compiler optimisations using the -fast ag and discuss di_erences in un-optimised and optimised codes.; no

Performance Analysis of KDD Applications using Hardware Event Counters

Christen, Peter; Czezowski, Adam
Fonte: Universidade Nacional da Austrália Publicador: Universidade Nacional da Austrália
Tipo: Working/Technical Paper Formato: 243316 bytes; 356 bytes; application/pdf; application/octet-stream
EN_AU
Relevância na Pesquisa
37.32%
Modern processors and computer systems are designed to be efficient and achieve high performance with applications that have regular memory access patterns. For example, dense linear algebra routines can be implemented to achieve near peak performance. While such routines have traditionally formed the core of many scientific and engineering applications, commercial workloads like database and web servers, or decision support systems (data warehouses and data mining) are one of the fastest growing segments in the high-performance computing market. Many of these commercial applications are characterised by complex codes and irregular memory access patterns, which often result in a decreased performance. Due to their complexity and the lack of source code, performance analysis of commercial applications is not an easy task. Hardware performance counters allow acquisition of low level, reliable data, necessary to perform detailed analysis of program behaviour. In this paper we describe experiments and present first results conducted with various KDD applications on an UltraSPARC III platform.; no

CLASSIFICATION OF POWER QUALITY CONSIDERING VOLTAGE SAGS IN DISTRIBUTION SYSTEMS USING KDD PROCESS

Góes,Anderson Roges Teixeira; Steiner,Maria Teresinha Arns; Peniche,Rodrigo Antonio
Fonte: Sociedade Brasileira de Pesquisa Operacional Publicador: Sociedade Brasileira de Pesquisa Operacional
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/08/2015 EN
Relevância na Pesquisa
37.5%
In this paper, we propose a methodology to classify Power Quality (PQ) in distribution systems based on voltage sags. The methodology uses the KDD process (Knowledge Discovery in Databases) in order to establish a quality level to be printed in labels. The methodology was applied to feeders on a substation located in Curitiba, Paraná, Brazil, considering attributes such as sag length (remnant voltage), duration and frequency (number of occurrences on a given period of time). On the Data Mining Stage (the main stage on KDD Process), three different techniques were used, in a comparative way, for pattern recognition, in order to achieve the quality classification for the feeders: Artificial Neural Networks (ANN); Support Vector Machines (SVM) and Genetic Algorithms (GA). By printing a label with quality level information, utilities companies (power concessionaires) can get better organized for mitigation procedures by establishing clear targets. Moreover, the same way costumers already receive information regarding PQ based on interruptions, they will also be able to receive information based on voltage sags.

Identifica??o e estima??o de ru?do em redes DSL: uma abordagem baseada em intelig?ncia computacional

FARIAS, Fabr?cio de Souza
Fonte: Universidade Federal do Pará Publicador: Universidade Federal do Pará
Tipo: Dissertação de Mestrado
POR
Relevância na Pesquisa
27.62%
Este trabalho prop?e a utiliza??o de t?cnicas de intelig?ncia computacional objetivando identificar e estimar a potencia de ru?dos em redes Digital Subscriber Line ou Linhas do Assinante Digital (DSL) em tempo real. Uma metodologia baseada no Knowledge Discovery in Databases ou Descobrimento de Conhecimento em Bases de Dados (KDD) para detec??o e estima??o de ru?dos em tempo real, foi utilizada. KDD ? aplicado para selecionar, pr?-processar e transformar os dados antes da etapa de aplica??o dos algoritmos na etapa de minera??o de dados. Para identifica??o dos ru?dos o algoritmo tradicional backpropagation baseado em Redes Neurais Artificiais (RNA) ? aplicado objetivando identificar o tipo de ru?do em predomin?ncia durante a coleta das informa??es do modem do usu?rio e da central. Enquanto, para estima??o o algoritmo de regress?o linear e o algoritmo h?brido composto por Fuzzy e regress?o linear foram aplicados para estimar a pot?ncia em Watts de ru?do crosstalk ou diafonia na rede. Os resultados alcan?ados demonstram que a utiliza??o de algoritmos de intelig?ncia computacional como a RNA s?o promissores para identifica??o de ru?dos em redes DSL, e que algoritmos como de regress?o linear e Fuzzy com regress?o linear (FRL) s?o promissores para a estima??o de ru?dos em redes DSL.; ABSTRACT: This paper proposes the use of computational intelligence techniques aiming to identify and estimate the noise power in Digital Subscriber Line (DSL) networks on real time. A methodology based on Knowledge Discovery in Databases (KDD) for detect and estimate noise in real time...

Kdd, semma crisp-dm: a parallel overviee

Azevedo, Ana Isabel Rojão Lourenço; Santos, Manuel Filipe
Fonte: Instituto Politécnico do Porto Publicador: Instituto Politécnico do Porto
Tipo: Artigo de Revista Científica
Publicado em //2008 ENG
Relevância na Pesquisa
37.5%
In the last years there has been a huge growth and consolidation of the Data Mining field. Some efforts are being done that seek the establishment of standards in the area. Included on these efforts there can be enumerated SEMMA and CRISP-DM. Both grow as industrial standards and define a set of sequential steps that pretends to guide the implementation of data mining applications. The question of the existence of substantial differences between them and the traditional KDD process arose. In this paper, is pretended to establish a parallel between these and the KDD process as well as an understanding of the similarities between them.

KDD, SEMMA and CRISP-DM: a parallel overview

Azevedo, Ana Isabel Rojão Lourenço
Fonte: Instituto Politécnico do Porto Publicador: Instituto Politécnico do Porto
Tipo: Artigo de Revista Científica
Publicado em //2008 ENG
Relevância na Pesquisa
27.32%
In the last years there has been a huge growth and consolidation of the Data Mining field. Some efforts are being done that seek the establishment of standards in the area. Included on these efforts there can be enumerated SEMMA and CRISP-DM. Both grow as industrial standards and define a set of sequential steps that pretends to guide the implementation of data mining applications. The question of the existence of substantial differences between them and the traditional KDD process arose. In this paper, is pretended to establish a parallel between these and the KDD process as well as an understanding of the similarities between them.

Contributions of KDD to the knowledge management process: a case study

Sousa, Paulo de Tarso Costa de; Prado, Hércules Antônio do; Moresi, Eduardo Amadeu Dutra; Ladeira, Marcelo
Fonte: Universidade Católica de Brasília Publicador: Universidade Católica de Brasília
Tipo: Artigo de Revista Científica Formato: Texto
PT_BR
Relevância na Pesquisa
27.83%
Knowledge Discovery in Databases (KDD), as any organizational process, is carried out beneath a Knowledge Management (KM) model adopted (even informally) by a corporation. KDD is grossly described in three steps: pre-processing, data mining, and post-processing. The latter is mainly related to the task of transforming in knowledge the patterns issued in the data mining step. On the other hand, KM comprises the following phases, in which knowledge is the subject of the actions: identification of abilities, acquisition, selection and validation, organization and storage, sharing, application, and creation. Although there are many overlaps between KDD and KM, one of them is broadly recognized: the point in which knowledge arises. This paper concerns a study aimed at clarifying relations between the overlapping areas of KDD and knowledge creation, in KM. The work is conducted by means of a case study using the data from the Electoral Court of the Federal District (ECFD), Brazil. The study was developed over a 1.717.000-citizens data set from which data mining models were built by applying algorithms from Weka. It was observed that, although the importance of Information Technology is well recognized in the KM realm, the techniques of KDD deserve a special place in the knowledge creation phase of KM. Moreover...

KDD-SC: Subspace Clustering Extensions for Knowledge Discovery Frameworks

Günnemann, Stephan; Kremer, Hardy; Hannen, Matthias; Seidl, Thomas
Fonte: Universidade Cornell Publicador: Universidade Cornell
Tipo: Artigo de Revista Científica
Publicado em 14/07/2014
Relevância na Pesquisa
27.77%
Analyzing high dimensional data is a challenging task. For these data it is known that traditional clustering algorithms fail to detect meaningful patterns. As a solution, subspace clustering techniques have been introduced. They analyze arbitrary subspace projections of the data to detect clustering structures. In this paper, we present our subspace clustering extension for KDD frameworks, termed KDD-SC. In contrast to existing subspace clustering toolkits, our solution neither is a standalone product nor is it tightly coupled to a specific KDD framework. Our extension is realized by a common codebase and easy-to-use plugins for three of the most popular KDD frameworks, namely KNIME, RapidMiner, and WEKA. KDD-SC extends these frameworks such that they offer a wide range of different subspace clustering functionalities. It provides a multitude of algorithms, data generators, evaluation measures, and visualization techniques specifically designed for subspace clustering. These functionalities integrate seamlessly with the frameworks' existing features such that they can be flexibly combined. KDD-SC is publicly available on our website.; Comment: 8 pages, 8 figures

TENDENCIAS TRANSDISCIPLINARIAS EN LOS ESTUDIOS MÉTRICOS DE LA INFORMACIÓN Y SU RELACIÓN CON LA GESTIÓN DE LA INFORMACIÓN Y DEL CONOCIMIENTO

Gorbea-Portal, Salvador
Fonte: Universidade Federal da Paraíba Publicador: Universidade Federal da Paraíba
Tipo: info:eu-repo/semantics/article; info:eu-repo/semantics/publishedVersion; "Avaliado por Pares"; Enfoque Transdisciplinario Formato: application/pdf
Publicado em 28/06/2013 POR
Relevância na Pesquisa
27.32%
Se perfila una nueva tendencia en los Estudios Métricos de la Información a partir del enfoque transdisciplinario propio de la naturaleza de este tipo de estudio, a través del cual se identifican y definen un conjunto de procesos y metodologías convergentes con este tipo de estudio, conocidas como: KDD (Knowledge Discovery Database – Descubrimiento de Conocimiento en Bases de Datos), la Minería de Datos, de Texto y de la WWW, la Bibliomining (Bibliominería) y el OLAP (Online Analytical Processing (Procesamiento Analítico en Línea), utilizadas para el descubrimiento de conocimiento en los repositorios de datos (Data Warehouse), así como la vinculación de esta convergencia con los Sistemas de Gestión de Información y de Conocimiento, finalmente se propone un modelo en el que se muestran estas relaciones.