Página 1 dos resultados de 35854 itens digitais encontrados em 0.033 segundos

Experimental study of a similarity metric for retrieving pieces from structured plan cases: its role in the originality of plan case solutions

Macedo, Luís; Pereira, Francisco C.; Grilo, Carlos Fernando Almeida; Cardoso, Fernando Amílcar Bandeira
Fonte: Springer Publicador: Springer
Tipo: Conferência ou Objeto de Conferência
Publicado em /07/1996 ENG
Relevância na Pesquisa
36.48%
This paper describes a quantitative similarity metric and its contribution to achieve original plan solutions. This similarity metric is used by an iterative process of piece retrieval from structured plan cases. Within our approach plan cases are tree-like networks of pieces (goals and actions). These case pieces are ill-related each other by links (explanations). These links may be classified as hierarchical or temporal, antecedent or consequent, and explicit or implicit. Besides links, each case piece has also information about its properties (the attributes-value pairs), its hierarchical and temporal position in the case (the address), and about its constraints in the relationship with others (the constraints). The similarity metric computes a similarity value between two case pieces taking into account similarities between these case piece’s information types. Each time a problem is proposed, different weights are given to some of those similarities, with the aim of solving it with an original solution. This similarity metric is used by the system INSPIRER (ImagiNation taking as Source Past and Imperfectly REalated Reasonings). We illustrate the role of the similarity metric in the creativity of solutions, focusing specially their originality...

Paged similarity queries

SERAPHIM, Enzo; SERAPHIM, Thatyana F. Piola; MOREIRA, Edmilson M.; RICOTTA, Fabio C. M.; TRAINA JR., Caetano
Fonte: ELSEVIER SCIENCE INC Publicador: ELSEVIER SCIENCE INC
Tipo: Artigo de Revista Científica
ENG
Relevância na Pesquisa
36.48%
An important feature of a database management systems (DBMS) is its client/server architecture, where managing shared memory among the clients and the server is always an tough issue. However, similarity queries are specially sensitive to this kind of architecture, since the answer sizes vary widely. Usually, the answers of similarity query are fully processed to be sent in full to the user, who often is interested in just parts of the answer, e.g. just few elements closer or farther to the query reference. Compelling the DBMS to retrieve the full answer, further ignoring its majority is at least a waste of server processing power. Paging the answer is a technique that splits the answer onto several pages, following client requests. Despite the success of paging on traditional queries, little work has been done to support it in similarity queries. In this work, we present a technique that not only provides paging in similarity range or k-nearest neighbor queries, but also supports them in two variations: the forward similarity query and the backward similarity query. They return elements either increasingly farther of increasingly closer to the query reference. The reported experiments show that, depending on the proportion of the interesting part over the full answer...

Operações de consulta por similaridade em grandes bases de dados complexos; Similarity search operations in large complex databases

Barioni, Maria Camila Nardini
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 04/09/2006 PT
Relevância na Pesquisa
36.48%
Os Sistemas de Gerenciamento de Bases de Dados (SGBD) foram desenvolvidos para armazenar e recuperar de maneira eficiente dados formados apenas por números ou cadeias de caracteres. Entretanto, nas últimas décadas houve um aumento expressivo, não só da quantidade, mas da complexidade dos dados manipulados em bases de dados, dentre eles os de natureza multimídia (como imagens, áudio e vídeo), informações geo-referenciadas, séries temporais, entre outros. Assim, surgiu a necessidade do desenvolvimento de novas técnicas que permitam a manipulação eficiente de tipos de dados complexos. Para atender às buscas necessárias às aplicações de base de dados modernas é preciso que os SGBD ofereçam suporte para buscas por similaridade ? consultas que realizam busca por objetos da base similares a um objeto de consulta, de acordo com uma certa medida de similaridade. Outro fator importante que veio contribuir para a necessidade de suportar a realização de consultas por similaridade em SGBD está relacionado à integração de técnicas de mineração de dados. É fundamental para essa integração o fornecimento de recursos pelos SGBD que permitam a realização de operações básicas para as diversas técnicas de mineração de dados existentes. Uma operação básica para várias dessas técnicas...

Tratamento de condições especiais para busca por similaridade em bancos de dados complexos; Treatment of special conditional for similarity searching in complex data bases

Kaster, Daniel dos Santos
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 23/04/2012 PT
Relevância na Pesquisa
36.54%
A quantidade de dados complexos (imagens, vídeos, séries temporais e outros) tem crescido rapidamente. Dados complexos são adequados para serem recuperados por similaridade, o que significa definir consultas de acordo com um dado critério de similaridade. Além disso, dados complexos usualmente são associados com outras informações, geralmente de tipos de dados convencionais, que devem ser utilizadas em conjunto com operações por similaridade para responder a consultas complexas. Vários trabalhos propuseram técnicas para busca por similaridade, entretanto, a maioria das abordagens não foi concebida para ser integrada com um SGBD, tratando consultas por similaridade como operações isoladas, disassociadas do processador de consultas. O objetivo principal desta tese é propor alternativas algébricas, estruturas de dados e algoritmos para permitir um uso abrangente de consultas por similaridade associadas às demais operações de busca disponibilizadas pelos SGBDs relacionais e executar essas consultas compostas eficientemente. Para alcançar este objetivo, este trabalho apresenta duas contribuições principais. A primeira contribuição é a proposta de uma nova operação por similaridade, chamada consulta aos k-vizinhos mais próximos estendida com condições (ck-NNq)...

Explorando variedade em consultas por similaridade; Investigationg variety in similarity queries

Santos, Lúcio Fernandes Dutra
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 26/10/2012 PT
Relevância na Pesquisa
36.48%
A complexidade dos dados armazenados em grandes bases de dados aumenta sempre, criando a necessidade de novas formas de consulta. As consultas por similaridade vêm apresentando crescente interesse para tratar de dados complexos, sendo as mais representativas a consulta por abrangência ('R IND. q' Range query) e a consulta aos k-vizinhos mais próximos (k-'NN IND. q' k-Nearest Neighboor query). Até recentemente, essas consultas não estavam disponíveis nos Sistemas de Gerenciamento de Bases de Dados (SGBD). Agora, com o início de sua disponibilidade, tem se tornado claro que os operadores de busca fundamentais usados para executá-las não são suficientes para atender às necessidades das aplicações que as demandam. Assim, estão sendo estudadas variações e extensões aos operadores fundamentais, em geral voltados às necessidades de domínios de aplicações específicas. Além disso, os seguintes problemas vêm impactando diretamente sua aceitação por parte dos usuários e, portanto, sua usabilidade: (i) os operadores fundamentais são pouco expressivos em situações reais; (ii) a cardinalidade dos resultados tende a ser grande, obrigando o usuário analisar muitos elementos; e (iii) os resultados nem sempre atendem ao interesse do usuário...

Infraestrutura computacional para avaliação da similaridade funcional composta entre microRNAs baseada em ontologias; Computational platform for evaluation of the composed functional similarity between microRNAs based on ontologies

Sasazaki, Mariana Yuri
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 19/08/2014 PT
Relevância na Pesquisa
36.53%
MicroRNAs (miRNAs) são pequenos RNAs não codificadores de proteínas que atuam principalmente como silenciadores pós-transcricionais, inibindo a tradução de RNAs mensageiros. Evidências crescentes revelam que tais moléculas desempenham papéis críticos em muitos processos biológicos importantes. Uma vez que não existem anotações de termos de miRNAs na Gene Ontology (GO), tampouco um banco de dados de referência com anotações funcionais dos mesmos, o cálculo da medida de similaridade entre miRNAs de forma direta não possui um padrão estabelecido. Por outro lado, a existência de bancos de dados de genes-alvo de miRNAs, como o TarBase, e bases de dados contendo informações sobre associações de miRNAs e doenças humanas, como o HMDD, nos permite inferir a similaridade funcional dos miRNAs indiretamente, por meio da análise de seus genes-alvo na GO ou entre suas doenças relacionadas na ontologia MeSH. Além disso, de acordo com a estrutura da ontologia de miRNAs OMIT, um miRNA também pode ser anotado com outras informações, tais como a sua natureza de atuação como oncogênico ou supressor de tumor, o organismo em que se encontra, o tipo de experimento em que foi encontrado, suas associações com doenças, genes-alvo...

Consultas por similaridade no modelo relacional; Similarity queries in the relational model

Pierro, Gabriel Vicente de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 18/05/2015 PT
Relevância na Pesquisa
36.48%
Os Sistemas de Gerenciamento de Bases de Dados Relacionais (SGBDR) foram concebidos para o armazenamento e recuperação de grandes volumes de dados. Tradicionalmente, estes sistemas suportam números, pequenas cadeias de caracteres e datas (que podem ser comparados por identidade ou por relações de ordem { RO), porém vem se tornando necessário organizar, armazenar e recuperar dados mais complexos, como por exemplo dados multimídia (imagens, áudio e vídeo), séries temporais etc. Quando se trata de dados complexos há uma mudança de paradigma, pois as comparações entre elementos são feitas por similaridade em vez das RO utilizadas tradicionalmente, tendo como mais frequentemente utilizados os operadores de comparação por abrangência (Rq) e por k-vizinhos mais próximos (k-NN). Embora muitos estudos estejam sendo feitos nessa área, quando lidando com consultas por similaridade grande parte do esforço é direcionado para criar as estruturas de indexação e dar suporte às operações necessárias para executar apenas o aspecto da consulta que trata da similaridade, sem focar em realizar uma integração homogênea das consultas que envolvam ambos os tipos de operadores simultaneamente nos ambientes dos SGDBRs. Um dos principais problemas nessa integração é lidar com as peculiaridades do operador de busca por k-NN. Todos os operadores de comparação por identidade e por RO são comutativos e associativos entre si. No entanto o operador de busca por k-NN não atende a nenhuma dessas propriedades. Com isso...

PathSim : um algoritmo para calcular a similaridade entre caminhos XML; PathSim: A XML path similarity algorithm

Vinson, Alexander Richard
Fonte: Universidade Federal do Rio Grande do Sul Publicador: Universidade Federal do Rio Grande do Sul
Tipo: Dissertação Formato: application/pdf
POR
Relevância na Pesquisa
36.52%
Algoritmos de similaridade que comparam dados expressos em XML são importantes em diversas aplicações que manipulam informações armazenadas nesse padrão. Sistemas de integração de dados XML e de consulta a instâncias XML são exemplos dessas aplicações. A utilização de funções de similaridade para efetuar as comparações nessas aplicações melhora seus resultados finais. A melhora ocorre porque as funções de similaridade possibilitam encontrar estruturas não idênticas às apresentadas nos parâmetros das consultas mas que armazenam informações relevantes. Uma característica importante que pode ser utilizada para definir se dois elementos XML representam o mesmo objeto real é os caminhos que chegam a estes elementos nas suas respectivas árvores. No entanto, os nodos que representam um determinado objeto real em duas instâncias XML diferentes podem se acessados por caminhos distintos, devido a opções de modelagem dos documentos. Portanto um algoritmo para calcular a similaridade entre caminhos XML é importante para as aplicações descritas acima. Neste contexto, esta dissertação objetiva desenvolver um algoritmo de similaridade entre caminhos XML. O resultado principal do trabalho é um algoritmo de similaridade entre caminhos XML...

Avaliação da qualidade de funções de similaridade no contexto de consultas por abrangência; Quality evaluation of similarity functions for range queries

Stasiu, Raquel Kolitski
Fonte: Universidade Federal do Rio Grande do Sul Publicador: Universidade Federal do Rio Grande do Sul
Tipo: Tese de Doutorado Formato: application/pdf
POR
Relevância na Pesquisa
36.55%
Em sistemas reais, os dados armazenados tipicamente apresentam inconsistências causadas por erros de gra a, abreviações, caracteres trocados, entre outros. Isto faz com que diferentes representações do mesmo objeto do mundo real sejam registrados como elementos distintos, causando um problema no momento de consultar os dados. Portanto, o problema investigado nesta tese refere-se às consultas por abrangência, que procuram encontrar objetos que representam o mesmo objeto real consultado . Esse tipo de consulta não pode ser processado por coincidência exata, necessitando de um mecanismo de consulta com suporte à similaridade. Para cada consulta submetida a uma determinada coleção, a função de similaridade produz um ranking dos elementos dessa coleção ordenados pelo valor de similaridade entre cada elemento e o objeto consulta. Como somente os elementos que são variações do objeto consulta são relevantes e deveriam ser retornados, é necessário o uso de um limiar para delimitar o resultado. O primeiro desa o das consultas por abrangência é a de nição do limiar. Geralmente é o especialista humano que faz a estimativa manualmente através da identi - cação de elementos relevantes e irrelevantes para cada consulta e em seguida...

Chemical and Metabolic Pathway Semantic Similarity

Grego, Tiago; Ferreira, Joao D; Pesquita, Catia; Bastos, Hugo; Vila Viçosa, Diogo; Freire, João; Couto, Francisco M
Fonte: Universidade de Lisboa Publicador: Universidade de Lisboa
Tipo: Relatório
Publicado em 05/03/2010 ENG
Relevância na Pesquisa
36.48%
Reviewed by André Falcão; Background: Similarity measures for the comparison of metabolic pathways can provide a better understanding of evolutionary relationships among species or strains and have an important biotechnological value for the pharmaceutical industry. Semantic similarity applied to enzymes has been used; here we show an approach using metabolites. While there is a number of methods to compare and align metabolic pathways based on metabolites, they are usually based only on their structural information neglecting their biological information. Results: In this work we present an alternative approach for measuring the semantic similarity between metabolic pathways by comparing their metabolites. This comparison is based on the Chemical Entities of Biological Interest ontology, and can be useful in toxicology and drug discovery for assessment of biological activity of chemical compounds. We implemented a software capable of measuring the similarity between metabolic pathways present in the Kyoto Encyclopedia of Genes and Genomes database and a preliminary analysis shows the effectiveness of the proposed approach. Conclusions: We have shown that semantic similarity can be applied to pathways whose chemical compounds are annotated in the Chemical Entities of Biological Interest ontology. This work resulted in the creation of a software...

Similarity and Dissimilarity in Immigration Contexts: Different Dimensions, Different Processes.

Lopes, Rui Costa
Fonte: Instituto Universitário de Lisboa Publicador: Instituto Universitário de Lisboa
Tipo: Tese de Doutorado
Publicado em //2008 POR
Relevância na Pesquisa
36.5%
Doutoramento em Psicologia Social; Este trabalho analisa os efeitos da semelhança/diferença intergrupal nas atitudes intergrupais no contexto das relações entre Portugueses (maioria) e grupos imigrantes. A literatura revela que a relação entre semelhança/diferença intergrupal e atitudes intergrupais está longe de ser directa. Uma perspectiva derivada da Abordagem da Interdependência de Objectivos (Sherif, Harvey, White, Hood & Sherif, 1961) hipotetiza que esta relação é moderada pela percepção de interdependência de objectivos (Brown & Abrams, 1986). Uma perspectiva diferente emerge da Abordagem da Identidade Social (Tajfel & Turner, 1979; Turner, Hogg, Oakes, Reicher & Wetherell, 1987) propondo que a identificação endogrupal toma esse papel moderador (Jetten, Spears & Postmes, 2004). Este trabalho procura conciliar estas duas perspectivas, considerando o domínio de aplicação de cada moderador e hipotetizando que esta aplicabilidade depende da dimensão (simbólica vs. instrumental) a que a percepção de semelhança/diferença se refere. Assim, propomos que quando a semelhança/diferença intergrupal se refere a uma dimensão instrumental (i.e. aspectos que influenciam a capacidade de adquirir recursos materiais)...

Efficient algorithms to execute complex similarity queries in RDBMS

Arantes,Adriano S.; Vieira,Marcos R.; Traina Jr.,Caetano; Traina,Agma J. M.
Fonte: Sociedade Brasileira de Computação Publicador: Sociedade Brasileira de Computação
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/04/2004 EN
Relevância na Pesquisa
36.5%
Search operations in large sets of complex objects usually rely on similarity-based criteria, due to the lack of other general properties that could be used to compare the objects, such as the total order relationship, or even the equality relationship between pairs of objects, commonly used with data in numeric or short texts domains. Therefore, similarity between objects is the core criterion to compare complex objects. There are two basic operators for similarity queries: Range Query and k-Nearest Neighbors Query. Much research has been done to develop effective algorithms to implement them as standalone operations. However, algorithms to support these operators as parts of more complex expressions involving their composition were not developed yet. This paper presents two new algorithms specially designed to answer conjunctive and disjunctive operations involving the basic similarity criteria, providing also support for the manipulation of tie lists when the k-Nearest Neighbor query is involved. The new proposed algorithms were compared with the combinations of the basic algorithms, both in the sequential scan and in the Slim-tree metric access methods, measuring the number of disk accesses, the number of distance calculations...

Genetic similarity among soybean (Glycine max (L) Merrill) cultivars released in Brazil using AFLP markers

Bonato,Ana Lídia V.; Calvo,Eberson S.; Geraldi,Isaias O.; Arias,Carlos Alberto A.
Fonte: Sociedade Brasileira de Genética Publicador: Sociedade Brasileira de Genética
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/01/2006 EN
Relevância na Pesquisa
36.5%
Genetic similarity among soybean genotypes was studied by applying the amplified fragment length polymorphism (AFLP) technique to 317 soybean cultivars released in Brazil from 1962 to 1998. Genetic similarity (GS) coefficients were estimated using the coefficient of Nei and Li (Nei and Li 1979), and the cultivars were clustered using the unweighted pair-group method with averages (UPGMA). The parentage coefficients of 100 cultivars released between 1984 and 1998 were calculated and correlated with the genetic similarity obtained by the markers. The genetic similarity coefficients varied from 0.17 to 0.97 (x = 0.61), with 56.8% of the coefficients being above 0.60 and only 9.7% equal to or less than 0.50. The similarity coefficients have remained constant during the last three decades. Dendrogram interpretation was hindered by the large number of cultivars used, but it was possible to detect groups of cultivars formed as expected from their genealogy. Another dendrogram, composed of 63 cultivars, allowed a better interpretation of the groups. Parentage coefficients among the 100 cultivars varied from zero to one (x = 0.21). However, no significant correlation (r = 0.12) was detected among the parentage coefficients and the AFLP genetic similarity. The results show the efficiency of AFLP markers in large scale studies of genetic similarity and are discussed in relation to soybean breeding in Brazil.

Lexical Chains and Sliding Locality Windows in Content-based Text Similarity Detection

Nahnsen, Thade; Uzuner, Ozlem; Katz, Boris
Fonte: MIT - Massachusetts Institute of Technology Publicador: MIT - Massachusetts Institute of Technology
Formato: 9 p.; 17827888 bytes; 7011726 bytes; application/postscript; application/pdf
EN_US
Relevância na Pesquisa
36.48%
We present a system to determine content similarity of documents. More specifically, our goal is to identify book chapters that are translations of the same original chapter; this task requires identification of not only the different topics in the documents but also the particular flow of these topics. We experiment with different representations employing n-grams of lexical chains and test these representations on a corpus of approximately 1000 chapters gathered from books with multiple parallel translations. Our representations include the cosine similarity of attribute vectors of n-grams of lexical chains, the cosine similarity of tf*idf-weighted keywords, and the cosine similarity of unweighted lexical chains (unigrams of lexical chains) as well as multiplicative combinations of the similarity measures produced by these approaches. Our results identify fourgrams of unordered lexical chains as a particularly useful representation for text similarity evaluation.

Self-similarity and attraction in stochastic nonlinear reaction-diffusion systems

Wang, W.; Roberts, A.
Fonte: Society for Industrial and Applied Mathematics Publicador: Society for Industrial and Applied Mathematics
Tipo: Artigo de Revista Científica
Publicado em //2013 EN
Relevância na Pesquisa
36.5%
Self-similarity solutions play an important role in many fields of science. We explore self-similarity in some stochastic partial differential equations (spdes). Important issues are not only the existence of stochastic self-similarity but also whether a self-similar solution is dynamically attractive, and if it is, to what particular solution does the system evolve. By recasting a class of spdes in a form to which stochastic center manifold theory may be applied, we resolve these issues in this class. For definiteness, a first example of self-similarity in solutions of Burgers equation driven by some stochastic force is studied. Under suitable assumptions a stationary solution is constructed which yields the existence of a stochastically self-similar solution for the stochastic Burgers equation. Further, the asymptotic convergence to the self-similar solution is proved. Second, in more general stochastic reaction-diffusion systems, stochastic center manifold theory provides a framework for constructing stochastic self-similar solutions, confirming their relevance, and determining the correct solution for any compact initial condition. Third, we argue that dynamically moving the effective spatial origin and dynamically distorting time improve the description of the stochastic self-similarity. Finally...

Some theoretical aspects of human categorization behavior: similarity and generalization; Einige Theoretische Aspekte des Menschlichen Kategorisierungsverhaltens: Ähnlichkeit und Generalisierung

Jäkel, Frank
Fonte: Universität Tübingen Publicador: Universität Tübingen
Tipo: Dissertation; info:eu-repo/semantics/doctoralThesis
EN
Relevância na Pesquisa
36.59%
Explanations of human categorization behavior often invoke similarity. Stimuli that are similar to each other are grouped together whereas stimuli that are very different are kept separate. Despite serious problems in defining similarity, both conceptually and experimentally, this is the prevailing view of categorization in prototype models (Posner & Keele, 1968; Reed, 1972) and exemplar models (Medin & Schaffer, 1978; Nosofsky, 1986). This is also the prevailing approach in machine learning (Schölkopf & Smola, 2002). In this thesis, we re-examine the notion of similarity as it is used in models for human categorization behavior from a machine learning perspective. Our current understanding of many machine learning methods has been deepened considerably by the realization that similarity can be modeled as a so-called positive definite kernel. One of the most commonly used similarity measures in psychology, Shepard's universal law of generalization (Shepard, 1987), is shown to be such a positive definite kernel. This leads to two theoretical insights about metric models of psychological similarity. First, early models of similarity introduced the notion of a psychological space with a Euclidean metric that represents the similarity of stimuli (Torgerson...

Foundations of Ingroup Bias and Similarity Bias in 2-Year-Olds

O'Neill, AMY
Fonte: Quens University Publicador: Quens University
Tipo: Tese de Doutorado
EN; EN
Relevância na Pesquisa
36.52%
The powerful influence of group membership and similarity on perceptions and behaviour is well established; however, questions remain about the developmental trajectory of these patterns and the extent to which similarity bias and ingroup bias are truly distinct. In this thesis, I examined the relative impact of group membership and similarity on matching and non-matching identification, expression of similarity, extension of preferences, transgression attribution, selective helping and resource allocation among 2.5- to 3-year-old children. These findings suggest that early in life, the responses to similarity and group membership are largely overlapping; however, children in the similarity condition were more likely to select the matching puppet in transgression attribution, non-matching identification, and resource allocation. This pattern suggests that children display a stronger approach bias in the similarity condition and that similarity bias shows developmental discontinuity between early and later childhood.; Thesis (Master, Psychology) -- Queen's University, 2012-08-12 18:08:53.964

Evaluation of Melody Similarity Measures

Kelly, MATTHEW
Fonte: Quens University Publicador: Quens University
Tipo: Tese de Doutorado
EN; EN
Relevância na Pesquisa
36.56%
Similarity in music is a concept with significant impact on ethnomusicology studies, music recommendation systems, and music information retrieval systems such as Shazam and SoundHound. Various computer-based melody similarity measures have been proposed, but comparison and evaluation of similarity measures is inherently difficult due to the subjective and application-dependent nature of similarity in music. In this thesis, we address the diversity of the problem by defining a set of music transformations that provide the criteria for comparing and evaluating melody similarity measures. This approach provides a flexible and extensible method for characterizing selected facets of melody similarity, because the set of music transformations can be tailored to the user and to the application. We demonstrate this approach using three music transformations (transposition, tempo rescaling, and selected forms of ornamentation) to compare and evaluate several existing similarity measures, including String Edit Distance measures, Geometric measures, and N-Gram based measures. We also evaluate a newly implemented distance measure, the Beat and Direction Distance Measure, which is designed to have greater awareness of the beat hierarchy and better responsiveness to ornamentation. Training and test data is drawn from music incipits from the RISM A/II collection...

Optimizing similarity queries in metric spaces meeting user\'s expectation; Otimização de operações de busca por similaridade em espaços métricos

Ferreira, Mônica Ribeiro Porto
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 22/10/2012 EN
Relevância na Pesquisa
36.52%
The complexity of data stored in large databases has increased at very fast paces. Hence, operations more elaborated than traditional queries are essential in order to extract all required information from the database. Therefore, the interest of the database community in similarity search has increased significantly. Two of the well-known types of similarity search are the Range (\'R IND. q\') and the k-Nearest Neighbor (\'kNN IND. q\') queries, which, as any of the traditional ones, can be sped up by indexing structures of the Database Management System (DBMS). Another way of speeding up queries is to perform query optimization. In this process, metrics about data are collected and employed to adjust the parameters of the search algorithms in each query execution. However, although the integration of similarity search into DBMS has begun to be deeply studied more recently, the query optimization has been developed and employed just to answer traditional queries. The execution of similarity queries, even using efficient indexing structures, tends to present higher computational cost than the execution of traditional ones. Two strategies can be applied to speed up the execution of any query, and thus they are worth to employ to answer also similarity queries. The first strategy is query rewriting based on algebraic properties and cost functions. The second technique is when external query factors are applied...

Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model

Sidorov,Grigori; Gelbukh,Alexander; Gómez-Adorno,Helena; Pinto,David
Fonte: Centro de Investigación en computación, IPN Publicador: Centro de Investigación en computación, IPN
Tipo: Artigo de Revista Científica Formato: text/html
Publicado em 01/09/2014 EN
Relevância na Pesquisa
36.59%
We show how to consider similarity between features for calculation of similarity of objects in the Vector Space Model (VSM) for machine learning algorithms and other classes of methods that involve similarity between objects. Unlike LSA, we assume that similarity between features is known (say, from a synonym dictionary) and does not need to be learned from the data. We call the proposed similarity measure soft similarity. Similarity between features is common, for example, in natural language processing: words, n-grams, or syntactic n-grams can be somewhat different (which makes them different features) but still have much in common: for example, words "play" and "game" are different but related. When there is no similarity between features then our soft similarity measure is equal to the standard similarity. For this, we generalize the well-known cosine similarity measure in VSM by introducing what we call "soft cosine measure". We propose various formulas for exact or approximate calculation of the soft cosine measure. For example, in one of them we consider for VSM a new feature space consisting of pairs of the original features weighted by their similarity. Again, for features that bear no similarity to each other, our formulas reduce to the standard cosine measure. Our experiments show that our soft cosine measure provides better performance in our case study: entrance exams question answering task at CLEF. In these experiments...