Página 1 dos resultados de 284 itens digitais encontrados em 0.064 segundos

Automatic classification of written descriptions by healthy adults: an overview of the application of natural language processing and machine learning techniques to clinical discourse analysis; Classificação automática de discurso descritivo escrito de adultos sadios: uma visão geral da aplicação de técnicas de processamento de línguas naturais e aprendizado de máquina à análise clínica do discurso

Toledo, Cíntia Matsuda; Cunha, Andre; Scarton, Carolina; Aluisio, Sandra Maria
Fonte: Associação Neurologia Cognitiva e do Comportamento; São Paulo Publicador: Associação Neurologia Cognitiva e do Comportamento; São Paulo
Tipo: Artigo de Revista Científica
ENG
Relevância na Pesquisa
116.02%
ABSTRACT: Discourse production is an important aspect in the evaluation of brain-injured individuals. We believe that studies comparing the performance of brain-injured subjects with that of healthy controls must use groups with compatible education. A pioneering application of machine learning methods using Brazilian Portuguese for clinical purposes is described, highlighting education as an important variable in the Brazilian scenario. OBJECTIVE: The aims were to describe how to: (i) develop machine learning classifiers using features generated by natural language processing tools to distinguish descriptions produced by healthy individuals into classes based on their years of education; and (ii) automatically identify the features that best distinguish the groups. METHODS: The approach proposed here extracts linguistic features automatically from the written descriptions with the aid of two Natural Language Processing tools: Coh-Metrix-Port and AIC. It also includes nine task-specific features (three new ones, two extracted manually, besides description time; type of scene described - simple or complex; presentation order - which type of picture was described first; and age). In this study, the descriptions by 144 of the subjects studied in Toledo18 were used...

Indução de filtros lingüisticamente motivados na recuperação de informação; Linguistically motivated filter induction in information retrieval

Arcoverde, João Marcelo Azevedo
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 17/04/2007 PT
Relevância na Pesquisa
105.89%
Apesar dos processos de recuperação e filtragem de informação sempre terem usado técnicas básicas de Processamento de Linguagem Natural (PLN) no suporte à estruturação de documentos, ainda são poucas as indicações sobre os avanços relacionados à utilização de técnicas mais sofisticadas de PLN que justifiquem o custo de sua utilização nestes processos, em comparação com as abordagens tradicionais. Este trabalho investiga algumas evidências que fundamentam a hipótese de que a aplicação de métodos que utilizam conhecimento linguístico é viável, demarcando importantes contribuições para o aumento de sua eficiência em adição aos métodos estatásticos tradicionais. É proposto um modelo de representação de texto fundamentado em sintagmas nominais, cuja representatividade de seus descritores é calculada utilizando-se o conceito de evidência, apoiado em métodos estatísticos. Filtros induzidos a partir desse modelo são utilizados para classificar os documentos recuperados analisando-se a relevância implícita no perfil do usuário. O aumento da precisão (e, portanto, da eficácia) em sistemas de Recuperação de Informação, conseqüência da pós-filtragem seletiva de informações, demonstra uma clara evidência de como o uso de técnicas de PLN pode auxiliar a categorização de textos...

Instrumento de investigação clínico-epidemiológica em Cardiologia fundamentado no processamento de linguagem natural; A tool for clinical and epidemiological investigation in cardiology based on natural language processing

Castilla, André Coutinho
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 13/09/2007 PT
Relevância na Pesquisa
136.05%
O registro eletrônico do paciente (REP) está sendo gradativamente implantado no meio médico hospitalar. Grande parte das informações essenciais do REP está armazenada na forma de texto narrativo livre, dificultando operações de procura, análise e comparação de dados. O processamento de linguagem natural (PLN) refere-se a um conjunto de técnicas computacionais, cujo objetivo é a análise de texto através de conhecimentos léxicos, gramaticais e semânticos. O presente projeto propõe a criação de uma ferramenta computacional de investigação clínicoepidemiológica aplicada a textos narrativos médicos. Como metodologia propomos a utilização do processador de linguagem natural especializado em medicina MEDLEE desenvolvido para textos em Inglês. Para que seu uso seja possível textos médicos em Português são traduzidos ao Inglês automaticamente. A tradução automatizada (TA) é realizada utilizando o aplicativo baseado em regras SYSTRAN especialmente configurado para processar textos médicos através da incorporação de terminologias especializadas. O resultado desta seqüência de TA e PLN são informações conceituais que serão investigadas à procura de achados clínicos pré-definidos, atrvés de inferência lógica sobre uma ontologia. O objetivo experimental desta tese foi conduzir um estudo de recuperação de informações em um conjunto de 12.869 relatórios de radiografias torácicas à procura de vinte e dois achados clínicos e radiológicas. A sensibilidade e especificidade médias obtidas em comparação com referência formada pela opinião de três médicos radiologistas foram de 0...

Extração de conhecimento de laudos de radiologia torácica utilizando técnicas de processamento estatístico de linguagem natural.; Knowledge extraction from reports of radiology thoracic using techniques of statistical processing of natural language.

Zerbinatti, Leandro
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 15/04/2010 PT
Relevância na Pesquisa
115.99%
Este trabalho promove um estudo em informática em saúde no qual se analisam laudos de radiologia torácica através de métodos de processamento estatístico de linguagem natural com o intuito de subsidiar a interoperabilidade entre sistemas de saúde. Foram utilizados 2000 laudos de radiologia do tórax para a extração de conhecimento identificando-se as palavras, n-gramas e frases que os compõem. Foi calculado o índice de Zipf e verificou-se que poucas palavras compõem a maioria dos laudos e que a maioria das palavras não tem representatividade estatística A partir dos termos identificados foi realizada a tradução e a comparação da existência desses em um vocabulário médico padronizado com terminologia internacional, o SNOMEDCT. Os termos que tinham uma relação completa e direta com os termos traduzidos foram incorporados nos termos de referência juntamente com a classe à qual o termo pertence e seu identificador. Foram selecionados outros 200 laudos de radiologia de tórax para realizar o experimento de rotulação dos termos em relação à referência. A eficiência obtida neste estágio, que é o percentual de rotulação dos laudos, foi de 45,55%. A partir de então foram incorporados aos termos de referência...

Extração de informações de narrativas clínicas; Clinical reports information retrieval

Oleynik, Michel
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 02/10/2013 PT
Relevância na Pesquisa
105.95%
Narrativas clínicas são normalmente escritas em linguagem natural devido a seu poder descritivo e facilidade de comunicação entre os especialistas. Processar esses dados para fins de descoberta de conhecimento e coleta de estatísticas exige técnicas de extração de informações, com alguns resultados já apresentados na literatura para o domínio jornalístico, mas ainda raras no domínio médico. O presente trabalho visa desenvolver um classificador de laudos de anatomia patológica que seja capaz de inferir a topografia e a morfologia de um câncer na Classificação Internacional de Doenças para Oncologia (CID-O). Dados fornecidos pelo A.C. Camargo Cancer Center em São Paulo foram utilizados para treinamento e validação. Técnicas de processamento de linguagem natural (PLN) aliadas a classificadores bayesianos foram exploradas na busca de qualidade da recuperação da informação, avaliada por meio da medida-F2. Valores acima de 74% para o grupo topográfico e de 61% para o grupo morfológico são relatados, com pequena contribuição das técnicas de PLN e suavização. Os resultados corroboram trabalhos similares e demonstram a necessidade de retreinamento das ferramentas de PLN no domínio médico.; Clinical reports are usually written in natural language due to its descriptive power and ease of communication among specialists. Processing data for knowledge discovery and statistical analysis requires information retrieval techniques...

Avaliando a percepção dos agentes da teoria do seletorado através de processamento de linguagem natural

Alqueres, Julio Frederico Hruza
Fonte: Fundação Getúlio Vargas Publicador: Fundação Getúlio Vargas
Tipo: Dissertação
PT_BR
Relevância na Pesquisa
126.07%
Nos últimos anos, a relevância da Teoria dos Grafos na descrição da rela ção entre indiví duos cresceu signifi cativamente, contribuindo para a ascensão do fenômeno das redes sociais. Sua importância tem permitido a explora ção polí tico-econômica de informa ções escondidas em sua estrutura. Assumindo que um parlamentar maximiza sua utilidade ao fortalecer o seu partido e o estado que representa, construímos uma rede política baseada no Congresso Brasileiro, o que permite a identificação de elementos da Teoria do Seletorado. Através de técnicas de Processamento de Linguagem Natural aplicadas à diferentes fontes de notícia, é possível atualizar a rede de forma a identificar alterações na estrutura de poder do sistema político brasileiro.

Um sistema hibrido para o processamento de linguagem natural e para a recuperação da informação

Rita Maria da Silva Julia
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 28/11/1995 PT
Relevância na Pesquisa
115.93%
Nós apresentamos um sistema que analisa sintática e semanticamente um conjunto de asserções, que introduz as asserções analisadas em uma base de conhecimentos e que recupera informações a partir desta base. As asserções correspondem a exigências que compõem um conjunto de especificações de programas. Elas correspondem a um tipo particular de frases em linguagem natural que se referem ao contexto das ciências espaciais. As asserções são estocadas na base de conhecimentos como fórmulas do Cálculo dos Predicados cujas variáveis são anotadas por conceitos da Lógica Terminológica. As perguntas propostas ao sistema também precisam ser analisadas sintática e semanticamente de tal maneira a apresentarem a mesma forma correspondente às asserções estocadas na base. o analisador sintático e semântico implementado é capaz de gerar automaticamente algumas regras semânticas. Para a recuperação da informação, nós usamos um provador de teoremas híbrido do Cálculo dos Predicados que responde perguntas efetuando uma avaliação parcial delas a partir da base de conhecimentos. O provador de teoremas utiliza a semântica da Lógica Terminológica para guiar seu mecanismo de inferência. Os recursos da subsunção da Lógica Terminológica são utilizados para simplificara base de conhecimentos e o traço de prova; We present a system to analyse a set of assertions...

Redes neurais e logica formal em processamento de linguagem natural

João Luis Garcia Rosa
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 22/09/1993 PT
Relevância na Pesquisa
125.97%
Esta dissertação de mestrado é sobre Processamento de Linguagem Natural (PLN). O PLN consiste de uma série de tarefas que a máquina deve executar para analisar um texto. Na literatura existem vários trabalhos em diversas abordagens. Este trabalho faz uma combinação de abordagens baseadas em lógica e de abordagens conexionistas. O trabalho proposto tem três partes. A primeira parte faz a análise sintática de frases da língua portuguesa. É baseada em lógica. A segunda parte faz a análise semântica, ou a verificação do significado das palavras numa frase. Isto é feito através de redes neurais artificiais, que "aprendem" a representação binária das palavras (suas microcaracterísticas semânticas). Esta abordagem é chamada de conexionismo. Sua grande vantagem é a habilidade de generalização, ou seja, a rede é capaz de reconhecer uma palavra, mesmo que esta não tenha sido mostrada a ela. A terceira, e última, parte deste trabalho trata da utilização de redes recorrentes para análise de frases. Este tipo de rede serve para "ligar" as palavras em uma frase, pois a rede recorrente tem memória. Ela é capaz de "lembrar" da última palavra vista numa seqüência. É útil para ligar as palavras em uma sentença...

Combinatorial algorithms and linear programming for inference in natural language processing = : Algoritmos combinatórios e de programação linear para inferência em processamento de linguagem natural; Algoritmos combinatórios e de programação linear para inferência em processamento de linguagem natural

Alexandre Tachard Passos
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 28/08/2013 PT
Relevância na Pesquisa
116.05%
Em processamento de linguagem natural, e em aprendizado de máquina em geral, é comum o uso de modelos gráficos probabilísticos (probabilistic graphical models). Embora estes modelos sejam muito convenientes, possibilitando a expressão de relações complexas entre várias variáveis que se deseja prever dado uma sentença ou um documento, algoritmos comuns de aprendizado e de previsão utilizando estes modelos são frequentemente ineficientes. Por isso têm-se explorado recentemente o uso de relaxações usando programação linear deste problema de inferência. Esta tese apresenta duas contribuições para a teoria e prática de relaxações de programação linear para inferência em modelos probabilísticos gráficos. Primeiro, apresentamos um novo algoritmo, baseado na técnica de geração de colunas (dual à técnica dos planos de corte) que acelera a execução do algoritmo de Viterbi, a técnica mais utilizada para inferência em modelos lineares. O algoritmo apresentado também se aplica em modelos que são árvores e em hipergrafos. Em segundo mostramos uma nova relaxação linear para o problema de inferência conjunta, quando se quer acoplar vários modelos, em cada qual inferência é eficiente, mas em cuja junção inferência é NP-completa. Esta tese propõe uma extensão à técnica de decomposição dual (dual decomposition) que permite além de juntar vários modelos a adição de fatores que tocam mais de um submodelo eficientemente.; In natural language processing...

Uma aplicação do processamento de linguagem natural na modelagem conceitual de sistemas de informação

Diniz, Paulo Ricardo Torres
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: 1 v.| il.
POR
Relevância na Pesquisa
135.95%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.; O início do ensino da disciplina de Banco de Dados mostra-se muitas vezes frustrante, tanto para o aluno quanto para o professor, em virtude da falta de técnicas que auxiliem o discente a formatar textos de levantamento de dados, que se mostram, na maioria das vezes, dúbios e redundantes. Este trabalho visa rever as metodologias e técnicas existentes hoje para este objetivo, culminando em propor a criação de um software de auxilio que possibilite ao aluno desenvolver seu texto de levantamento de dados seguindo especificamente a técnica de Lista-Diagrama e ainda indique possíveis falhas, utilizando para isso a teoria do processamento de linguagem natural.

Proposta de sistema de diálogo textual independente de aplicação

Souza, Gilberto Corrêa de
Fonte: Florianópolis, SC Publicador: Florianópolis, SC
Tipo: Dissertação de Mestrado Formato: ix, 146 f.| il.
POR
Relevância na Pesquisa
115.87%
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-graduação em Ciência da Computação; Este trabalho propoe uma abordagem para o desenvolvimento de um sistema de dialogo. Trata-se de um sistema computacional, uma interface para humanos interagirem de forma mais natural com aplicaçoes que fornecem serviços diversos, tais como: previsao de tempo, consulta de reservas, dentre outras. Para se entender a base de funcionamento desse tipo de sistema, sao apresentados os conceitos do processamento de linguagem natural, sistema de dialogo generico e alguns exemplos de sistemas de dialogo desenvolvidos, explicitando suas caracteristicas e aplicaçoes. Com base nos conceitos e experiencias comprovadas de sistemas anteriores, apresenta-se a especificaçao de um modelo de dialogo que possui dois componentes-chaves, a saber: um componente capaz de gerenciar o dialogo por meio de principios racionais e cooperativos e outro, cujo uso da noçao computacional de ontologia toma lugar na comunicaçao entre usuarios e aplicaçoes fornecedoras de serviços. Ao final deste trabalho a proposta de um sistema de dialogo e apresentada, entretanto sua implementaçao e apenas sugerida por um exemplo...

Aprendizagem de língua assistida por computador : uma abordagem baseada em HPSG

Costa, Flávio Maico Vaz da; Ralha, José Carlos Loureiro; Ralha, Célia Ghedini
Fonte: Comissão Especial de Informática na Educação da Sociedade Brasileira de Computação Publicador: Comissão Especial de Informática na Educação da Sociedade Brasileira de Computação
Tipo: Artigo de Revista Científica
POR
Relevância na Pesquisa
105.93%
Este trabalho analisa fundamentos e métodos pertinentes para o planejamento e desenvolvimento de sistemas de Processamento de Linguagem Natural (PLN) com o objetivo de auxiliar a aprendizagem de línguas. O foco principal é a correção sintática baseada no formalismo HPSG conforme implementado no sistema LKB (Linguistic Knowledge Building). Foi implementado um analisador em linguagem Java que, juntamente com uma gramática da língua espanhola de médio porte, permite experimentar a técnica de correção através de regras de malformação. A partir dos resultados obtidos discute-se alguns aspectos práticos e a viabilidade do PLN aplicado à educação. _________________________________________________________________________________ ABSTRACT; This work analyses principles and methods relevant to the planning and development of Natural Language Processing (NLP) systems, whose goal is to assist in language learning. Syntax checking based on the HPSG formalism as implemented in the LKB (Linguistic Knowledge Building) system is the main focus. Java language was used to implement a parser that, together with a Spanish grammar of moderate coverage, allows us to experiment with mal-rule based checking. From the results obtained practical issues and the viability of NLP applied to education are discussed.

Processamento de linguagem natural para indexação automática semântico-ontológica

Câmara Júnior, Auto Tavares da
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Tese
POR
Relevância na Pesquisa
116.08%
Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013.; A pesquisa propõe uma arquitetura de indexação automática de documentos utilizando mecanismos de processamento de linguagem natural em nível semântico. Por meio do arranjo de ferramentas e recursos existentes, agregado ao desenvolvimento de software para integração, é construído um sistema de indexação automática que utiliza conhecimento modelado em uma ontologia para análise semântica. A aplicação da arquitetura é exemplificada e posta à prova em um conjunto de laudos periciais de crimes cibernéticos produzidos pela Perícia Criminal da Polícia Federal. Os resultados de pesquisa apontam para a melhoria que o aprofundamento à análise semântica do processamento de linguagem natural oferece para a seleção automática de descritores e, por extensão, para a recuperação da informação. Dentre as contribuições inéditas desta tese incluem-se a arquitetura de sistema de informação para indexação automática proposta, a ontologia construída para a análise semântica e as implementações em linguagem de programação Python. Por fim, o trabalho insere-se em uma área de pesquisa que tem sido cada vez mais investigada...

Model of access to natural language sources in electronic government; Modelo de acesso a fontes em linguagem natural no governo electrónico

Rodrigues, Mário Jorge Ferreira
Fonte: Universidade de Aveiro Publicador: Universidade de Aveiro
Tipo: Tese de Doutorado
ENG
Relevância na Pesquisa
106.05%
For the actual existence of e-government it is necessary and crucial to provide public information and documentation, making its access simple to citizens. A portion, not necessarily small, of these documents is in an unstructured form and in natural language, and consequently outside of which the current search systems are generally able to cope and effectively handle. Thus, in thesis, it is possible to improve access to these contents using systems that process natural language and create structured information, particularly if supported in semantics. In order to put this thesis to test, this work was developed in three major phases: (1) design of a conceptual model integrating the creation of structured information and making it available to various actors, in line with the vision of e-government 2.0; (2) definition and development of a prototype instantiating the key modules of this conceptual model, including ontology based information extraction supported by examples of relevant information, knowledge management and access based on natural language; (3) assessment of the usability and acceptability of querying information as made possible by the prototype - and in consequence of the conceptual model - by users in a realistic scenario...

Developing reliability metrics and validation tools for datasets with deep linguistic information

Castro, Sérgio Ricardo de, 1981-
Fonte: Universidade de Lisboa Publicador: Universidade de Lisboa
Tipo: Dissertação de Mestrado
Publicado em //2011 ENG
Relevância na Pesquisa
106.05%
Tese de mestrado em Engenharia Informática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2011; Grande parte das ferramentas de processamento de linguagem natural utilizadas hoje em dia, desde os anotadores morfossintácticos (POS taggers) até aos analisadores sintáticos (parsers), necessita de corpora anotados com a informação linguística necessária para efeitos de treino e avaliação. A qualidade dos resultados obtidos por estas ferramentas está directamente ligada à qualidade dos corpora utilizados no seu treino ou avaliação. Como tal, é do mais alto interesse construir corpora anotados para treino ou avaliação com o maior nível de qualidade. Tal como as técnicas e as ferramentas da área do processamento de linguagem natural se vão tornando mais sofisticadas e tecnicamente mais complexas, também a quantidade e profundidade da informação contida nos corpora anotados tem vindo a crescer. O estado da arte actual consiste em corpora anotados com informação gramatical profunda, isto é anotação que contém não só a função ou tipo de cada elemento mas também os tipos das relações entre os diferentes elementos, sejam estas directas ou de longa distância. Esta quantidade crescente de informação contida na anotação dos corpora torna a tarefa da sua anotação crescentemente mais complexa...

Gramática e Processamento da Linguagem Natural: Fundamentos

Branco, António Horta; Costa, Francisco
Fonte: Department of Informatics, University of Lisbon Publicador: Department of Informatics, University of Lisbon
Tipo: Relatório
Publicado em /09/2008 POR
Relevância na Pesquisa
115.99%
O presente documento tem o objectivo didáctico de apresentar uma breve introdução à área do processamento de linguagem natural que pode ser utilizada por estudantes ou investigadores interessados. Esta introdução é elaborada do ponto de vista do processamento linguístico profundo com base na gramática das línguas naturais. Adopta como enquadramento metodológico a Head-Driven Phrase Structure Grammar (HPSG). O presente documento serve também de introdução metodológica ao documento TR-2008-17, que descreve a concretização de um fragmento da gramática para a língua portuguesa de acordo com os princípios aqui apresentados. Embora possam ser usados autonomamente, estes dois documentos devem ser vistos como constituindo duas partes de um mesmo texto. O presente documento foi escrito em português por forma a tornar os seus temas disponíveis pela primeira vez para um público de falantes desta língua --- outros textos em língua inglesa já existem com objectivos aproximados. O documento TR-2008-17, por sua vez, foi escrito em inglês por forma a que os resultados aí apresentados possam ser utilizados por toda a comunidade científica

Extração de informação usando integração de componentes de PLN através do framework GATE

de Souza Cabral, Luciano; Luiz Goncalves de Freitas, Frederico (Orientador)
Fonte: Universidade Federal de Pernambuco Publicador: Universidade Federal de Pernambuco
Tipo: Outros
PT_BR
Relevância na Pesquisa
115.84%
A Extração de Informação (EI) é o ramo da área de recuperação de informação que utiliza técnicas e algoritmos para identificar e coletar informações desejadas a partir de documentos, sejam estes estruturados ou não, armazenando-as em um formato apropriado para consultas futuras. Dentre estas tecnologias, o uso de Processamento de Linguagem Natural (PLN) revela-se benéfico ao processo de extração, principalmente quando se processam documentos sem nenhuma estrutura e/ou padrão definido. Existe uma suíte que reúne dezenas de plugins que podem ajudar na tarefa de EI baseada em PLN, conhecida como GATE (General Architecture for Text Engineering). Neste trabalho propõe-se o módulo RELPIE, contendo alguns destes plugins para a extração a partir de texto livre. O módulo RELPIE é original, e emprega plugins GATE baseados em padrões de expressões regulares (ER) e regras de produção. Estas regras ficam totalmente separadas do sistema, visando modularidade na extração de informação a partir de documentos estruturados ou não. Os resultados obtidos nos experimentos demonstram que o módulo RELPIE apresenta bons níveis de extração com corpus compreendido por documentos textuais sem qualquer estrutura...

Um sistema multi-agentes para processamento distribuido de linguagem natural

Daniel da Silva de Paiva
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 20/12/1996 PT
Relevância na Pesquisa
125.97%
Nesta dissertação será apresentado um Sistema Multi-Agentes para Processamento Distribuído de Linguagem Natural que utiliza a idéia de que a interpretação de sentenças deve vir do inter-relacionamento entre os diferentes agentes lingüísticas que compõem o sistema. Os agentes são associados às palavras de uma sentença, sendo um agente por palavra. Cada agente terá seu comportamento ditado pela classe morfossintática a que a palavra associada a ele pertence (assume-se que cada palavra pode pertencer a apenas uma classe). De acordo com seu comportamento, cada agente tenta encontrar outros agentes com o objetivo de formar estruturas mais complexas e de atingir uma representação que englobe todos os agentes da sentença. Todo esse processo de busca por outro agente é realizado utilizando troca de mensagens entre os agentes. Quando um agente encontra um outro que ele considera ideal para formar uma estrutura mais complexa, então esses agentes estabelecem ligações. A representação atinge o nível de sentença quando todos os agentes estão conectados; This thesis will present a Multi-Agent System for Distributed Natural Language Processing that uses the idea that the sentence intepretation will come from the interaction among the linguistic agents that comprise the system. Agents are associated with the words of the sentence...

Lexicalização de ontologias : o relacionamento entre conteúdo e significado no contexto da recuperação da informação

Schiessl, Marcelo
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Tese
POR
Relevância na Pesquisa
105.89%
Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2015.; Investiga as tecnologias da Web Semântica e as técnicas de Processamento de Linguagem Natural para a elaboração semiautomática de uma base léxico-ontológica, em Português, circunscrita ao domínio de risco financeiro que, incorporada ao modelo de recuperação da informação, visa melhorar a precisão. Identifica teorias, ferramentas e técnicas que propiciam a automatização de procedimentos que extraem elementos ontológicos e léxicos de bases estruturadas e não estruturadas. Esses elementos combinados na forma de base de dados apoiam a geração de índice léxico-semântico que fornece insumos para a proposição de modelo de recuperação da informação semântica. A metodologia adotada se apresenta em: levantamento de fundamentos teóricos e metodológicos, ferramentas e bases de dados ontológicas e textuais; construção de ontologia e base léxico-ontológica com foco no risco financeiro; elaboração de modelo de recuperação da informação semântica; avaliação do modelo realizada num corpus de informação relacionada ao risco financeiro que foi indexado nos moldes tradicionais e contemplando a informação semântica para...

Fundamentos em processamento de linguagem natural: uma proposta para extração de bigramas

Silva, Edson Marchetti da; Centro Federal de Educação Tecnológica de Minas Gerais; Souza, Renato Rocha; FGV/RJ
Fonte: Departamento de Ciência da Informação – UFSC Publicador: Departamento de Ciência da Informação – UFSC
Tipo: info:eu-repo/semantics/article; info:eu-repo/semantics/publishedVersion; ; pesquisa empírica Formato: application/pdf
Publicado em 02/08/2014 POR
Relevância na Pesquisa
125.95%
http://dx.doi.org/10.5007/1518-2924.2014v19n40p1Ë senso comum que o texto escrito é uma importante forma de registrar as informações e que atualmente grande parte desse conteúdo informacional está disponível em meio digital. Entretanto, de maneira geral, os computadores lidam com o texto como sendo uma cadeia de caracteres que não têm nenhum significado. A área de Processamento de Linguagem Natural (PLN) vem se empenhando em extrair significados do texto. Nesse sentido este trabalho apresenta uma revisão desse tema e propõe um método automatizado que utiliza uma heurística determinística denominada Heudet que visa extrair bigramas do texto. A meta é extrair o significado do texto através de um conjunto de expressões multipalavras identificadas. Os resultados obtidos foram melhores se  comparados com aqueles que utilizam-se das técnicas de medidas de associação estatística obtidas pelo software Ngram Statistics Package (NSP).