Página 1 dos resultados de 355 itens digitais encontrados em 0.003 segundos

À guisa de uma tipologia para os tabus lingüísticos - proposta para um glossário; a typology of the linguistics taboos existent in the Brazilian Linguistic Atlases - a glossary proposition

Almeida, Laura de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 28/04/2008 PT
Relevância na Pesquisa
36.39%
O objetivo central desta pesquisa é apresentar uma tipologia dos tabus lingüísticos presentes em atlas lingüísticos brasileiros. O corpus do trabalho constitui-se das respostas apresentadas por sujeitos em seis atlas lingüísticos brasileiros, a saber, Atlas Prévio dos Falares Baianos (APFB), Atlas Lingüístico de Sergipe I (ALS I), Atlas Lingüístico de Sergipe II (ALS II), Esboço para um Atlas Lingüístico de Minas Gerais (EALMG), Atlas Lingüístico da Paraíba (ALPB) e o Atlas Lingüístico do Paraná (ALPR). Tomamos por base o Questionário Semântico-lexical (QSL) que consta dos "Questionários 2001- Projeto Atlas Lingüístico do Brasil (ALiB)", do qual destacamos apenas a questão referente ao campo semântico proposto. Foram selecionados seis campos semânticos para a realização da presente análise, sendo eles: fenômenos atmosféricos, corpo humano, religião e crenças, doenças, ciclos da vida e convívio e comportamento social. Com base em Guérios (1979) fizemos um estudo preliminar das manifestações do tabu lingüístico em língua portuguesa e apresentaremos os meios de substituição dos vocábulos tabus que se manifestaram nas variantes lingüísticas encontradas em atlas lingüísticos. Ao final deste estudo...

Um estudo da mudança de classe gramatical em unidades lexicais neológicas; A study of word class change in neological lexical units.

Maroneze, Bruno Oliveira
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 22/03/2011 PT
Relevância na Pesquisa
36.63%
A mudança de classe gramatical consiste na criação de uma unidade lexical em uma classe gramatical diferente da classe da base. Para efetuar essa criação, os falantes dispõem de diversos mecanismos, como a derivação sufixal (com diversos sufixos), a derivação parassintética, a derivação regressiva e a conversão. Nosso objetivo, no presente trabalho, é o de descrever tais mecanismos, procurando compreender por que motivo(s) os falantes criam novas unidades lexicais em classes gramaticais diferentes. Buscando a fundamentação teórica da Linguística Cognitiva, procuramos dividir nossa análise em duas perspectivas: a perspectiva onomasiológica, em que analisamos os mecanismos de criação lexical, e a perspectiva semasiológica, em que analisamos os mecanismos de interpretação de uma nova unidade lexical. Seguindo as ideias da Linguística Cognitiva, entendemos que as classes gramaticais devem ser consideradas categorias semânticas, e a mudança de classe, um processo de natureza basicamente semântica. Considerando apenas as classes gramaticais de natureza lexical, os seis tipos de mudança de classe possíveis em português são: adjetivo para substantivo, verbo para substantivo, substantivo para adjetivo, verbo para adjetivo...

Glossário bilíngue de colocações de hotelaria: um modelo à luz da Linguística de Corpus; Bilingual glossary of collocations of the hotel industry: a model in the light of Corpus Linguistics

Navarro, Sandra Lago Martinez
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 15/03/2012 PT
Relevância na Pesquisa
36.34%
O objetivo desta pesquisa é elaborar uma proposta de glossário bilíngue (inglês - português) de colocações da hotelaria, voltado às necessidades do tradutor. Esta pesquisa justifica-se por abordar uma área técnica com grande volume de traduções e escassez de estudos terminológicos e por dar destaque a um elemento constitutivo e de alta incidência nas comunicações especializadas as colocações. Na base do fenômeno das colocações está o princípio de que a linguagem é padronizada e integra um sistema probabilístico, ou seja, tende a funcionar por meio de unidades pré-fabricadas convencionalizadas pelo uso. Conhecer esses padrões é de suma importância ao tradutor que pretende produzir um texto natural na língua de chegada. Esta pesquisa encontra-se no escopo dos estudos em Linguística de Corpus, Terminologia Textual, Tradução e Fraseologia, áreas que compartilham o interesse em observar a linguagem real em seu contexto de ocorrência. Para este trabalho, construímos um corpus comparável de textos extraídos de sites de estabelecimentos hoteleiros no Brasil e nos Estados Unidos. Foram compilados 321 textos e 546.106 palavras em inglês, 710 textos e 514.449 palavras em português, conteúdo subdividido por categorias de estabelecimentos. Para a exploração do corpus...

Segmentações não-convencionais de palavra nos quatro últimos anos do ensino fundamental: um estudo longitudinal

Paranhos, Fabiana Cristina
Fonte: Universidade Estadual Paulista (UNESP) Publicador: Universidade Estadual Paulista (UNESP)
Tipo: Dissertação de Mestrado Formato: 169 f. : il. color., gráfs., tabs.
POR
Relevância na Pesquisa
36.37%
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP); Pós-graduação em Estudos Linguísticos - IBILCE; In this work, we seek to understand, by analyzing the spelling of words, in which way the unconventional written words segmentation can be resulted of representation of relationship between characteristics of spoken and written statements. In the search for answers, we analyzed the unconventional segmentation of words that occurred in texts produced by of a group of students which ones at the time of the production attended the last years of Elementary School, of a public school of São Paulo. The hypotheses that guided our work were the one that segmentation done by the students of Elementary School may be representative (1) hypotheses about the scribes charts word boundaries in relation prosodic constituents; and (2) of the insertion of the writer in oral and literate practices, our objectives were: (1) to identify possible prosodic criteria are involved in the decisions of the writers of Elementary School about how segmentation a word, and (2) to observe how and in that measured the unconventional segmentation established, in the analyzed text, relationship for the writers among their oral and literate practices. Thus...

A linguística entre os nomes da linguagem : uma reflexão na historia das ideias linguísticas no Brasil; The linguistics between the names of the language : a reflexion on the history of linguistics ideas in Brazil

Ana Claudia Fernandes Ferreira
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 27/02/2009 PT
Relevância na Pesquisa
46.69%
Esta tese, inscrita na área da História das Idéias Lingüísticas no Brasil - HIL, elabora um estudo sobre os percursos de sentido do nome lingüística, ao lado de outros nomes da linguagem, no processo de constituição da Lingüística na Unicamp. Este estudo se faz através de uma reflexão sobre as condições históricas gerais e específicas do processo de institucionalização/significação destes nomes de saber nesse espaço universitário. No batimento entre teoria e análise, esta reflexão se faz pela construção de um arquivo de leitura (PÊCHEUX) de obras a que me filio na área HIL, através da mobilização de conceitos e dispositivos teóricos e analíticos da análise de discurso e de dispositivos analíticos da semântica da enunciação. Ao lado disso, a construção deste arquivo de leitura envolve, como material de análise, projetos e programas de curso, catálogos, ofícios sobre a constituição da lingüística na Unicamp, além de publicações diversificadas e materiais disponíveis na internet sobre a história da lingüística no Brasil e no exterior. Deste modo, no interior deste lugar de reflexão e análise, este trabalho objetiva apresentar algumas compreensões (ORLANDI) sobre as divisões, tensões e contradições produzidas em torno da palavra lingüística...

Syntax and word formation

Pranka, Paula Maria
Fonte: Massachusetts Institute of Technology Publicador: Massachusetts Institute of Technology
Tipo: Tese de Doutorado Formato: 207 leaves
ENG
Relevância na Pesquisa
46.28%
by Paula Maria Pranka.; Thesis (Ph.D.)--Massachusetts Institute of Technology, Dept. of Linguistics and Philosophy, 1983.; MICROFICHE COPY AVAILABLE IN ARCHIVES AND HUMANITIES; Bibliography: leaves 205-207.

Parameters and effects of word order variation

Travis, Lisa deMena
Fonte: Massachusetts Institute of Technology Publicador: Massachusetts Institute of Technology
Tipo: Tese de Doutorado Formato: 284 leaves
ENG
Relevância na Pesquisa
46.28%
by Lisa deMena Travis.; Thesis (Ph.D.)--Massachusetts Institute of Technology, Dept. of Linguistics and Philosophy, 1984.; MICROFICHE COPY AVAILABLE IN ARCHIVES AND HUMANITIES.; Bibliography: leaves 278-284.

Topics in the stress and syntax of words

Marvin, Tatjana, 1972-
Fonte: Massachusetts Institute of Technology Publicador: Massachusetts Institute of Technology
Tipo: Tese de Doutorado Formato: 174 p.
ENG
Relevância na Pesquisa
36.63%
This dissertation is a study of word structure showing that words exhibit the syntactic phenomenon of phase-by-phase Spell-Out, Chomsky (2001), Marantz (2001). The analysis of data from English and Slovenian indicates that the syntactic structure in word formation, specifically, the existence of phases at the word level, is necessary to make generalizations about the meaning and stress properties of words in these two languages. This result gives support to a theory of morphology that treats word formation as occurring in the Syntax component, following the same rules for syntactic phrase formation, such as Distributed Morphology, Halle and Marantz (1993), Marantz (1997). In Chapter 1 the basic ideas of Distributed Morphology are laid out. In Chapter 2 the central proposal of this dissertation is presented: category-forming phrases such as little v, n and a constitute Spell-Out domains, i.e. phases, at the word level. The idea is argued for with the example of English syllabification and schwa-insertion, showing that syllabification properties of derived words and the predictability of their meaning do not follow exclusively from diacritic markings on derivational affixes, but are reflexes of both idiosyncratic properties of affixes and of the syntax in which they are found. Chapter 3 deals with the interaction of stress assignment and the syntax of words in English...

The syntax and processing of relative clauses in Mandarin Chinese

Hsiao, Franny Pai-Fang, 1975-
Fonte: Massachusetts Institute of Technology Publicador: Massachusetts Institute of Technology
Tipo: Tese de Doutorado Formato: 168 leaves
ENGCHI; ENG
Relevância na Pesquisa
36.53%
This thesis investigates relative clauses (henceforth RCs) in Mandarin Chinese as spoken in Taiwan from both syntactic and processing perspectives. I also explore the interaction between these two areas, for example, how evidence from one area lends support to or undermines theories in the other area. There are several goals I hope to achieve: First of all, there is a significant gap in the sentence processing literature on Mandarin Chinese and in particular on RCs in Mandarin Chinese. I aim to bridge this gap by conducting experiments that will provide basic understanding of how Chinese RCs are processed. In doing so, I also provide a more complete picture of processing RCs across languages. In this thesis, I report three online reading experiments on Chinese RCs. I show that even though Chinese is also an SVO language like English and French, the results with regard to processing subject-extracted versus object-extracted RCs in Mandarin Chinese are very different from results for the same construction in other SVO languages. Thus, even though subject-extracted RCs are less complex in other SVO languages, they are more complex in Mandarin Chinese. These findings help tease apart various processing theories, in particular, I show that even though resource-based theories...

On word alignment models for statistical machine translation

Zhao, Shaojun ; Gildea, Daniel J.
Fonte: University of Rochester Publicador: University of Rochester
Tipo: Tese de Doutorado Formato: Number of Pages:xiii, 120 leaves
ENG
Relevância na Pesquisa
36.37%
Thesis (Ph. D.)--University of Rochester. Dept. of Computer Science, 2011.; Machine translation remains the holy grail of computational linguistics. All statistical machine translation systems are built upon the idea of word alignment. While the field of word alignment has had tremendous progress in the last two decades, it is still in great need of speed and quality improvement. We designed a fertility hidden Markov model for word alignment, which is dramatically faster than the most widely used IBM Model 4. In fact, our model is even faster and has lower alignment error rate (AER) than the hidden Markov model. An experiment on Chinese-English translation shows that our word alignment model leads to better translation results than IBM Model 4, based on the BLEU metric. We also designed algorithms that mine massive and high quality bilingual texts for a variety of language pairs from the web using word alignment. The resulting data improved a state-ofthe- art machine translation system.

La morphologie du pluriel nominal du persan d’après la théorie Whole Word Morphology

Faghiri, Pegah
Fonte: Université de Montréal Publicador: Université de Montréal
Tipo: Thèse ou Mémoire numérique / Electronic Thesis or Dissertation
FR
Relevância na Pesquisa
36.38%
Ce mémoire présente une étude de la morphologie de ce qui est généralement appelé le pluriel nominal du persan (parler de Téhéran) dans le cadre d’une théorie de la morphologie basée sur le mot : Whole Word Morphology, développée par Ford et Singh (1991). Ce modèle lexicaliste adopte une position plus forte que les modèles proposés par Aronoff (1976) et Anderson (1992) en n’admettant aucune opération morphologique sur des unités plus petites que le mot. Selon cette théorie, une description morphologique consiste en l’énumération des Stratégies de Formation de Mots (SFM), licencées chacunes par au moins deux paires de mots ayant la même covariation formelle et sémantique. Tous les SFM suit le même schéma. Nous avons répertorié 49 SFM regroupant les pluriels et les collectifs. Nous constatons qu’il est difficile de saisir le pluriel nominal du persan en tant que catégorie syntaxique et que les différentes « marques du pluriel » présentées dans la littérature ne constituent pas un ensemble homogène : elles partagent toutes un sens de pluralité qui cependant varie d’une interprétation référentielle à une interprétation collective non-référentielle. Cette étude vise la déscription de la compétence morphologique...

Palaung word list: based on materials collected from Pan Shwe Kya, Namhsan, Sept-Oct, 1957

Shorto, H. L.
Fonte: Asia-Pacific Linguistics; http://pacling.anu.edu.au/ Publicador: Asia-Pacific Linguistics; http://pacling.anu.edu.au/
Tipo: Book; Published Version Formato: 180 pages
Relevância na Pesquisa
36.48%
This is a facsimile edition of the Palaung word list prepared by the late Prof. Harry Shorto in 1957 and not published in its entirety until now. Prof. Shorto spent time in Burma in the late 1950s, where he compiled materials for his A Dictionary of Modern Spoken Mon (1962) and A Dictionary of the Mon Inscriptions (1971). At the time he also collected data on various minority languages, especially Palaungic language of the Shan State. The present word list was found among boxes kept by his daughter Anna, which she kindly donated to the present series editor (Sidwell) for the purposes of publication and archiving. The entries in this word list are written in a phonemic transcription, they are glossed in English, and are richly augmented with etymological commentary that includes citations from Shan, Burmese and many Austroasiatic languages. The images were created by scanning the original pages at 200 DPI in greyscale; Australian National University, College of Asia and the Pacific; E-book published as A-PL 004 in the series Asia-Pacific Linguistics Open Access Monographs, and as SEAMLES 003 in the associated series SEAsian Mainland Languages E-Series

Word Sense Disambiguation with GermaNet; Disambiguierung von Wortbedeutungen mit GermaNet

Henrich, Verena
Fonte: Universität Tübingen Publicador: Universität Tübingen
Tipo: Dissertação
EN
Relevância na Pesquisa
36.52%
The subject of this dissertation is boosting research on word sense disambiguation (WSD) for German. WSD is a very active area of research in computational linguistics, but most of the work is focused on English. One of the factors that has hampered WSD research for other languages such as German is the lack of appropriate resources, particularly in the form of sense-annotated corpus data. Hence, this work inevitably has to start with the preparation of resources before actual WSD experiments can be performed. The work program is fourfold. Firstly, since sense definitions are necessary to distinguish word senses (both for humans and for automatic WSD algorithms), the German wordnet GermaNet is (semi-)automatically extended with sense descriptions. This is done by automatically mapping GermaNet senses to descriptions in the online dictionary Wiktionary. Secondly, since the availability of sense-annotated corpora is a prerequisite for evaluating and developing word sense disambiguation systems, two GermaNet sense-annotated corpora are constructed. One corpus is automatically constructed and the other corpus is manually sense-annotated. Thirdly, several knowledge-based WSD algorithms are applied and evaluated -- using the newly created sense-annotated corpora. These algorithms are based on a suite of semantic relatedness measures...

A Probabilistic Approach in Historical Linguistics. Word Order Change in Infinitival Clauses: from Latin to Old French

Scrivner, Olga
Fonte: [Bloomington, Ind.] : Indiana University Publicador: [Bloomington, Ind.] : Indiana University
Tipo: Doctoral Dissertation
EN
Relevância na Pesquisa
36.69%
Thesis (Ph.D.) - Indiana University, French, 2015; This thesis investigates word order change in infinitival clauses from Object-Verb (OV) to Verb-Object (VO) in the history of Latin and Old French. By applying a variationist approach, I examine a synchronic word order variation in each stage of language change, from which I infer the character, periodization and constraints of diachronic variation. I also show that in discourse-configurational languages, such as Latin and Early Old French, it is possible to identify pragmatically neutral contexts by using information structure annotation. I further argue that by mapping pragmatic categories into a syntactic structure, we can detect how word order change unfolds. For this investigation, the data are extracted from annotated corpora spanning several centuries of Latin and Old French and from additional resources created by using computational linguistic methods. The data are then further codified for various pragmatic, semantic, syntactic and sociolinguistic factors. This study also evaluates previous factors proposed to account for word order alternation and change. I show how information structure and syntactic constraints change over time and propose a method that allows researchers to differentiate a stable word order alternation from alternation indicating a change. Finally...

Prototypes and hyperspeech: Where are they in the grammar?

Välimaa-Blum, Riitta
Fonte: Rice University Publicador: Rice University
Tipo: Journal article; Text
ENG
Relevância na Pesquisa
36.63%
If languages are fundamentally symbolic systems, as it is assumed in cognitive linguistics, then it follows that what speakers learn in the course of language acquisition are symbolic systems. It is not unequivocally established that linguistically untrained speakers even have spontaneously emerging awareness of meaningless entities like the phonemes (Liberman et al. 1980, Lotto and Holt 2000, Port and Leary 2005, Read et al. 1986, Välimaa-Blum in press). In this paper, I will argue (i) that knowledge of individual phonemes and their prototypes is metalinguistic, (ii) that the hyperspeech variants of words constitute their prototypes, and (iii) that these should be explicitly represented in the grammar. Lakoff (1993) reintroduces three levels into cognitive phonology - morpheme, word and utterance levels, which I interpret in an exemplar-theoretical framework as representing three kinds of knowledge that speakers must have of the phonology and morpholexicon of their language. The morpheme level contains an exemplar-based lexicon with all the non-automatic allomorphy and word formation principles, the word level articulates the hyperspeech forms of isolated words, and the utterance level spells out the stochastically varying hypospeech shapes of the same in continuous speech. Phonologies only having an abstract 'underlying' level and a phonetic surface have no place for the hyperspeech forms...

Representation, information theory and basic word order.

Maurits, Luke
Fonte: Universidade de Adelaide Publicador: Universidade de Adelaide
Tipo: Tese de Doutorado
Publicado em //2012
Relevância na Pesquisa
36.41%
Many of the world's languages display a preferred ordering of subject, object and verb, known as that language's basic word order. There are six logically possible basic word orders, and while each occurs in at least one known language, not all are found equally frequently. Some are extremely rare, while others are used by almost half the world's languages. This highly non-uniform cross-linguistic distribution of basic orders is a fundamental explanatory target for linguistics. This thesis tackles this problem from a psychological perspective. It constitutes an advance over previously proposed explanations in that it is compatible not only with the distributions observed today, but with what is known of broad trends in the word order change which happen over hundreds of years. There are two largely independent components of the explanation given in this thesis, which is necessary to be compatible with both synchronic and diachronic evidence. The first component is focused on the structures which the human mind uses to represent the meanings of sentences. While mental representations of meaning are not inherently serial (hence ordered) like spoken language, we can think of the different components in these representations as being ordered in a different sense...

A luta pelo direito de dizer a lingua : a linguistica e o purismo linguistico na passagem do seculo XX para o seculo XXI; The fight for the right of saying the language: linguistics and linguistic purism in the transition from the XX century to the XXI century

Marina Celia Mendonça
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 23/02/2006 PT
Relevância na Pesquisa
36.59%
O tema desta pesquisa é a luta pela direito de dizer a língua, entendendo-se por dizer a língua um uso da palavra com poder de dizer, uma publicização do dizer. O interesse central é analisar os embates entre a lingüística e o senso comum que ocorreram no final do século XX e início do século XXI no Brasil, os quais tematizaram principalmente o ensino de norma culta e a restrição ao uso de estrangeirismos no país. Beneficiei-me dos estudos bakhtinianos utilizando o dialogismo como suporte para as análises feitas; neste campo teórico, a alteridade é constitutiva da subjetividade e é na dialogia que se dá a relação essencial entre o eu e o outro. Utilizei também a abordagem filosófica proposta por Michel Foucault, principalmente quando da reflexão sobre os micro-poderes que agem na mídia brasileira, em que dispositivos como produção de relevâncias em capas de revistas e citação de autoridades sobre língua ajudam a produzir o purismo lingüístico na passagem do século XX para o XXI. Encontrei, na mídia de referência, dois tipos de purismo, que chamei de purismo neoliberal e purismo nacionalista. Procedi a uma abordagem histórica do purismo nacionalista em gramáticas publicadas ao longo do século XX e em discursos de escritores românticos em meados do século XIX. Nas análises...

O estatuto da palavra na estruturação do sujeito; The status of the word in the structuring of the subject

Rita de Cássia Segantini Bonança
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 24/02/2012 PT
Relevância na Pesquisa
46.62%
Uma pergunta advém ao analista no exercício mesmo de sua práxis ao se deparar, em sua escuta, com uma palavra que escapa da fala do paciente. Uma palavra que tem o poder de velar e desvelar o sujeito que ali está confrontado com uma questão e diante da impossibilidade de fazer algo com isso. A construção de um saber sobre o estatuto da palavra na estruturação do sujeito que compreende sua concepção, nascimento e constituição subjetiva, está atrelada à sua condição de ser falante. A potência e a eficácia da palavra na transmissão da tradição cultural através das gerações possibilitam um dizer sobre o sujeito, sua história e a verdade de sua origem. As leis que regem seus pensamentos e afetos estão submetidas às palavras que o falaram desde sempre no desejo inconsciente de seus pais. Esse saber constituído possibilita ao analista um manejo da escuta que ele opera na transferência em análise. Os estudos linguísticos e psicanalíticos possibilitaram um recorte na investigação sobre a palavra. Porém, não fora da sua condição de funcionamento, ou seja, a partir de uma língua - a materna e, pela fala que só se estabelece dentro do campo da linguagem. Essa constatação esclarece que o poder da palavra não está naquilo que ela comunica pelo seu enunciado...

Implicit learning of semantic preferences

Paciorek, Albertyna
Fonte: University of Cambridge; Department of Theoretical and Applied Linguistics; St John's College Publicador: University of Cambridge; Department of Theoretical and Applied Linguistics; St John's College
Tipo: Thesis; doctoral; PhD
EN
Relevância na Pesquisa
36.53%
The research presented in this PhD dissertation examines the phenomenon of semantic implicit learning, using semantic preferences of novel verbs as a test case. Implicit learning refers to the phenomenon of learning without intending to learn or awareness that one is learning at all. Semantic preference (or selectional preference ? as preferred in computational linguistics) is the tendency of a word to co-occur with words sharing similar semantic features. For example, ?drink? is typically followed by nouns denoting LIQUID, and the verb ?chase? is typically followed by ANIMATE nouns. The material presented here spans across disciplines. It examines a well-documented psychological phenomenon - implicit learning ? and applies it in the context of language acquisition, thereby providing insights into both fields. The organisation of this dissertation groups its experiments by their methodology. Chapter 1 provides an overview of the current psychological and linguistic literature. Chapter 2 includes a pen-and-paper study carried out in a classroom environment on Polish learners of English, where awareness is assessed by subjective measures taken at each test question as well as a post-experiment questionnaire. Chapter 3 includes a collection of 5 computer-based experiments based on a false-memory paradigm. After exposure to sentential contexts containing novel verbs...

Using word and phrase abbreviation patterns to extract age from Twitter microtexts

Moseley, Nathaniel
Fonte: Rochester Instituto de Tecnologia Publicador: Rochester Instituto de Tecnologia
Tipo: Tese de Doutorado
EN_US
Relevância na Pesquisa
36.64%
The wealth of texts available publicly online for analysis is ever increasing. Much work in computational linguistics focuses on syntactic, contextual, morphological and phonetic analysis on written documents, vocal recordings, or texts on the internet. Twitter messages present a unique challenge for computational linguistic analysis due to their constrained size. The constraint of 140 characters often prompts users to abbreviate words and phrases. Additionally, as an informal writing medium, messages are not expected to adhere to grammatically or orthographically standard English. As such, Twitter messages are noisy and do not necessarily conform to standard writing conventions of linguistic corpora, often requiring special pre-processing before advanced analysis can be done. In the area of computational linguistics, there is an interest in determining latent attributes of an author. Attributes such as author gender can be determined with some amount of success from many sources, using various methods, such as analysis of shallow linguistic patterns or topic. Author age is more difficult to determine, but previous research has been somewhat successful at classifying age as a binary (e.g. over or under 30), ternary, or even as a continuous variable using various techniques. Twitter messages present a difficult problem for latent user attribute analysis...