Página 1 dos resultados de 586 itens digitais encontrados em 0.063 segundos

Descubrimiento de conocimiento en repositorios documentales mediante técnicas de Minería de Texto y Swarm Intelligence

Cobo Ortega, Ángel; Rocha Blanco, Eliana Rocío; Alonso Martínez, Margarita
Fonte: Asociación de Profesores Universitarios de Matemáticas aplicadas a la Economía y la Empresa (ASEPUMA) Publicador: Asociación de Profesores Universitarios de Matemáticas aplicadas a la Economía y la Empresa (ASEPUMA)
Tipo: info:eu-repo/semantics/article; publishedVersion
SPA
Relevância na Pesquisa
85.59%
El uso combinado de metodologías de minería de texto y técnicas de Inteligencia Artificial favorece los procesos de gestión documental y optimiza los mecanismos de categorización, extracción automática de conocimiento y agrupamiento de colecciones documentales. En el trabajo se propone un modelo de gestión documental integral para el proceso de información no estructurada. Se utilizan glosarios y tesauros especializados para establecer relaciones semánticas entre los términos, y técnicas de Swarm Intelligence para la extracción del conocimiento. El modelo ha sido implementado en una aplicación de uso intuitivo, multilingüe e integradora de técnicas de minería de texto; The combined use of text mining methodologies and Artificial Intelligence techniques articulate document management processes to optimize categorization mechanisms, automatic knowledge extraction and grouping document collections. The article proposed an integral document management model to process unstructured information. In this context, semantic relations in document collections are implemented by specialized thesaurus and glossaries, and knowledge feature extraction are facilitated by Swarm Intelligence techniques. The model has been implemented in an intuitive...

Conversión de Texto a Voz Mediante Reglas y Redes Neuronales: Traducción de Texto a fonemas más acentuación y puntuación

Smith Torres, Roberto Ignacio
Fonte: Universidad de Chile; Programa Cybertesis Publicador: Universidad de Chile; Programa Cybertesis
Tipo: Tesis
ES
Relevância na Pesquisa
85.65%
Para facilitar el acceso de las personas no-videntes al contenido de un texto se han desarrollado diversos sistemas, tanto mecánicos como electrónicos. De todos ellos, los lectores computarizados de textos han demostrado presentar mayores ventajas en cuanto a su facilidad de uso, cobertura, costo y calidad. Además, permiten el acceso directo a textos de publicación periódica, como diarios o páginas web. Los de mejor calidad de síntesis descomponen el problema de generación de voz en etapas sucesivas para resolver problemas como: acentuación, conversión de texto a fonemas, puntuación,incorporación de entonación, y síntesis de voz. En particular, para las etapas de acentuación y conversión de texto a fonemas, se han utilizado varias metodologías como: redes neuronales, reglas por defecto, pronunciación por analogía y análisis morfológico. En esta memoria se desarrollaron dos métodos alternativos para la conversión de texto a fonemas: redes neuronales y reglas por defecto. Existe un sistema llamado NETtalk en el que se desarrolló un método de conversión de texto a fonemas para el idioma inglés, que utiliza redes neuronales de tipo perceptrón demúltiples capas. En este trabajo de título se realizó una adaptación de NETtalk para conversión de texto a fonemas más acentuación en el español hablado en Chile. Se usaron tres arquitecturas de red: traducción a fonemas...

Comparación entre índice invertido y Wavelet Tree como máquinas de búsqueda

González Cornejo, Senén Andrés
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.62%
Las máquinas de búsqueda para la Web utilizan el índice invertido como estructura de datos que permite acelerar las búsquedas en grandes colecciones de texto. Para lograr tiempos de respuesta por consulta menores al medio segundo, tanto el índice como la colección de texto se particionan en dos grupos de máquinas distintos. Cada consulta se envía al primer grupo, las cuales responden con los documentos más relevantes para esa consulta. Desde estos resultados se seleccionan los documentos más relevantes en forma global. Dichos documentos se envían al segundo grupo de máquinas las cuales extraen de la colección de texto el resumen (o snippet) asociado a cada documento en el resultado y construyen la página Web final a ser presentada al usuario como respuesta a su consulta. En este trabajo de memoria se propone un método alternativo de procesamiento de consultas, el cual ocupa un solo grupo de máquinas para realizar ambas operaciones, es decir, en un solo grupo de máquinas se realiza la determinación de los mejores documentos y la construcción de la página Web de respuesta. Para esto se recurre al uso de estrategias de texto comprimido auto-indexado y memoria cache diseñada para mantener las listas invertidas de los términos más frecuentes en las consultas. El texto comprimido auto-indexado se utiliza para generar de manera on-line las listas invertidas y para generar el resumen asociado a cada documento en la respuesta a una consulta. Los resultados experimentales muestran que en el mismo espacio ocupado por el índice invertido estándar es posible ubicar la memoria cache de listas invertidas y el texto comprimido...

Indexación Comprimida de Imágenes

Valenzuela Serra, Daniel Alejandro
Fonte: Universidad de Chile; Programa Cybertesis Publicador: Universidad de Chile; Programa Cybertesis
Tipo: Tesis
ES
Relevância na Pesquisa
75.59%
No autorizada por el autor para ser publicada a texto completo; El continuo aumento de los volúmenes de información almacenada digitalmente ha fomentado el desarrollo de técnicas para brindar acceso y búsqueda de manera eficiente a los datos. En particular, el manejo de grandes colecciones de imágenes es un problema de gran interés. Un enfoque es tratar las imágenes como secuencias de texto bidimensional. En este contexto, han sido planteadas recientemente dos estructuras de autoindexación para colecciones de imágenes, basadas en extender autoíndices de texto unidimensional. Estas estructuras almacenan la colección en espacio proporcional al requerido para almacenar la colección comprimida, permitiendo a la vez el acceso directo a cualquier parte de la colección y la búsqueda eficiente de patrones en ella. Dos tipos de autoíndices para secuencias de texto son el Arreglo de Sufijos Comprimido y el Índice FM, y en ellos se basan las soluciones para imágenes. Este trabajo se centra en la implementación de esos dos autoíndices para imágenes. Se implementaron distintas variantes para ambas estructuras buscando la mejor manera de adaptarlas a secuencias bidimensionales, y mejorando significativamente varios de los algoritmos originales. Finalmente se diseñaron y ejecutaron experimentos para comparar las distintas variantes de ambos índices...

Desarrollo de servicios de Next Generation Tv para operador con Core Ims/Epc montado sobre Lte

Rivas Saenz, Sebastián Andrés
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
75.55%
La llegada de redes de cuarta generación cambia el paradigma de creación y consumo de contenidos. Este cambio se sustenta principalmente en las mejoras en la velocidad de conexión que ofrecen estas redes y en el uso de arquitecturas de red de próxima generación (NGN). Ambos factores hacen posible el despliegue de servicios convergentes que se caracterizan por permitir la interacción de servicios tradicionales bajo una misma plataforma. El objetivo del presente trabajo de memoria es la utilización de la arquitectura de red IMS y la red de acceso LTE para el desarrollo de servicios de televisión de próxima generación de carácter convergente y que ofrezcan interfaces gráficas interactivas y amigables, logrando así sacar mayor provecho de las características que ofrecen estas tecnologías de red. Este trabajo es parte de un proyecto de desarrollo continuo del Departamento de Ingeniería Eléctrica de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile que busca la creación de ambientes docentes para el estudio de redes 4G que aún no existen comercialmente en el país. Tras una presentación del contexto y antecedentes respecto a las características principales de los conceptos involucrados, se presenta el diseño de dos servicios de televisión. En primer lugar...

Plan de internacionalización del servicio online de análisis de texto Docode desde Chile hacia España

Vásquez Álvarez, Carlos Andrés
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
85.57%
No autorizada por el autor para ser publicada a texto completo en portal de tesis hasta el 11/03/2018.; Magíster en Gestión para la Globalización; El objetivo general de este proyecto es generar un plan de internacionalización que permita al servicio chileno de análisis de texto DOCODE, que identifica si un documento digital es original comparándolo con fuentes en la Web y en bases documentales propietarias [1], ser comercializado en España, donde satisfaga las necesidades del segmento atingente y se consideren los recursos que posee la organización. En Chile, existe un importante número de empresas tecnológicas emergentes que no cuentan con los recursos necesarios para poder investigar de manera sistemática las posibilidades que les brindaría a su negocio abrirse a mercados extranjeros. DOCODE se encontraría dentro de este grupo de empresas. Con el presente trabajo de investigación, se plantea probar que el servicio prestado por DOCODE es factible de internacionalizar a mercados de habla hispana, especialmente España. Considerando que el mercado español posee un grado de madurez más avanzado que el nuestro local respecto a los servicios a distancia, permitiendo una aproximación al servicio menos cauta, y más receptiva. Para lograr este propósito...

Plan de Globalización del Servicio de Análisis de Texto DOCODE hacia Hispanoamérica

Pissani Alvear, Jorge Eduardo
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.53%
Tesis no disponible a texto completo; El objetivo principal de la presente tesis es diseñar un plan de globalización para DOCODE, servicio basado en tecnologías de información desarrollado en la Universidad de Chile con la finalidad de prevenir el plagio académico, hacia un mercado escogido en Hispanoamérica. Dicho plan incluye la selección de este mercado objetivo, la identificación de atributos relevantes para los potenciales clientes y una recomendación del modo de entrada y modelo de suscripción para este mercado. Habiendo identificado el cluster de servicios generales como estratégico para el desarrollo de Chile, Fondef apoya iniciativas como la de DOCODE. Dados los altos costos de desarrollo de software y la facilidad que provee Internet para distribuir el servicio, cabe estudiar la posibilidad de internacionalizarlo. Luego de aplicar un análisis de atractividad para seleccionar un país dentro de Hispanoamérica, se realiza una encuesta dentro de dicho mercado, de la que se recoge información esencial para desarrollar un plan de negocios. Todo este esfuerzo tiene por finalidad entregar evidencias que respalden la hipótesis de investigación de esta tesis, que sostiene que es posible internacionalizar el servicio prestado por DOCODE hacia un país de Hispanoamérica por medio del diseño y ejecución de un plan estructurado de globalización. Puesto que el país seleccionado fue México...

Implementación de una Plataforma sobre IP Utilizando Freeswitch como Testbed para Tecnología por Voz

Jesam Gaete, Álvaro Manuel
Fonte: Universidad de Chile; Programa Cybertesis Publicador: Universidad de Chile; Programa Cybertesis
Tipo: Tesis
ES
Relevância na Pesquisa
75.55%
En el laboratorio de procesamiento y transmisión de voz de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile se desarrollan motores de procesamiento de voz, con los cuales se puede otorgar una amplia gama de servicios relacionados al habla. Para poder brindar estos servicios surge la necesidad de poseer una plataforma de telefonía en la cual se puedan desarrollar aplicaciones que hagan uso de motores de voz y que permita la conectividad con usuarios mediante redes de telefonía pública (PSTN) y redes IP. Además se necesita que las aplicaciones cumplan protocolos estándares para que de esta forma sean compatibles internacionalmente. Como solución se propone la utilización de FreeSWITCH, que corresponde a una plataforma de telefonía de código abierto y en permanente desarrollo. Mediante FreeSWITCH se desarrolla una central telefónica sobre IP brindando conectividad a cada miembro del laboratorio. A su vez, la arquitectura del sistema implementado permite la conexión bidireccional a la PSTN. FreeSWITCH posee un módulo especial para brindar compatibilización con motores de voz, mediante una implementación parcial del protocolo MRCP (Media Resource Control Protocol), que se traduce en que por el momento brinda soporte a motores de reconocimiento automático de voz y motores de texto a voz. Gracias a esto...

Análisis institucional de la escuela de postgrado de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile

Sepúlveda Geraldino, Ingrid Alejandra
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
75.65%
No autorizada por el autor para ser publicada a texto completo en portal de tesis electrónicas hasta el 03/06/2018; Magíster en Gestión y Políticas Públicas; El presente estudio de caso tuvo por objetivo identificar las áreas de mejora de la Escuela de Postgrado de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, y proponer recomendaciones que permitan, a esta unidad, enfrentar las necesidades y desafíos ante un nuevo escenario, caracterizado por una mayor oferta de Programas, exigencias de calidad interna y externa y mayor demandas estudiantiles por beneficios arancelarios y de atención. Este estudio se desarrolló desde un enfoque cualitativo-interpretativo de investigación, que consideró como sus principales fuentes de análisis documentos e informes institucionales relativos al tema y entrevistas semi estructuradas realizadas a los Coordinadores de Programas de Postgrado impartidos por esta Facultad. Las entrevistas fueron analizadas por medio de técnicas de análisis de contenidos, lo que permitió destacar las dimensiones más significativas del análisis. La información recopilada desde las fuentes secundarias, permitió la construcción de una serie de indicadores que permiten comprender la realidad de los Programas de Postgrado en Chile...

Diseño y construcción de una plataforma de clasificación de texto basada en textmining aplicada sobre una red de blogs para Betazeta Networks S.A

López Aravena, Camilo Alberto
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
95.59%
Ingeniero Civil Industrial; Ingeniero Civil en Computación; Betazeta Networks S.A. es una empresa dedicada a la publicación de información mediante una red de blogs de diversas temáticas. A corto plazo, la empresa necesita visualizar cómo se distribuye el contenido actual para tomar decisiones estratégicas respecto al mercado que enmarca los contenidos que publican. En el mediano plazo, la empresa emitirá contenido generado por los usuarios, el cual debe ser revisado para mantener la calidad de cada Blog. Para esto se requiere contar con métodos automáticos de clasificación para dichos mensajes, los cuales serán revisados por periodistas expertos en diferentes áreas. El trabajo realizado en esta memoria constituye un prototipo que apunta a resolver la problemática de la empresa. Para ello se construye una plataforma de procesamiento de texto, denominada Tanalyzer, que permite manejar grandes volúmenes de información, visualizar, clasificar y hacer predicciones sobre las temáticas de nuevos documentos utilizando text-mining, sub área de la minería de datos especializada en texto, implementando el modelo de tópicos generativo Latent Dirichlet Allocation. Las pruebas realizadas al software son satisfactorias. Sobre un modelo que maneja 8 temáticas...

Diseño y construcción de una plataforma de clasificación de texto basada en textmining aplicada sobre una red de blogs para Betazeta Networks S.A

López Aravena, Camilo Alberto
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
95.59%
Betazeta Networks S.A. es una empresa dedicada a la publicación de información mediante una red de blogs de diversas temáticas. A corto plazo, la empresa necesita visualizar cómo se distribuye el contenido actual para tomar decisiones estratégicas respecto al mercado que enmarca los contenidos que publican. En el mediano plazo, la empresa emitirá contenido generado por los usuarios, el cual debe ser revisado para mantener la calidad de cada Blog. Para esto se requiere contar con métodos automáticos de clasificación para dichos mensajes, los cuales serán revisados por periodistas expertos en diferentes áreas. El trabajo realizado en esta memoria constituye un prototipo que apunta a resolver la problemática de la empresa. Para ello se construye una plataforma de procesamiento de texto, denominada Tanalyzer, que permite manejar grandes volúmenes de información, visualizar, clasificar y hacer predicciones sobre las temáticas de nuevos documentos utilizando text-mining, sub área de la minería de datos especializada en texto, implementando el modelo de tópicos generativo Latent Dirichlet Allocation. Las pruebas realizadas al software son satisfactorias. Sobre un modelo que maneja 8 temáticas, cada una asociada a uno de los 8 blogs de la empresa que se encuentran bajo estudio...

Diseño e Implementación de Sistema de Validación de Información de Organizaciones Bancarias

Vives Cofré, José Miguel
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.53%
Autorizado por el autor, pero con restricción para ser publicada a texto completo hasta el año 2013; El objetivo general del presente trabajo de título es proponer, diseñar e implementar un sistema de validación de información. Este sistema será utilizado por las distintas instituciones bancarias y financieras que remiten periódicamente diversa información a la Superintendencia de Bancos e Instituciones Financieras (SBIF). La SBIF, en su rol contralor, exige a las distintas instituciones que fiscaliza el envío de los movimientos y transacciones realizadas durante distintos períodos de tiempo. Debido a las características de esta información, el envío se hace a través de archivos de texto, según formatos establecidos por la misma superintendencia. Estos archivos son generados a partir de diversas fuentes de información a través de una gran cantidad de procesos automáticos nocturnos. Dichos procesos no siempre se llevan a cabo correctamente, lo que termina reflejándose en datos incoherentes o erróneos. Para mitigar este problema, junto a otros orígenes de errores, es necesario validar la información a entregar antes de ser enviada, para lo que se desarrolló una plataforma donde se puede revisar la calidad de la información de los archivos que considera no solamente la estructura de sus datos...

Diseño e Implementación de un Metabuscador de Párrafos para la Recuperación de Documentos Similares en la Web

Bravo Márquez, Felipe José
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.54%
La recuperación de documentos similares a un documento dado en la Web, es un problema no resuelto por los motores de búsqueda tradicionales. Esto se debe, a que los motores de búsqueda están pensados para resolver necesidades de información de usuarios basadas en conjuntos pequeños de términos clave. En este trabajo, se define el problema de recuperación de documentos similares como el proceso en que un usuario ingresa un párrafo a un sistema de información y éste le retorna los documentos con mayor similitud a éste en la Web. Los documentos recuperados son rankeados por medio de una métrica de similitud estimada por el sistema. La resolución del problema, podría ser utilizado en contextos como la detección de plagio, el análisis de impacto de documentos en la Web y la recuperación de ideas similares. Se propone una metodología basada en modelos de lenguaje generativos y metabuscadores. Los modelos de lenguaje son utilizados como generadores de consultas aleatorizadas sobre el texto del documento entregado, donde se propone un modelo que extrae términos relevantes sin reposición llamado Modelo de Lenguaje Hipergeométrico. El conjunto de consultas generado intenta ser una representación de la información relevante del documento. Posteriormente...

Búsqueda en Texto Mediante un Índice Comprimido de Q-Gramas

Arroyo García, Hernán Enrique
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.64%
No autorizado por el autor para ser publicada a texto completo; La cantidad de datos disponibles crece de forma dramática cada día. Esto trae consigo la necesidad de poder manejar éstos datos de forma adecuada, de manera de poder acceder a estos de forma eficiente y al mismo tiempo ahorrar espacio de almacenamiento. En particular, para manejar grandes cantidades de texto una herramienta clave son los índices de texto, y en el contexto de este trabajo los índices comprimidos, los cuales no sólo responden consultas de forma rápida sino que también almacenan sus datos y el texto en forma eficiente. El objetivo general del presente trabajo fue desarrollar un índice comprimido basado en listas de ocurrencias de los q-gramas del texto y comprimir este último. Se desea comparar la eficacia de este índice con los auto-índices ya desarrollados en el sitio Pizza&Chili (http://pizzachili.dcc.uchile.cl). Un índice invertido de q-gramas permite encontrar patrones en un texto. Para tal efecto las consultas se dividen en dos etapas. En la primera etapa se seleccionan las regiones del texto (llamadas bloques) donde ocurren todos los q-gramas del patrón y por lo tanto éste podría encontrarse. En la segunda etapa se verifica si efectivamente el patrón se encuentra en los bloques que fueron seleccionados. Además es necesario almacenar el texto de forma independiente. En la implementación realizada se mantiene el texto dividido en bloques comprimidos...

Generación Automática de Documentos de Requisitos en Proyectos de Software

Godoy Sánchez, Danny Alexander
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.53%
La especificación y el análisis de requisitos son actividades fundamentales en el desarrollo de proyectos de software, ya que en base a ellos se decidirá qué caminos tomar durante todo el proceso de implementación. Asímismo, la documentación es una parte importante de todas las etapas de la ingeniería de software; ésta debe ser completa, actualizada y de fácil acceso para todas las personas involucradas en el proyecto. Para la administración de requisitos se ha creado la herramienta ReqAdmin, un sistema web que permite el acceso de la información tanto a desarrolladores como a clientes. Esta herramienta actualmente es usada en el curso Ingeniería de Software que imparte el Departamento de Ciencias de la Computación de la Universidad de Chile. ReqAdmin permite administrar los requisitos de un proyecto, pero carece de medios para administrar documentación. Para remediar esta situación se realizó una actualización a dicha herramienta, permitiendo ingresar y administrar la documentación dentro de ReqAdmin. Para ello se usó un editor de texto enriquecido que permite insertar texto con formato e imágenes. Además, con el sistema se puede generar cierta documentación, en particular documento de requisito, diseño e histórico...

Modelos para cuantificar el riesgo de no pago en la cartera de clientes masivos de una distribuidora eléctrica

Fuente Ortíz, Pablo Andrés de la
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.55%
No autorizada por el autor para ser publicada a texto completo; El presente trabajo tiene como objetivo determinar el riesgo de no pago de las cuentas de energía de una distribuidora eléctrica, considerando el riesgo adicional asociado a las reprogramaciones de deudas morosas de energía (convenios de energía). El principal desafío que se asume esta investigación, es la carencia de información que permita identificar a los clientes, ya que no se posee información de perfil, por esta razón el análisis se centra en la información de comportamiento de pagos. El desafío fue superado con éxito, ya que los modelos planteados obtienen indicadores de predicción de un 80% de exactitud, lo que según las mejores prácticas de la industria financiera es considerado bueno (se considera aceptable una exactitud del 60%). Aplicando herramientas matemáticas se analiza el comportamiento de pago de forma individual y global para poder inferir la probabilidad de que un cliente caiga en incumplimiento de sus obligaciones a futuro (enfoque individual) o poder determinar que fracción de saldos adeudados evolucionarán a deudas incobrables (enfoque global). Este análisis se traduce en modelos que permiten predecir las pérdidas esperadas para un plazo futuro...

Combinado Indexación y Compresión en Texto Semi-Estructurado

Sologuren Gutiérrez, Felipe Leopoldo
Fonte: Universidad de Chile; Programa Cybertesis Publicador: Universidad de Chile; Programa Cybertesis
Tipo: Tesis
ES
Relevância na Pesquisa
75.53%
El almacenamiento digital de la información debe abordar tanto el problema de la incorporación de datos al sistema como su recuperación, y debe hacer un catálogo acorde con las consultas que sobre ellos quiera hacerse. El espacio ocupado para el almacenamiento y el tiempo necesario para ingresar la información, y para recuperala, depende directamente de la estructura utilizada en el repositorio. De este modo, cuando nos referimos a información que ya cuenta cion un grado de estructuración, la indexación debe ser coherente con la estructuta formal de la misma, para favorecer así la consulta. En el presente estudio se aborda el problema de la compresión estática de información semi-estructurada combinada con una indezación tendiente a soportar uin conjunto de consultas sobre los datos, con un fuerte énfasis en el almacenamiento en memoria secundaria. El ámbito de desarrollo de la aplicación propuesta se enmarca dentro de la documentación XML y su lenguaje de consulta XQuery. El modelo utilizado en la implementación está basado en la propuestas desarrolladas por Baeza-Yates y Navarro en Proximal Nodes. La implementación corresponde a un desarrollo posterior de un procesador destinado a soportar consultas en el lenguaje XPath desarrollado por Manuel Ortega como memoria de Ingeniería. El desarrollo de la capa de almacenamiento del prototipo actual se enfoca en la resolución de problemas en tres áreas: recuperación del archivo fuente...

Estructuras de datos sucintas para recuperación de documentos

Valenzuela Serra, Daniel Alejandro
Fonte: Universidad de Chile Publicador: Universidad de Chile
Tipo: Tesis
ES
Relevância na Pesquisa
75.59%
Magíster en Ciencias, Mención Computación; La recuperación de documentos consiste en, dada una colección de documentos y un patrón de consulta, obtener los documentos más relevantes para la consulta. Cuando los documentos están disponibles con anterioridad a las consultas, es posible construir un índice que permita, al momento de realizar las consultas, obtener documentos relevantes en tiempo razonable. Contar con índices que resuelvan un problema como éste es fundamental en áreas como recuperación de la información, minería de datos y bioinformática, entre otros. Cuando el texto que se indexa es lenguaje natural, la solución paradigmática corresponde al índice invertido. Sin embargo, los problemas de recuperación de documentos emergen también en escenarios en que el texto y los patrones de consulta pueden ser secuencias generales de caracteres, como lenguajes orientales, bases de datos multimedia, secuencias genómicas, etc. En estos escenarios los índices invertidos clásicos no se aplican con el mismo éxito. Si bien existen soluciones que requieren espacio lineal en este escenario de texto general, el espacio que utilizan es un problema importante: estas soluciones pueden utilizar más de 20 veces el espacio de la colección. Esta tesis presenta nuevos algoritmos y estructuras de datos para resolver algunos pro- blemas fundamentales para recuperación de documentos en colecciones de texto general...

Diseño e Implementación de una Metodología de Predicción de Fuga de Clientes en una Compañía de Telecomunicaciones

Barrientos Inostroza, Francisco Javier
Fonte: Universidad de Chile; CyberDocs Publicador: Universidad de Chile; CyberDocs
Tipo: Tesis
ES
Relevância na Pesquisa
75.55%
La minería de datos es una nueva tecnología que está cobrando relevancia en la actualidad, su utilidad para resolver complejos problemas a lo que se enfrentan las empresas (de múltiples variables y casos) ha dado entrada a la aplicación e investigación sobre la misma. Sin embargo, esta tecnología no es una heurística cualquiera, se fundamenta en la rama de las ciencias de la computación denominada inteligencia artificial y las matemáticas mediante la estadística. En un comienzo, las empresas sólo se preocupaban por el almacenamiento de los datos, datos históricos que permitían cálculos matemáticos simples con una finalidad, la generación de reportes. De esta manera, se buscaba responder las preguntas referentes al control del negocio. Posteriormente se profundizaron estas preguntas de control hasta llegar a la creación de un repositorio consolidado, expresado en la tecnología de data warehouse. En la actualidad Las exigencias de los consumidores cada día aumentan más, puesto que la competencia comienza a ser más dinámica, por ende, para establecer una ventaja competitiva, las empresas requieren responder preguntas que van más allá de los datos históricos, es decir, necesitan extraer información que pueda ser útil para el futuro...

Interpretación y traducción de texto y matemáticas en Braille escrito a máquina

González Cano, Gabriel
Fonte: Universidade Autônoma de Barcelona Publicador: Universidade Autônoma de Barcelona
Tipo: Trabalho de Conclusão de Curso Formato: application/pdf
Publicado em //2009 SPA
Relevância na Pesquisa
75.53%
El trabajo expuesto en la presente memoria, forma parte de un proyecto de colaboración entre el Centro de Visión por Computador de la UAB y el Centro Joan Amades (ONCE), cuyo objetivo es la creación de recursos educativos que faciliten la integración de niños invidentes en las aulas. Se presenta el proceso de implementación de un intérprete y traductor de documentos escritos en Braille con contenido matemático y de texto, que permite a un profesor que no conozca el sistema Braille, la lectura de documentos creados por alumnos invidentes. Dicho intérprete forma parte de una herramienta que permite el reconocimiento de documentos escritos con una máquina Perkins.; El treball exposat a la següent memòria, forma part d’un projecte de col·laboració entre el Centre de Visió per Computador de la UAB i el Centre Joan Amades (ONCE), que té per objectiu la creació de recursos educatius que facilitin la integració de nens invidents a les aules. Es presenta el procés de implementació d’un intèrpret i traductor de documents escrits en Braille amb contingut matemàtic i de text, que permet a un professor que no conegui el sistema Braille, la lectura de documents creats per alumnes invidents. Aquest intèrpret forma part d’una eina que permet el reconeixement de documents escrits amb una màquina Perkins.; The work outlined in this report is part of a collaborative project between the Computer Vision Center (UAB) and the Joan Amades Center (ONCE)...