CATÁLOGO DE LA BIBLIOTECA DE LA FaMAF
Normal view MARC view ISBD view

Recomendación de información basada en análisis de redes sociales y procesamiento de lenguaje natural / Pablo Gabriel Celayes.

By: Celayes, Pablo Gabriel, 1982-.
Contributor(s): Domínguez, Martín Ariel, 1975- [dir.] | Nederhand, Rene, 1973- [co dir.].
Material type: materialTypeLabelBookPublisher: [S.l. : s.n. ], 2017Description: iv, 56 p. : il. ; 30 cm.Subject(s): Applied computing -- Sociology | Computing Methodologies -- Natural language processing | Computación aplicada -- Sociología | Metodologías de computación -- Procesamiento de lenguaje natural | Support vector machines | Latent Dirichlet allocation | Sociología | Análisis de redes sociales | Aprendizaje automático | Modelado temáticoOnline resources: Acceso a Versión Digital | Acceso a RDU-UNC Disponible en línea.
Partial contents:
Support Vector Machines -- Modelos temáticos probabilísticos -- Tweepy -- Scrapy -- SQLAlchemy -- NetworkX -- Graphtool -- Aprendizaje automático y PLN -- Visualización -- Datos de muestra -- Usuarios propios -- Facebook -- Twitter API -- Predicción social pura -- Agregando análisis de contenido -- Trabajos relacionados -- Conclusiones y trabajo futuro.
Dissertation note: Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2017. Summary: El presente trabajo se origina en el estudio de técnicas de Análisis de Redes Sociales para mejorar la calidad de un recomendador de contenido para entornos corporativos. Estudiamos el problema de recomendación de contenido basada en preferencias del entorno social de un usuario. Construimos un conjunto de datos de muestra extraído de la red social Twitter y a partir de estos datos entrenamos y evaluamos modelos de clasificación binaria SVM ( Support Vector Machines ) que predicen retweets de un usuario en base a los de su entorno. Se obtiene una calidad media de predicción F1 superior al 84 %, sin analizar el contenido de los tweets. En los casos en que la predicción social pura no es tan buena, se estudian modelos aumentados con características extraídas del contenido, usando el modelo temático probabilístico LDA ( Latent Dirichlet Allocation ).Summary: This work originates from the study of Social Network Analysis techniques to improve the quality of a content recommender system for corporate environments. We study the problem of content recommendation based on preferences within the social neighborhood of a user. We build a sample dataset extracted from the Twitter social network and use this data to train and evaluate SVM (Support Vector Machine) binary classification models that predict retweets by a given user based on those of her neighborhood. An average F1-score above 84% is obtained, without analyzing the content of tweets. In the cases where pure social prediction is not that good, we study models augmented with features extracted from text content, using the probabilistic topic model LDA ( Latent Dirichlet Allocation )
Tags from this library: No tags from this library for this title.
Item type Current location Call number Copy number Status Notes Date due Barcode Item holds
Trabajo Especial de Grado Trabajo Especial de Grado FaMAF
Secc. Tesis y Trabajos especiales
TE C CEL 1 Available Disponible también en línea 22909
Total holds: 0

Bajo Licencia Creative Commons Atribución-CompartirIgual 2.5 Argentina.

Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2017.

Bibliografía : p. 55-56.

Support Vector Machines -- Modelos temáticos probabilísticos -- Tweepy -- Scrapy -- SQLAlchemy -- NetworkX -- Graphtool -- Aprendizaje automático y PLN -- Visualización -- Datos de muestra -- Usuarios propios -- Facebook -- Twitter API -- Predicción social pura -- Agregando análisis de contenido -- Trabajos relacionados -- Conclusiones y trabajo futuro.

El presente trabajo se origina en el estudio de técnicas de Análisis de Redes Sociales para mejorar la calidad de un recomendador de contenido para entornos corporativos.
Estudiamos el problema de recomendación de contenido basada en preferencias del entorno social de un usuario. Construimos un conjunto de datos de muestra extraído de la red social Twitter y a partir de estos datos entrenamos y evaluamos modelos de
clasificación binaria SVM ( Support Vector Machines ) que predicen retweets de un usuario en base a los de su entorno. Se obtiene una calidad media de predicción F1 superior al 84 %,
sin analizar el contenido de los tweets. En los casos en que la predicción social pura no es tan buena, se estudian modelos aumentados con características extraídas del contenido, usando el modelo temático probabilístico LDA ( Latent Dirichlet Allocation ).

This work originates from the study of Social Network Analysis techniques to improve the quality of a content recommender system for corporate environments. We study the problem of content recommendation based on preferences within the social neighborhood of a user. We build a sample dataset extracted from the Twitter social network and use this data to train and evaluate SVM (Support Vector Machine) binary classification models that predict retweets by a given user based on those of her neighborhood.
An average F1-score above 84% is obtained, without analyzing the content of tweets. In the cases where pure social prediction is not that good, we study models augmented with features extracted from text content, using the probabilistic topic model LDA ( Latent Dirichlet Allocation )

Disponible en línea.

Defensa: julio 2017.

Firmas del Tribunal : Doctores Franco Martín Luque y Martín Ariel Domínguez al final del trabajo en hoja adjunta.

Click on an image to view it in the image viewer

Horario de la Biblioteca: lunes a viernes de 8:30 a 18:00hs

Av. Medina Allende s/n , Ciudad Universitaria, Córdoba, Argentina

Tel: +54 351 5353701 int. 41127(Atención al Público) int. 41151(Dirección)

biblio@famaf.unc.edu.ar

publicofamaf@gmail.com



//