@mastersthesis{development-gsi-mastersthesis-20194, author = "Pascual-Saavedra, Alberto", abstract = "El objetivo principal de este proyecto es desarrollar un sistema Big Data de an{\'a}lisis y visualizaci{\'o}n de medios sociales. Para ello se emplear{\'a}n diferentes servicios REST. Se desarrollar{\'a} GSICrawler como servicio de ingesta de datos y se emplear{\'a} Senpy como servicio de an{\'a}lisis. Adem{\'a}s se emplear{\'a} el framework Sefarad basado en Web Components para la visualizaci{\'o}n. Para poder integrar todos los servicios dentro del mismo sistema emplearemos Luigi como orquestador. La motivaci{\'o}n de este proyecto es doble. Por un lado, viene dada por la cantidad de datos que podemos encontrar en medios sociales sobre distintos temas. En estas fuentes de datos se generan opiniones constantemente por lo que los datos recogidos proporcionan informaci{\'o}n sobre las tendencias y opiniones de los usuarios. Por otro lado, existen diferentes herramientas para realizar an{\'a}lisis de Big Data. Sin embargo, su uso es bastante complejo, ya que cada herramienta funciona por separado. Los principales metas de este proyecto son: - Dise{\~n}ar una arquitectura que englobe los diferentes servicios de an{\'a}lisis y recogida de datos en formato sem{\'a}ntico. - Adaptar los componentes ya existentes a la nueva arquitectura. - Facilitar la orquestaci{\'o}n de diferentes sistemas en flujos de trabajo complejos mediante tareas predefinidas. - Desarrollar un caso de uso empleando todos los servicios del sistema. Este proyecto se divide en cinco fases principales - Realizar un dise{\~n}o de la arquitectura en la que est{\'e}n presentes todos los servicios involucrados en el sistema. - Adaptar los servicios ya implementados a la nueva arquitectura. - Desarrollo e implementaci{\'o}n del servicio de ingesta de datos (GSICrawler). Se implementar{\'a} como una API REST basada en Python que nos devolver{\'a} el resultado del an{\'a}lisis en formato JSON-LD. - Desarrollo de las funciones del orquestador encargadas de realizar los distintos an{\'a}lisis: de sentimientos, de emociones, detectores de entidades? - Implementaci{\'o}n de un caso de uso que conste de las siguientes partes: 1. Obtener datos de distintas fuentes en formato sem{\'a}ntico. 2. Procesar y enriquecer los datos. Obteniendo los temas y personas de los que se habla, as{\'i} como los sentimientos y emociones. 3. Crear un dashboard interactivo para la visualizaci{\'o}n de los datos recogidos. Este dashboard estar{\'a} implementando empleando el framework Sefarad, adem{\'a}s se ampliar{\'a} creando nuevos Web Components espec{\'i}ficos para medios sociales ", address = "ETSI Telecomunicaci{\'o}n", institution = "Universidad Polit{\'e}cnica de Madrid", keywords = "sefarad;elastic search;web components", month = "January", title = "{D}evelopment of a {B}ig {D}ata system for analysis and visualization of social media based on {REST} services", type = "TFM", year = "2019", }