Tesis doctorales
URI permanente para esta colección
Examinar
Examinando Tesis doctorales por Materia "Análisis de datos"
Mostrando 1 - 3 de 3
Resultados por página
Opciones de ordenación
Ítem From Political Manifestos to Social Networks(Universidad de Deusto, 2020-06-23) Bilbao Jayo, Aritz; Almeida, Aitor; Facultad de Ingeniería; Programa de Doctorado en Ingeniería para la Sociedad de la Información y Desarrollo Sostenible por la Universidad de DeustoDue to the rise of the social networks, political parties and politicians have found new ways of establishing their position on an issue apart from traditional political manifestos. From this phenomenon, a new research area has emerged, the automation of political discourse analysis on Social Networks. To do so, this PhD dissertation has taken advantage of a widely used content analysis methodology for political manifestos, The Manifesto Project. With annotated manifestos since 2001, this methodology uses a codification which allows the analysis of political parties policy preferences regarding 56 topics, providing the scientific community with parties’ policy positions derived from the content analysis. Therefore, this PhD dissertation focuses on two main tasks: firstly, to automate the annotation process of political manifestos, in order to facilitate that same process to political scientists and secondly, to use this model as a basis to perform a political discourse analysis on Twitter using the previously mentioned Manifesto Project's methodology. To do so, we have taken advantage of two types of contextual information available in the two circumstances of the application of this research work: manifestos and Twitter. The first contextual data is what has been said previously, in the case of election manifestos the previous phrase or statement, and on twitter the preceding tweet. The second contextual information is which political party is the sender of the statement. Regarding the use of contextual information in order to improve manifestos automated classification, we have improved state of the art results in 4 out of 7 languages. With regard to Tweets' classification, we can affirm that annotated manifestos can be used as complementary data for this task, being the fine-tuned model with annotated tweets the best performing one. Moreover, contextual information does also improve the performance of the models when tweets are classified. Using this approach, we have analysed the 2016 United States presidential elections on Twitter.Ítem La incorporación del periodismo de datos a los grados de Comunicación(Universidad de Deusto, 2020-01-17) Berasategi, Miren; Gibaja Martíns, Juan José; Facultad de Ciencias Sociales y Humanas; Programa de Doctorado en Ocio, Cultura y Comunicación para el Desarrollo Humano por la Universidad de DeustoLa tesis que aquí se presenta elabora una propuesta para la incorporación del periodismo de datos en el grado en Comunicación de la Universidad de Deusto, no solamente con respecto a los contenidos y habilidades requeridas, sino también abarcando la predisposición negativa hacia los números que presentan con frecuencia las estudiantes de perfil periodístico. Con el desarrollo de las nuevas tecnologías de la información y la comunicación, el entorno digital conectado y siempre disponible ha dado lugar a una "revolución de los datos", definida por dos factores: en primer lugar, "una explosión en el volumen de datos, la velocidad a la que se producen esos datos [...] y el rango de cosas en las que hay datos [...]"; y en segundo lugar, una demanda creciente de datos proveniente de todas las partes de la sociedad [3]. En el mundo actual los números son, por tanto, ineludibles: junto con el incremento de la existencia y disponibilidad de estos grandes volúmenes de datos, crece también la necesidad de desarrollar la capacidad de gestionar, manejar y, en última instancia, comprender los números y aprender de ellos [4]. Esta capacitación debe extenderse a la ciudadanía en general, pero resulta especialmente relevante para el periodismo, dado su papel intermediario e interpretador de la realidad. El periodismo de datos (PD) se identifica como parte de la respuesta a este requerimiento: reformulando el nada nuevo "periodismo de precisión" [2], se ocupa y preocupa de obtener el acceso y analizar conjuntos de datos y ofrecérselos a la audiencia mediante infografías, visualizaciones de datos o aplicaciones interactivas. Aun estando bastante extendida la opinión de que una mínima habilidad con los números resulta básica en el ejercicio del periodismo actual, parece que la relación entre periodistas y números nunca ha resultado fácil: cuestiones relativamente sencillas como la variación de porcentajes siguen dando pie a errores en la prensa con frecuencia, y la noción de que las periodistas son personas más de palabras que de números, y por tanto poco capaces con las matemáticas, es muy habitual. Para la incorporación del PD a los planes de estudios, sin embargo, se ha reflexionado generalmente sobre la necesidad de contenidos y herramientas necesarias para su ejercicio, pero no se ha abordado la dificultad de las profesionales ni la reticencia inicial muy extendida entre las estudiantes de que "no se me dan bien las matemáticas" [1], síntoma de su ansiedad matemática (AM). Esta tesis, a través del estudio del caso de las estudiantes del grado en Comunicación de la Universidad de Deusto (UD), elabora una propuesta de asignatura titulada "Fundamentos del periodismo de datos" que trabaja los contenidos y habilidades requeridos para llevar a cabo proyectos de PD, al mismo tiempo que tiene en consideración la AM de las estudiantes y el efecto perjudicial que tiene en su rendimiento. Para ello, en primer lugar se ha revisado el proceso del PD, en el que se identifican tres fases principales: una primera fase que consiste en el acceso y la obtención de los datos; una segunda fase que responde al procesamiento o el análisis de los datos; y, finalmente, una última fase que corresponde a la comunicación de los datos o las conclusiones extraídas de los mismos. Así, los conceptos de base identificados como necesarios para el desarrollo de proyectos de PD se agrupan en dos bloques: competencia matemática y/o estadística, por un lado, que permite entender la manera en la que los datos han de ser tratados a fin de responder a las preguntas planteadas, y realizar el análisis propiamente dicho, además de comprender las implicaciones y significación de los resultados; y conocimientos de programación, por otro, tanto para la ejecución de funciones estadísticas avanzadas como para la distribución de los resultados, ya sea en forma de visualizaciones, o mediante el desarrollo de sitios web destinados a la comunicación de los productos periodísticos generados como resultado del proceso de PD. Posteriormente, se realiza una revisión del constructo de AM, estudiada desde hace más de 60 años y definida en términos más o menos catastrofistas como una respuesta emocional desagradable ante el estímulo de las matemáticas, con un efecto perjudicial en el rendimiento. Uno de los dominios más afectados en el rendimiento es precisamente el más crítico para el ejercicio del PD como parte de la labor social del periodismo: el "olfato para los números", o la capacidad intuitiva de hacer estimaciones y conservar el espíritu inquisitivo. Con el fin de confirmar que las estudiantes del grado en Comunicación de la UD ven comprometido su desempeño matemático a causa de la AM, se realiza a través de un cuestionario la medición de su AM y de su competencia matemática (a través del Test de Competencia Matemática para Periodistas o TCMP). De los datos analizados se extrae, en primer lugar, que las estudiantes de Comunicación de la UD presentan una competencia matemática baja, sin alcanzar en ningún caso la puntuación máxima; la necesidad de capacitar a estas estudiantes en afrontar números, por tanto, es urgente. Las estudiantes presentan también una AM media, aunque más alta que la de las estudiantes de otras disciplinas afines, tanto en cuanto a la ansiedad por exámenes de matemáticas como, sobre todo, en lo que respecta a la ansiedad por curso de matemáticas. Se observa también una relación entre la AM y la competencia matemática: a pesar de que los valores extremadamente altos de AM afectan drásticamente a la competencia, no se ha observado el efecto inverso para valores extremadamente bajos de AM. La incorporación del PD como capacitante en el manejo de números, por tanto, no puede realizarse sin tener en consideración la AM de las estudiantes y el efecto perjudicial que tiene sobre su rendimiento. Con este fin, se elabora una propuesta de asignatura a partir de los componentes derivados de las elaboraciones anteriores. Por un lado, y originadas de la revisión del proceso del PD, se incluyen las tareas y contenidos dedicados a las operaciones matemáticas y estadísticas básicas y algunas nociones de programación web,junto con visualización de datos y programación estadística. Por otro, y con el objetivo de aminorar la incidencia de la AM, se aplican algunos de los tratamientos identificados mediante las siguientes estrategias de enseñanza-aprendizaje: establecer el foco en las tareas, en lugar de en las herramientas; una organización iterativa del contenido, en la que las tareas básicas del proceso de PD se realizan más de una vez utilizando técnicas de creciente complejidad; el ofrecimiento de sesiones adicionales o tutorías; un planteamiento de trabajo cooperativo por proyectos; y un enfoque de aula invertida, en el que la conceptualización se realiza fuera del aula, y el tiempo presencial se utiliza para llevar a cabo las tareas. El programa de la asignatura que recoge los contenidos enumerados mediante las mencionadas estrategias de enseñanza-aprendizaje se ha desarrollado a medida de los requerimientos competenciales y de formato del Modelo de Aprendizaje de la Universidad de Deusto en general, y de la Memoria de Verificación del grado en Comunicación en particular. En definitiva, esta tesis ha sistematizado, cuantificado y analizado la extendida aunque poco precisada noción de que las estudiantes de periodismo "no son buenas en matemáticas" a través del estudio de la interacción entre la AM y el rendimiento de las estudiantes de Comunicación de la UD. Mediante la propuesta elaborada a partir de las conclusiones de ese estudio, se ofrece a las periodistas una capacitación que les permite conservar su autonomía a la hora de realizar la transformación de los datos en información para comunicar a las lectoras, sin depender de interpretaciones potencialmente sesgadas o interesadas. En otras palabras, esta investigación ha pretendido contribuir a graduar periodistas inquisitivas con los números, que no aflojen el rigor periodístico que demuestran en otras facetas cuando se enfrenten a ellos.Ítem Large-scale anomaly detection and diagnosis on industrial heterogeneous multi-sensor systems using deep learning(Universidad de Deusto, 2020-02-28) Cañizo Zubizarreta, Mikel; Onieva Caracuel, Enrique; Facultad de Ingeniería; Programa de Doctorado en Ingeniería para la Sociedad de la Información y Desarrollo Sostenible por la Universidad de DeustoIndustry 4.0 has played an important role in the digitalization of modern industrial processes, where multiple sensors are typically used to monitor the industrial systems. This means that large volumes of data regarding the performance of the systems are now available, which are then used for various industrial applications that range from process control and optimization to maintenance operations. In this context, processing these volumes of data to detect and diagnose anomalies has become a necessity as industrial systems are prone to faults and an undetected fault can lead to critical damage, besides reducing the productivity and increasing the maintenance operation costs. This thesis presents a large-scale industrial monitoring system to detect and diagnose anomalies in multi-sensor systems. The monitoring system is composed of three main modules. First, a supervised Deep Learning (DL) based anomaly detection system that identifies anomalies within multi-sensor systems. Second, an anomaly diagnosis system that relies on interpretability methods to explain how the DL based anomaly detection model reaches a decision, thus identifying in which sensors and time span the anomalies occur. Third, a large-scale monitoring system based on Big Data and cloud computing technologies to process the large volumes of data in a fast, scalable, and fault-tolerant way. Therefore, the anomaly detection and diagnosis systems can be deployed in the cloud to support the monitoring of multiple industrial systems. To validate the proposal, each module has been validated in an industrial case study. The algorithms and methods resulting from this thesis have demonstrated to be suitable for detecting and diagnosing anomalies in industrial multi-sensor systems since they improve state of the art results.