Lista przedmiotów z materiałami udostępnionymi dla studentów

  • Increase font size
  • Default font size
  • Decrease font size

Aleksandra Żmudzińska

Automatyczna analiza danych z serwisu społecznościowego Twitter do wspomagania diagnozowania depresji

Automatic analysis of Twitter social network data for supporting depression diagnosis

Opiekun pracy dyplomowej: dr inż. Aleksandra Królak
Praca dyplomowa magisterska obroniona 2018-10-16
Streszczenie pracy dyplomowej:
Depresja jest obecnie bardzo dużym problemem medycznym, społecznym jak i ekonomicznym. Na chorobę tą cierpi ponad 350 milionów osób na całym świecie, w tym ok. 1,5 miliona w Polsce. Według statystyk WHO co roku z powodu samobójstw traci życie 800 000 ludzi na świecie. Samobójstwa są drugą najczęstszą przyczyną śmierci ludzi w przedziale wiekowym 15-29 lat. Istnieją skuteczne metody leczenia umiarkowanej i ciężkiej depresji. Podczas badań po sześciu miesiącach leczenia odnotowano odsetek remisji depresji powyżej 65%. Pomimo tego wciąż ponad 50% osób cierpiących na tę chorobę pozostaje niezdiagnozowana. Obecne metody rozpoznania, wsparcia i leczenia depresji klinicznej uznawane są za nieskuteczne, w związku z tym istnieje duża potrzeba, aby poprawić techniki diagnozowania depresji, a nie metody jej leczenia. Obecnie wiele instytucji naukowych pracuje nad znalezieniem nowoczesnych metod wykrywania depresji. Zauważono, że bardzo dobrym sposobem identyfikacji może być analiza postów z portali społecznościowych. Ludzie w obawie przed społeczną stygmatyzacją obawiają mówić się o swoich problemach bliskim i coraz częściej używają do tego celu mediów społecznościowych, które dają im anonimowość. Badania przeprowadzone wśród studentów w Stanach Zjednoczonych mówią, że ludzie z depresją są bardziej skłonni do korzystania z Twittera. Celem pracy było przeanalizowanie tweetów związanych z depresją i znalezienie pewnych wzorców dotyczących aktywności użytkowników Twittera, dodających posty o tematyce depresji, samobójstw, smutku czy samotności. Praca ma za zadanie poszerzyć zakres wiedzy na temat depresji oraz dostarczyć dodatkowych danych, które mogły by pomóc w prewencji tej choroby. Podczas prowadzenia badań analizowano tweety zawierające słowa kluczowe takie jak smutek, samotność, depresja. Udało się zaobserwować jakie słowa we wpisach były najczęściej dodawane oraz rodzaj najczęściej występującego nacechowania emocjonalnego. Zaprezentowano na mapie rozkład aktywności użytkowników oraz tendencje związane z ich dobową aktywnością. Słowa kluczowe: Twitter, depresja, MongoDB, data cleaning, analiza danych.
Nowadays depression is a very big problem in medical, social and economic sense. Over 350 million people worldwide suffer from depression, including about 1.5 million persons in Poland. According to WHO statistics, 800,000 people lose their lives every year due to suicides. Suicides are the second leading cause of death in people aged 15-29. There are effective treatments for moderate and severe depression. One of the studies showed that after six months of treatment, the remission rate of depression was higher than 65%. Although there are effective ways of healing depression, still over 50% of people suffering from this disease are undiagnosed. Current methods of identification, support and treatment of clinical depression are considered ineffective, therefore there is a great need to improve the techniques of identifying depression instead of the methods of its treatment. Currently, many scientific institutions are working on modern methods of identifying depression. It was noticed that an analysis of posts from social media could be a very good way to identify depression. People are afraid of being stigmatized, prefer to talk about their problems through social networking sites rather than with their relatives. Studies conducted among students in the United States show that people with depression are more likely to use Twitter. The aim of the thesis was to analyze tweets related to depression and to find certain patterns regarding the activity of Twitter users, who add posts about depression, suicides, sadness and loneliness. The research was conducted to increase the scope of general knowledge about depression and provide additional data that could help in the prevention of this disease. While doing research, tweets were analyzed that included keywords such as sadness, loneliness, and depression. It was observed which words were in the posts were most often added, and what was the emotional polarity of the tweets. A schedule of user activity was presented on the map and trends related to daily activity of users were observed. Keywords: Twitter, depression, MongoDB, data-cleaning, data analysis.