Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Seminar Data and Text Mining in Social Networks

Prof. Dr. Ulf Leser, Lars Döhling

Das Seminar behandelt Möglichkeiten, in sozialen Netzwerken (wie Flickr, Twitter oder Blogs) Informationen automatisch zu finden, zu extrahieren und zu aggregieren.


Voraussetzungen

Zur Teilnahme sind Grundkenntnisse im Text und/oder Data Mining notwendig bzw. zu Beginn des Seminars selbstständig zu erarbeiten.


Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für
  • Diplomstudiengang Informatik, Hauptstudium Praktische Informatik, 3SP
  • Monobachelor Informatik, Wahlpflichtbereich, 3SP
  • Master Wirtschaftsinformatik, 3SP

Voraussetzung für den Schein ist:

  • das Bestehen einer Kurzklausur zu Grundlagenthemen (siehe unten),
  • das Halten eines wissenschaftlichen Vortrags,
  • die einmalige Übernahme der "Opponentenrolle" (siehe unten) sowie
  • das Erstellen einer schriftlichen Ausarbeiten (Seminararbeit)

Anmeldung

Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über Goya.


Termine und Ablauf

Am Dienstag, den 18.10.2011, findet von 15.00-17.00 Uhr die Einführungsveranstaltung statt, die für alle Teilnehmer verpflichtend ist. Dort werden die Themen erläutert und vergeben.

Das Seminar wird als Blockseminar am Ende des Semesters abgehalten. Jeder Student (oder jede Gruppe von Studenten) muss einen ca. 30 minütigen Vortrag über das zugewiesene Thema halten. Vorher muss der Betreuer mindestens zweimal getroffen werden, einmal zur Vorbesprechung des Themas und einmal zur Besprechung der Folien. Außerdem wird es vor Weihnachten einen Termin geben, in dem alle Studenten in einer 5-minütigen Flash-Präsentation ihr Thema vorstellen, um Querverbindungen zu erkennen und die rechtzeitige Beschäftigung mit dem Thema sicherzustellen. Schließlich muss zu jedem Thema eine Seminararbeit verfasst werden.

Zu jedem Thema wird ein Student vorab als Opponent ausgewählt. Der Opponent liest ebenfalls die zum Thema ausgegebene Literatur und bereitet für den Vortragstermin kritische Fragen zu deren Inhalt vor, die dann im Seminar diskutiert werden. Ziel ist nicht das Aufdecken von Verständnisproblemen beim Vortragenden, sondern die kritische Auseinandersetzung mit dem Thema.

Zusätzlich zu der speziellen Literatur, über die die Vorträge gehalten werden, gibt es für alle Teilnehmer verpflichtende Einführungslektüre. Anfang Dezember werden die dort vermittelten Kenntnisse im Rahmen einer Kurzklausur überprüft. Das Bestehen der Klausur ist Voraussetzung für die weitere Teilnahme.

Alle Pflichttermine in der Übersicht:

  • 18.10.2011, 15.00-17.00 Uhr, RUD26 1'305: Einführung
  • 15.11.2011 - 30.11.2011: Individuelle Themenbesprechung mit dem Betreuer
  • 13.12.2011, 15.00 s.t.-17.00 Uhr, RUD26 1'305: Flash-Präsentationen aller Themen sowie Kurzklausur
  • 15.01.2012 - 31.01.2012: Individuelle Folienbesprechung mit dem Betreuer
  • 10.02.2012, ab 9:30Uhr s.t., RUD25 IV.113: Blockseminar
  • Bis 31.3.2012: Abgabe der Seminararbeit

Vorlagen


Einführungslektüre

Thema
Literatur
Pflicht
Empfohlen
Einführungsveranstaltung Folien

Themen (Abstract per Mouseover verfügbar)

Ereignisentdeckung mit Twitter Vortragende/r Opponent Betreuer
1 Tetsuro Takahashi, Shuya Abe, and Nobuyuki Igata. 2011. Can twitter be an alternative of real-world sensors?. In Proceedings of the 14th international conference on Human-computer interaction: towards mobile and intelligent interaction environments - Volume Part III (HCII'11), Julie A. Jacko (Ed.), Vol. Part III. Springer-Verlag, Berlin, Heidelberg, 240-249. (aus dem HU-Netz abrufbar)     Lars Döhling
2 Takeshi Sakaki, Makoto Okazaki, and Yutaka Matsuo. 2010. Earthquake shakes Twitter users: real-time event detection by social sensors. In Proceedings of the 19th international conference on World wide web (WWW '10). ACM, New York, NY, USA, 851-860. Alexander Konrad David Asher, Alexander Frenzel Lars Döhling
Klassifikation von Weblog, Tweets und Facebook-Freunden      
3 Sudha Verma, Sarah Vieweg, Will Corvey, Leysia Palen, Jim Martin, Martha Palmer, Aaron Schram, and Ken Anderson. 2011. NLP to the Rescue? Extracting "Situational Awareness" Tweets During Mass Emergency. In Proceedings of the 5th International AAAI Conference on Weblogs and Social Media (ICWSM-11), Barcelona, Spain. Florian Kaase Jan Lelis Lars Döhling
4 Ahmad Ammari and Valentina Zharkova. 2009. Combining Tag Cloud Learning with SVM Classification to Achieve Intelligent Search for Relevant Blog Articles. In Proceedings of the 1st International Workshop on Mining Social Media (MSM09-CAEPIA09), Sevilla, Spain.     Lars Döhling
5 Eric Gilbert and Karrie Karahalios. 2009. Predicting tie strength with social media. In Proceedings of the 27th international conference on Human factors in computing systems (CHI '09). ACM, New York, NY, USA, 211-220.     Lars Döhling
Trendanalyse in Twitter und Netzgemeinschaften      
6 Courtney D. Corley, Diane J. Cook, Armin R. Mikler, and Karan P. Singh. 2010. Text and Structural Data Mining of Influenza Mentions in Web and Social Media. Int J Environ Res Public Health. 2010 February; 7(2): 596–615.
Michael Paul and Mark Dredze. 2011. You Are What You Tweet: Analyzing Twitter for Public Health. In Proceedings of the 5th International AAAI Conference on Weblogs and Social Media (ICWSM-11), Barcelona, Spain.
Martin Beckmann, Arne Binder Florian Hönicke Ulf Leser
7 Sitaram Asur and Bernardo A. Huberman. 2010. Predicting the Future with Social Media. In Proceedings of the 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, pp.492-499.     Ulf Leser
8 Johan Bollen, Huina Mao, and Xiaojun Zeng. 2011. Twitter mood predicts the stock market. Journal of Computational Science, Volume 2, Issue 1, March 2011, Pages 1-8.
Shawndra Hill and Noah Ready-Campbell. 2011. Expert Stock Picker: The Wisdom of (the Experts in the) Crowds. In Proceedings of the 1st International Workshop on Mining Social Media (MSM09-CAEPIA09), Sevilla, Spain.
Florian Hönicke Florian Kaase Lars Döhling
Meinungsanalyse in Twitter und Amazon Vortragende/r Opponent Betreuer
9 Alexander Pak and Patrick Paroubek. 2010. Twitter as a Corpus for Sentiment Analysis and Opinion Mining. In Proceedings of the 7th conference on International Language Resources and Evaluation (LREC'10), Valletta, Malta.

Dmitry Davidov, Oren Tsur, and Ari Rappoport. 2010. Semi-supervised recognition of sarcastic sentences in Twitter and Amazon. In Proceedings of the Fourteenth Conference on Computational Natural Language Learning (CoNLL '10). Association for Computational Linguistics, Stroudsburg, PA, USA, 107-116.

Jan Lelis Alexander Konrad Ulf Leser
Informationsaggregation für das Krisenmanagement      
10 Li Zheng, Chao Shen, Liang Tang, Tao Li, Steve Luis, and Shu-Ching Chen. 2011. Applying data mining techniques to address disaster information management challenges on mobile devices. In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '11). ACM, New York, NY, USA, 283-291.     Ulf Leser
Georeferenzierung in Flickr      
11 Maarten Clements, Pavel Serdyukov, Arjen P. de Vries, and Marcel J.T. Reinders. 2010. Using flickr geotags to predict user travel behaviour. In Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval (SIGIR '10). ACM, New York, NY, USA, 851-852.
Maarten Clements, Pavel Serdyukov, Arjen P. de Vries, and Marcel J. T. Reinders. 2010. Finding Wormholes with Flickr Geotags. In Proceedings of the 32nd European Conference on Information Retrieval (ECIR'2010), Milton Keynes, UK, pp.658-661.
    Lars Döhling
12 Olivier Van Laere, Steven Schockaert, and Bart Dhoedt. 2010. Towards automated georeferencing of Flickr photos. In Proceedings of the 6th Workshop on Geographic Information Retrieval (GIR '10). ACM, New York, NY, USA, Article 5.
Pavel Serdyukov, Vanessa Murdock, and Roelof van Zwol. 2009. Placing flickr photos on a map. In Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval (SIGIR '09). ACM, New York, NY, USA, 484-491.
Chris De Rouck, Olivier Van Laere, Steven Schockaert, and Bart Dhoedt. 2011. Georeferencing Wikipedia Pages Using Language Models from Flickr. In Proceedings of the Terra Cognita 2011 Workshop. Bonn, Germany.
David Asher, Alexander Frenzel Martin Beckmann, Arne Binder Lars Döhling
Folksonomies und deren Anwendung      
13 Sanjay Sood, Sara Owsley, Kristian Hammond, and Larry Birnbaum. 2007. TagAssist: Automatic Tag Suggestion for Blog Posts. In Proceedings of the 1st International Conference on Weblogs and Social Media (ICWSM 2007), Boulder, Colorado, USA.
Jennifer Trant. 2006. Exploring the potential for social tagging and folksonomy in art museums: Proof of concept. New Review of Hypermedia and Multimedia, Vol. 12, No. 1. (June 2006), pp. 83-105.
  Ulf Leser