Studentische Hilfskraftstellen in StratoSphere
In der Arbeitsgruppe "Wissensmanagement in der Bioinformatik" an der Humboldt-Universität zu Berlin sind ab sofort zwei Stellen für studentische Hilfskräfte zu besetzen. Die Arbeitszeit sollte bei 80h pro Monat liegen, aber andere Zeiten sind ebenfalls möglich.
Beide Stellen sind im DFG-geförderten Projekt Stratosphere frei, in dem es um die Entwicklung von Methoden zum skalierbaren Text Mining auf einer Cloud-Plattform geht (siehe auch die Beschreibung weiter unten oder diesen kurzen Artikel über die Forschergruppe. Weitere Informationen über die Gruppe finden Sie unter hier.Wir bieten eine junge und lebendige Forschungsumgebung in einer Gruppe von ca. 15 Personen, die in den Bereichen Bioinformatik, Datenbanken, und Maschinellem Lernen forschen.
Aufgaben im Projekt
- Unterstützung der Forschungsarbeiten im Projekt Stratosphere
- Aufbau und Pflege von Bibliotheken von Text Mining Komponenten
- Aufbau und Pflege von annotierten Korpora
- Systematische Durchführung von Leistungsmessungen und Tests
Sie sollten ...
- Informatik, Cimputerlinguistik oder Bioinformatik mindestens im dritten Semester studieren
- gute Kenntnisse in Java haben
- großes Interesse an Forschung in den genannten Gebieten mitbringen
- am besten schon mal in einem Team Software geschrieben haben und sich mit Tools wie SVN, BugTrackern, Wikis, Coding Guidelines, etc. auskennen.
- idealerweise Kenntnisse in statistischer Sprachverarbeitung bzw. Text Mining / Computerlinguistik mitbringen
Bewerbung
Bitte schicken Sie Ihre Bewerbung mit den üblichen Unterlagen (Anschreiben, Liste absolvierter Kurse, spezielle Fähigkeiten, fachliche Interessen, Nebenfach, berufliche Erfahrungen etc.) formlos per Mail an Prof. Leser. Wir freuen uns auch über alle Nachfragen an dieselbe Adresse.
Schwerbehinderte werden bei gleicher Eignung bevorzugt. Bewerbungen qualifizierter Studentinnen sind besonders willkommen.
Mehr zu Stratosphere
The Technische Universität Berlin, Humboldt Universität Berlin, and the Hasso-Plattner-Institut in Potsdam are jointly researching “Information Management on the Cloud” through the “Stratosphere” Collaborative Research Unit funded by the Deutsche Forschungsgemeinschaft (DFG). Stratosphere aims at considerably advancing the state-of-art in data processing on parallel, adaptive architectures. Stratosphere (named after the layer of the atmosphere above the clouds) explores the power of massively parallel computing for complex information management applications. Building on the expertise of the participating researchers, we aim to develop a novel, database-inspired approach to analyze, aggregate, and query very large collections of either textual or (semi-)structured data on a virtualized, massively parallel cluster architecture.
Stratosphere will conduct research in the areas of massively parallel data processing engines, a programming model for parallel data programming, robust optimization of declarative data flow programs, continuous re-optimization and adaptation of the execution, data cleansing, and text mining. The unit will validate its work through a benchmark of the overall system performance and by demonstrators in the areas of climate research, the biosciences and linked open data.
The goal of Stratosphere is to jointly research and build a large-scale data processor based on concepts of robust and adaptive execution. We will be researching a programming model that extends a functional map/reduce programming model with additional second order functions. As execution platform we use a Dryad-like massively parallel data flow engine that will also researched and developed in the project. We will be examining real-world use-cases in the area of climate research, information extraction and integration of unstructured data in the life-sciences, as well as linked open data and social network graph data.
The group will provide the opportunity to perform high-quality and cutting-edge research in an international context and in strong cooperation. The project will be carried out jointly by Prof. Volker Markl (TU Berlin, Database Group, speaker of the unit), Prof. Odej Kao (TU Berlin, Distributed Systems Group), Prof. Johann-Christoph Freytag, (HU Berlin, Database and Information Systems Group), Prof. Ulf Leser (HU Berlin, Knowledge Management in Bioinformatics), and Prof. Felix Naumann (HPI Potsdam, Database and Information Systems Group).