Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Maschinelles Lernen

Das Flair NLP Framework

Das Flair Framework bündelt unsere Forschungs- und Entwicklungsarbeit, und macht es der Öffentlichkeit frei verfügbar. Es ist bereits in hunderten von Forschungsprojekten und industriellen Anwendungen im Einsatz. Flair zählt zu den meistgenutzen deep learning Frameworks für NLP und ist offizieller Bestandteil des PyTorch Ökosystems.

Flair ist derzeit der Stand der Kunst für verschiedene Arten der Textanalyse auf Daten in zahlreichen Sprachen wie Deutsch, Englisch, Polnisch, Japanisch, etc. Es wird von unserem Lehrstuhl zusammen mit der Open Source Community und industriellen Forschungslaboren wie Zalando Research entwickelt. Wenn Sie sich dafür interessieren, freuen wir uns auf eine Kontaktaufnahme und Mitarbeit im Rahmen der Open Source Community.

 


Analyse von Textdaten

Flair implementiert verschiedene Arten der Textanalyse, inklusive des Sequenzlabelings, der Textklassifikation, der Ähnlichkeitsanalyse und der Textregression. Im Sequenzlabeling ist Flair derzeit der Stand der Kunst und in vielen industriellen Anwendungen im Einsatz.

So kann Flair zum Beispiel zum Erkennen von Entitäten eingesetzt werden, wie z.B. hier bei Zalando SE:

A picture of should be here


Worteinbettungen

Flair unterstützt eine große Vielfalt von Wordeinbettungen zum Einsatz in NLP Tasks. So z.B. GloVe, FastText, ELMo, BERT und Varianten (RoBERTa, ALBERT, CamemBERT, etc.), XLM, Byte Pair Embeddings und natürlich die von uns entwickelten Flair embeddings:

A picture of should be here

Hierbei wird die Komplexität dieser Einbettungen hinter einem einheitlichen Interface im Framework versteckt. Somit ist es sehr leicht, mit verschiedenen EInbettungen NLP Modelle zu trainieren und Ansätze wie z.B. BERT zu vergleichen und zu verwenden.


Weitere Informationen

Ausgewählte Publikationen

  • Contextual String Embeddings for Sequence Labeling. Alan Akbik, Duncan Blythe and Roland Vollgraf. COLING 2018.
  • Pooled Contextualized Embeddings for Named Entity Recognition. Alan Akbik, Tanja Bergmann and Roland Vollgraf. NAACL 2019.
  • Multilingual Sequence Labeling With One Model. Alan Akbik, Tanja Bergmann and Roland Vollgraf. NLDL 2019.
  • FLAIR: An Easy-to-Use Framework for State-of-the-Art NLP. Alan Akbik, Tanja Bergmann, Duncan Blythe, Kashif Rasul, Stefan Schweter and Roland Vollgraf. NAACL 2019.

Links