Nabídka tohoto termínu kurzu již není aktuální. Podobné kurzy naleznete zde.

Natural Language Processing

Základní info

Popis kurzu

This course is focused on the analysis and processing of text data. We are expecting knowledge of
basic principles of machine learning in the same extent as the Introduction to Machine Learning
course provides. A special attention will be aimed to text preprocessing and vectorization, which
is crucial for NLP. We will further focus on text classification, language modeling and text
synthesis.


This course is focused on the analysis and processing of text data. We are expecting knowledge of
basic principles of machine learning in the same extent as the Introduction to Machine Learning
course provides. A special attention will be aimed to text preprocessing and vectorization, which
is crucial for NLP. We will further focus on text classification, language modeling and text
synthesis.

Obsah kurzu


  • Introduction to natural language processing

  • Chapters from computational linguistics (corpus, tokenization, morphological, syntactic and semantic analysis, entropy, perplexity)

  • Text document vectorization (bag of words, one-hot encoding, TF-IDF)

  • Practical taks on text classification

  • Word embedding (word2vec, GloVe)

  • Introduction to language modelling (n-gram models, smoothing, neural network based language models)

  • Practical task on language modelling (implementation of a language detection algorithm based on language models)

  • Neural network based text generator

Předpoklady


  • Základní znalost programování v Pythonu

  • Středoškolské znalosti lineární algebry, matematické analýzy a teorie pravděpodobnosti. Bude předpokládáno základní porozumění pojmům jako vektor, matice, vektorový prostor, pravděpodobnost, podmíněná pravděpodobnost, nezávislost náhodných jevů a znalost násobení matic a derivace funkcí.

  • Vlastní laptop s předinstalovaným Dockerem.

  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Studijní materiály

V angličtině

Natural Language Processing

Vybraný termín:

11.6.2020  Praha

Cena

Kontaktovat dodavatele


Kontrola proti spamu. Kolik je tři a šest ? Součet zapište číslicemi.