Nabídka tohoto termínu kurzu již není aktuální. Podobné kurzy naleznete zde.

Text mining

Základní info

Tradiční dataminingové postupy umožňují extrahovat a využít užitečnou informaci z elektronických dat uložených ve strukturovaném tabulkovém formátu. Většina elektronických dat je však nestrukturovaná. Textové dokumenty, jako jsou například emaily, novinové články, vědecké publikace, zápisky z call center, korespondence na sociálních sítích nebo jen komentáře k produktům, nabízejí také množství skryté informace, jež může významně zkvalitnit dataminingové predikce. Skrytou informaci v textech je třeba extrahovat do strukturovaných atributů, aby se dala použít pro následné modelování. Díky vlastnostem přirozených jazyků je extrakce klíčových atributů z textu značně specifická, atributy musí být navíc citlivě vybrány i s ohledem na řešenou textminingovou úlohu.

Cíl vzdělávacího programu:

Textminingový kurz seznámí účastníky s metodami extrakce klíčových vlastností z textu a s jejich využitím při predikčním modelování. Pro extrakci vlastností z textu budeme používat pokročilé metody statistického zpracování přirozených jazyků (NLP). Ty umožní detekovat koncepty a skrytá témata, která lze díky variabilitě a bohaté slovní zásobě přirozených jazyků vyjádřit mnoha způsoby. V kurzu budou probírány extrakce příznaků na různých úrovních: od písmenných skupin zvaných n-gramy přes termíny až po komplexní kombinace konceptů a jejich vlastností. Příkladem extrakce komplexních vzorů z textu může být analýza sentimentu, kdy rozeznáváme kladné a záporné postoje autora. Metody statistického zpracování přirozených jazyků musí být nezbytně podporovány mnoha lingvistickými zdroji ve formátu slovníků a knihoven. Účastníci se seznámí i s touto oporou, aby byli schopni vhodně vybrat a případně modifikovat lingvistické zdroje pro konkrétní úlohu.

Kurz je určen:

Kurz je určen pro analytiky, marketingové pracovníky, žurnalisty a vyšetřovatele, kteří potřebují zpracovat větší množství textů, aniž by museli všechny dokumenty přečíst, a využít získanou informaci k rozhodování.

Program kurzu:

  1. úlohy text miningu
  2. strukturovaná reprezentace textových dokumentů
  3. získání a indexace textové kolekce
  4. procedury zpracování textu a jejich řazení
  5. extrakce konceptů, jejich vlastností a komplexních vzorů
  6. redukce dimenzionality extrahovaných příznaků
  7. analýza dokumentů
  8. konstrukce predikčních modelů
  9. správa a modifikace lingvistických zdrojů

Text mining

Vybraný termín:

15.11.2023  Praha 1 Upřesnující informace k termínu
09:00 – 16:30 hod.

Cena
6 800 Kč + 21% DPH

Kontaktovat dodavatele


Kontrola proti spamu. Kolik je tři a jedna ? Součet zapište číslicemi.