Základní info
Tento kurz je určen především analytikům kvality dat, konzultantům v oblasti datových skladů a specialistům na ETL procesy. Účastníci se v kurzu seznámí s nástroji a způsoby využití aplikace DataFlux dfPower Studio a systému SAS Data Quality Solution pro čištění dat. Při školení se pracuje s platformou SAS Intelligence Platform a s aplikací DataFlux dfPower Studio. Při přihlášení do tohoto kurzu by uživatelé měli:
- mít znalosti z oblasti čištění dat
- znát základy programování SAS
- výhodou (nikoli podmínkou) je znalost práce s aplikací SAS Data Integration Studio
Přínos pro účastníka
Po absolvování by účastník měl být schopen:
- používat aplikaci DataFlux dfPower Studio a systém SAS Data Quality Solution pro čištění dat
- aplikovat techniky profilování dat
- provádět analýzy napříč více tabulkami
- vytvářet a používat standardizační schémata
- parsovat a slučovat hodnoty
- párovat a integrovat data
Obsah kurzu
SAS a kvalita dat
- co je kvalita dat
- metodologie čištění dat
- existující technologie pro čištění dat
Školící data a případové studie
- přehled vzorových dat používaných při školení
- přehled případových studií používaných při školení
Profilování dat
- co je profilování dat
- profilování dat pomocí aplikace dfPower Studio
- profilování dat pomocí aplikace SAS Data Integration Studio
- profilování dat pomocí SAS
Čištění dat: Standardizace
- co je standardizace dat
- standardizace dat pomocí aplikace dfPower Studio
- standardizace dat pomocí aplikace SAS Data Integration Studio
- standardizace dat pomocí SAS
Čištění dat: Další funkce
- další techniky pro řízení kvality a čištění dat
- kvalita a čištění dat pomocí aplikace dfPower Architect
- kvalita a čištění dat pomocí SAS
Integrace dat
- párování a integrace dat
- integrace dat pomocí aplikace dfPower Studio
- integrace dat pomocí aplikace SAS Data Integration Studio
- integrace dat pomocí SAS
Monitorování dat