Čištění dat pomocí technologie DataFlux v kostce

Kontakt na dodavatele získáte po registraci

Tento kurz je pořádán dodavatelem, který nevyužívá placenou prezentaci na portálu EduCity.
Kontaktní údaje na dodavatele získáte po registraci. Nebo použijte poptávkový formulář.
Kurz zařazen do kategorií kurzů na míru
Počítačové a IT kurzy Kurzy na míru
  • Kurz na míru

  • ID akce:
    1628122

Popis kurzu na míru Čištění dat pomocí technologie DataFlux v kostce

Tento intenzívní pětidenní kurz je určen zájemcům o získání praktických informací v oblasti DataFluxu a data managementu. Účastníci se naučí jak pomocí DataFlux dfPower Studio zlepšit svá data pomocí metod zkvalitňování, integrace a obohacování dat. Probírán bude také DataFlux Integration Server, obzvláště vzdálené zpracování jobů a zřízení real-time služeb. Dále bude použit nástroj dfPower Customize pro zkoumání Quality Knowledge Base (QKB) komponentů, typů dat a definicí. Jedná se o zrychlený kurz poskytující velké množství informací v krátkém čase (pro zájemce o velmi detailní a pomalejší poznání konkrétních DQ nástrojů jsou k dispozici specializované kurzy).


Přínos pro účastníka

V kurzu se naučíte:

  • profilovat data
  • vylepšovat data aplikováním různých technik čištění dat
  • provádět verifikaci adres
  • kontrolovat proces čištění dat pomocí trendové analýzy a nastavení business pravidel pro monitoring
  • konfigurovat DataFlux Integration Server
  • zpracovávat joby vzdáleným přístupem
  • zřídit real-time služby
  • rozumět komponentům QKB
  • používat editor QKB komponentů
  • rozumět různým definicím

Obsah kurzu


Přehled o dfPower Studio

  • instalace a architektura produktů DataFlux
  • dfPower Studio
  • další komponenty a datové přístupy

DataFlux metodologie: Analýza

  • co je profilování dat/metadat?
  • profilování s dfPower Explorer
  • profilování s dfPower Profile

Úvod do dfPower Architect

  • co je dfPower Architect
  • práce s dfPower Architect

DataFlux metodologie: Kvalita

  • přehled technik datové kvality
  • detaily technik datové kvality
  • standardizace
  • další techniky

DataFlux metodologie: Integrace

  • přehled technik datové integrace
  • detaily technik datové integrace
  • techniky přiřazování

DataFlux metodologie: Obohacování

  • přehled technik datového obohacování
  • detaily technik datového obohacování
  • verifikace adres

DataFlux metodologie: Kontrolní fáze

  • přehled kontrolní fáze
  • trendová analýza a upozornění
  • monitoring business pravidel

Další možnosti dfPower Studio

  • práce s dalšími uzly dfPower architekta
  • dávkové zpracování (samostudium)
  • práce s makro proměnnými (samostudium)
  • práce s vlastními metrikami (samostudium)

Úvod do DataFlux Integration Server

  • příklady využití DataFlux Integration Server
  • konfigurace

Vzdálené zpracovávání jobů

  • dfPower Architekt job
  • uploadování jobů na DataFlux Integration Server
  • zpracování na dalším DataFlux Integration Server

Real-time služby

  • vytvoření služby
  • interakce mezi službami

Úvod do přizpůsobování QKB

  • úvod
  • struktura QKB
  • editory komponent

Definice

  • "parse" definice
  • "match" definice
  • standardizované definice

Další definice

  • "case" definice
  • "gender analysis" definice
  • "identification" definice
  • "pattern analysis" definice

Tvorba nového typu dat (samostudium)