PySpark – analýza velkých dat v Databricks

Kurzem Vás provede některý z odborných lektorů společnosti ICT Pro.

Základní info

Popis kurzu

Pracujete s daty v Excelu, Power Query, SQL nebo Pandas a potřebujete zpracovat gigabajty až terabajty dat? PySpark je Python rozhraní pro Apache Spark – nástroj, který zpracovává Big Data, a zvládne i to, co se nevejde do paměti jednoho počítače.

Workshop probíhá kompletně v prostředí Databricks Community Edition – žádná instalace, vše v prohlížeči. Naučíte se pracovat s PySpark DataFrame API a Spark SQL. Využijete své znalosti z SQL, syntaxe Vám bude povědomá.

Obsah kurzu

  • Začínáme s Databricks
  • DataFrame – základní operace
  • Spark SQL
  • Zdroje dat
  • Zpracování dat
  • Agregace dat
  • Řešení chyb
  • Výstupy a export dat

Předpoklady

Základy Pythonu (proměnné, cykly, funkce). Zkušenost s SQL, Excel, Power Query nebo Pandas výhodou.

PySpark – analýza velkých dat v Databricks

Vybraný termín:

1.10.2026 –  2.10.2026  Praha Upřesnující informace k termínu

Cena
10 800 Kč + 21% DPH

Kontaktovat dodavatele


Kontrola proti spamu. Kolik je dvě a devět ? Součet zapište číslicemi.