Kurzusleírás

  1. Scala bevezető

    • Gyors bevezetés a Scalába
    • Laborok: A Scala megismerése
  2. Spark alapok

    • Háttér és történelem
    • Spark és Hadoop
    • Spark fogalmak és architektúra
    • Spark ökoszisztéma (core, spark sql, mlib, streaming)
    • Laborok: Spark telepítése és futtatása
  3. Első pillantás a Sparkra

    • Spark futtatása helyi módban
    • Spark web felület
    • Spark shell
    • Adathalmaz elemzése – 1. rész
    • RDD-k vizsgálata
    • Laborok: Spark shell felfedezése
  4. RDD-k

    • RDD fogalmak
    • Partíciók
    • RDD műveletek / transzformációk
    • RDD típusok
    • Kulcs-érték párok RDD-k
    • MapReduce RDD-n
    • Gyorsítótár és perzisztencia
    • Laborok: RDD-k létrehozása és vizsgálata; RDD-k gyorsítótárazása
  5. Spark API programozás

    • Bevezetés a Spark API / RDD API-ba
    • Az első program elküldése a Sparknak
    • Hibakeresés / naplózás
    • Konfigurációs tulajdonságok
    • Laborok: Programozás a Spark API-ban, feladatok beküldése
  6. Spark SQL

    • SQL támogatás a Sparkban
    • Dataframe-ek
    • Táblák definiálása és adathalmazok importálása
    • Adatkeretek lekérdezése SQL segítségével
    • Tárolási formátumok: JSON / Parquet
    • Laborok: Adatkeretek létrehozása és lekérdezése; adatformátumok értékelése
  7. MLlib

    • MLlib bevezető
    • MLlib algoritmusok
    • Laborok: MLib alkalmazások írása
  8. GraphX

    • GraphX könyvtár áttekintése
    • GraphX API-k
    • Laborok: Graph adatok feldolgozása Spark segítségével
  9. Spark Streaming

    • Streaming áttekintés
    • Streaming platformok értékelése
    • Streaming műveletek
    • Csúszó ablak műveletek
    • Laborok: Spark streaming alkalmazások írása
  10. Spark és Hadoop

    • Hadoop bevezető (HDFS / YARN)
    • Hadoop + Spark architektúra
    • Spark futtatása Hadoop YARN-on
    • HDFS fájlok feldolgozása Spark segítségével
  11. Spark teljesítmény és finomhangolás

    • Broadcast változók
    • Accumulátorok
    • Memóriakezelés & gyorsítótár
  12. Spark műveletek

    • Spark üzembe helyezése éles környezetben
    • Minta üzembehelyezési sablonok
    • Konfigurációk
    • Monitorozás
    • Hibakeresés

Követelmények

ELŐFELTÉTELEK

ismeret a Java / Scala / Python nyelvben (laborjaink Scala és Python nyelven vannak)
alapvető ismeret a Linux fejlesztői környezetről (parancssoros navigáció / fájlszerkesztés VI vagy nano segítségével)

 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (6)

Közelgő kurzusok

Rokon kategóriák