Kurzusleírás

Bevezetés

    Data Science Az adatkutató szerepei és felelősségei

A fejlesztési környezet előkészítése

    Könyvtárak, keretrendszerek, nyelvek és eszközök Helyi fejlesztés Együttműködő web alapú fejlesztés

Adatgyűjtés

    Különféle típusú adatok strukturált helyi adatbázisok Adatbázis-összekötők Általános formátumok: xlxs, XML, Json, csv, ...
Strukturálatlan kattintások, cenzorok, okostelefonok
  • API-k
  • Internet of Things (IoT)
  • Dokumentumok, képek, videók, hangok
  • Esettanulmány: Nagy mennyiségű strukturálatlan adat folyamatos gyűjtése
  • AdattárolásRelációs adatbázisok Nem relációs adatbázisok Hadoop: Distributed File System (HDFS) Spark: Resilient Distributed Dataset (RDD) Felhőalapú tárolás
  • Adatok előkészítése
  • Felvétel, kiválasztás, tisztítás és átalakítás Az adatok minőségének biztosítása – helyesség, értelmesség és biztonság Kivételjelentések

      Languages Előkészítéshez, feldolgozáshoz és elemzéshez használják

    R nyelv Az R bemutatása Adatkezelés, számítás és grafikus megjelenítés

      Python Bevezetés a Python-ba

    Adatok kezelése, feldolgozása, tisztítása és roppantása

      Adatelemzés
    Feltáró elemzés Alapvető statisztika Vizualizációk vázlata Adatok megértése
  • Kauzalitás
  • Jellemzők és átalakítások
  • Machine Learning Felügyelt és nem felügyelt

      Mikor milyen modellt kell használni
    Natural Language Processing (NLP)
  • Data Visualization
  • Bevált gyakorlatok A megfelelő diagram kiválasztása a megfelelő adatokhoz Színes paletták Új szintre emelés Irányítópultok Interaktív vizualizációk
  • Mesélés adatokkal
  • Összefoglalás, és következtetés
  • Követelmények

    • Az adatbázis-fogalmak általános ismerete
    • A statisztika alapvető ismerete
     35 Órák

    Résztvevők száma


    Ár per résztvevő

    Vélemények (2)

    Közelgő kurzusok

    Rokon kategóriák