Data Mining with R Képzés
R egy nyílt forráskódú programozási nyelv a statisztikai számításokhoz, az adatok elemzéséhez és a grafikákhoz. Az R-t egyre nagyobb számú vezető és adatelemző használja a vállalatokon és az egyetemeken. R sokféle csomagot tartalmaz az adatbányászathoz.
Kurzusleírás
A módszerek forrásai
- Mesterséges intelligencia
- Gépi tanulás
- Statistics
- Adatforrások
Az adatok előfeldolgozása
- Adatok importálása/exportálása
- Adatfeltárás és vizualizáció
- Dimenziócsökkentés
- A hiányzó értékek kezelése
- R csomagok
Az adatbányászat főbb feladatai
- Nagy mennyiségű adat automatikus vagy félautomata elemzése
- Korábban ismeretlen érdekes minták kinyerése
- adatrekordok csoportjai (klaszteranalízis)
- szokatlan rekordok (rendellenességek észlelése)
- függőségek (társítási szabály bányászat)
Adatbányászat
- Anomália észlelése (kiugró/változás/eltérés észlelése)
- Az asszociációs szabályok tanulása (függőségi modellezés)
- Klaszterezés
- Osztályozás
- Regresszió
- Összegzés
- Gyakori mintabányászat
- Szövegbányászat
- Döntésfák
- Regresszió
- Neural Networks
- Sequence Mining
- Gyakori mintabányászat
Adatkotrás, adathalászat, adatkutatás
Követelmények
Jó R tudás.
A nyílt képzésekhez 5+ résztvevő szükséges.
Data Mining with R Képzés - Booking
Data Mining with R Képzés - Enquiry
Data Mining with R - Érdeklődjön a vezetői tanácsadásról!
Érdeklődjön a vezetői tanácsadásról!
Vélemények (1)
Very tailored to needs.
Yashan Wang
Kurzus - Data Mining with R
Gépi fordítás
Közelgő kurzusok
Rokon tanfolyam
From Data to Decision with Big Data and Predictive Analytics
21 ÓrákKözönség
Ha megpróbálja megérteni az adatokból, amelyekhez hozzáférhet, vagy elemezni kívánja a net strukturált adatokat (például Twitter, Linked in, stb.), Ez a kurzus az Ön számára.
Leginkább a döntéshozóknak és azoknak az embereknek szól, akiknek ki kell választaniuk, hogy milyen adatokat érdemes gyűjteni és mit érdemes elemezni.
Nem a megoldást konfiguráló emberekre irányul.
Szállítási mód
A tanfolyam során a küldöttek többnyire nyílt forráskódú technológiákkal foglalkozó példákat mutatnak be.
A rövid előadásokat előadások és egyszerű gyakorlatok követik a résztvevők
Tartalom és szoftver
Minden használt szoftver frissül minden alkalommal, amikor a kurzust futtatják, így ellenőrizzük a legújabb verziókat.
Ez az adatgyűjtés, -formázás, -feldolgozás és -elemzés folyamatát foglalja magában, hogy elmagyarázza, hogyan automatizálható a döntéshozatali folyamat a gépi tanulással.
Data Mining and Analysis
28 ÓrákCélkitűzés:
A küldöttek képesek nagy adathalmazokat elemezni, mintákat kivonni, kiválasztani az eredményeket befolyásoló megfelelő változót, így egy új modell előrejelzése prediktív eredményekkel történik.
Data Mining
21 ÓrákA kurzus bármely eszközzel, beleértve az ingyenes nyílt forrású adatbányászati szoftvereket és alkalmazásokat is biztosítja
Data Mining with Python
14 ÓrákEz az oktató által vezetett, élő képzés (online vagy helyszíni) azoknak az adatelemzőknek és adattudósoknak szól, akik fejlettebb adatelemzési technikákat kívánnak megvalósítani az adatbányászatban a Python használatával.
A képzés végére a résztvevők képesek lesznek:
- Megérteni az adatbányászat fontos területeit, beleértve az asszociációs szabálybányászatot, a szöveges véleményelemzést, az automatikus szövegszintézist és az adatok rendellenességeinek felismerését.
- Összehasonlítani és megvalósítani a különböző stratégiákat a valós adatbányászati problémák megoldásához.
- Megérteni és értelmezni az eredményeket.
A tanfolyam formátuma
- Interaktív előadás és vitafórum.
- Rengeteg gyakorlat és feladat.
- Gyakorlati implementáció egy élő labor környezetben.
Tanfolyam testreszabási lehetőségek
- Ha testreszabott képzést szeretne igényelni ehhez a tanfolyamhoz, kérjük, vegye fel velünk a kapcsolatot a megbeszéléshez.
Data Vault: Building a Scalable Data Warehouse
28 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megtanulják, hogyan kell Data Vault-et építeni.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg az Data Vault 2.0 mögött meghúzódó architektúra és tervezési koncepciókat, valamint annak interakcióját a Big Data, NoSQL és AI között.
- Használjon adattároló technikákat, hogy lehetővé tegye az adattárházban lévő előzményadatok auditálását, nyomon követését és ellenőrzését.
- Konzisztens és megismételhető ETL (Extract, Transform, Load) folyamat kialakítása.
- Építsen és telepítsen nagymértékben méretezhető és megismételhető raktárakat.
Data Visualization
28 ÓrákEz a kurzus mérnökök és döntéshozók számára készült, akik az adatbányászatban és a tudásmegismerésben dolgoznak.
Megtanulhatja, hogyan hozhat létre hatékony telkeket, és hogyan jelenítheti meg és jelenítheti meg adatait oly módon, hogy a döntéshozókhoz forduljon, és segítsen nekik megérteni a rejtett információkat.
Data Mining & Machine Learning with R
14 ÓrákAz R egy nyílt forráskódú ingyenes programozási nyelv statisztikai számításokhoz, adatelemzésekhez és grafikákhoz. Az R-t egyre több menedzser és adatelemző használja a vállalatokon és a tudományos életen belül. Az R-nek sokféle csomagja van az adatbányászathoz.
Data Science for Big Data Analytics
35 ÓrákA nagy adat olyan adatkészletek, amelyek annyira terjedelmesek és összetettek, hogy a hagyományos adatfeldolgozó alkalmazásszoftverek nem megfelelőek ezek kezelésére. A nagy adat kihívások között szerepel az adatok rögzítése, az adatok tárolása, az adatok elemzése, a keresés, a megosztás, az átvitel, a megjelenítés, a lekérdezés, a frissítés és az adatvédelem.
Foundation R
7 ÓrákEz az oktató által vezetett, élő tanfolyam a Magyarország-ban (online vagy helyszíni) olyan kezdő szintű professzionálisoknak készült, akik el szeretnének érni R alapjainak és az adatokkal való munkával kapcsolatos mesterségét.
Ez a tanfolyam végén a résztvevők képesek lesznek:
- R programozási környezetére és RStudio felületére megfelelően reagálni.
- Adatészleleteket importálni, manipulálni és kereskedelem R parancsokkal és csomaggal.
- Fundamentális statisztikai elemzést végezni és az adatösszegzést elvégezni.
- Alapértelmezett R-val és ggplot2-vel készítse el a vizualizációkat.
- Munkaterületeket, szkripteket és csomagokat hatékonyan kezelni.
KNIME Analytics Platform for BI
21 ÓrákKNIME Analytics Platform az adatközpontú innováció egyik vezető nyílt forráskódú lehetősége, amely segít felfedezni az adatokban rejtett lehetőségeket, új betekintést engedhet meg, vagy új jövőbeli lehetőségeket KNIME előre jelezni. A KNIME Analytics Platform több mint 1000 modullal, több száz kész példánnyal, integrált eszközök átfogó választékával és a rendelkezésre álló legfejlettebb algoritmusok széles választékával tökéletes eszközkészlet minden KNIME és üzleti elemző számára.
Ez a tanfolyam a KNIME Analytics Platform számára ideális lehetőség kezdőknek, haladó felhasználóknak és KNIME szakértőknek a KNIME , a hatékonyabb felhasználás megtanulására, valamint a KNIME munkafolyamatok alapján világos, átfogó jelentések készítésére.
Oracle SQL Intermediate - Data Extraction
14 ÓrákA kurzus célja, hogy a résztvevők elsajátítsák, hogyan kell dolgozni az SQL nyelvvel a Oracle adatbázisban középszintű adatkinyeréshez.
Process Mining
21 ÓrákA folyamatbányászat vagy a Automated Business Process Discovery (ABPD) olyan technika, amely algoritmusokat alkalmaz az eseménynaplókra az üzleti folyamatok elemzése céljából. A folyamatbányászat túlmutat az adattároláson és az adatelemzésen; áthidalja az adatokat a folyamatokkal, és betekintést nyújt a folyamatok hatékonyságát befolyásoló trendekbe és mintákba.
A tanfolyam formátuma
- A tanfolyam a folyamatbányászat leggyakrabban használt technikáinak áttekintésével kezdődik. Megbeszéljük a folyamatok nyers eseményadatokon alapuló felfedezésére és modellezésére használt különféle folyamatfelderítési algoritmusokat és eszközöket. Valós esettanulmányok vizsgálata és adatkészletek elemzése a ProM nyílt forráskódú keretrendszer segítségével történik.
Introductory R for Biologists
28 ÓrákR egy nyílt forráskódú programozási nyelv a statisztikai számításokhoz, az adatok elemzéséhez és a grafikákhoz. Az R-t egyre nagyobb számú vezető és adatelemző használja a vállalatokon és az egyetemeken. R a statisztikusok, a mérnökök és a tudósok között is találnak követőket számítógépes programozási készségek nélkül, akik könnyen használhatók. A népszerűsége annak köszönhető, hogy az adatbányászat egyre növekvő mértékben használja a különböző célokat, például a hirdetési árakat, az új gyógyszerek gyorsabb felkutatását vagy a pénzügyi modellek finomhangolását. R sokféle csomagot tartalmaz az adatbányászathoz.
Statistics with SPSS Predictive Analytics Software
14 ÓrákGoal:
Az SPSS-sel való munkavégzés megtanulása a függetlenség szintjén
A címzettek:
Elemzők, kutatók, tudósok, hallgatók és mindazok, akik szeretnék elsajátítani az SPSS csomag használatának képességét és elsajátítani a népszerű adatbányászati technikákat.
Introduction to Data Visualization with Tidyverse and R
7 ÓrákCélközönség
Kurzus formátuma
A kurzus végére a résztvevők képesek lesznek:
Ebben az oktatóvezetett élő képzésben a résztvevők megtanulják, hogyan manipulálhatják és vizualizálhatják az adatokat a Tidyverse-ban található eszközök segítségével.
A Tidyverse egy sokoldalú R csomaggyűjtemény az adatok tisztítására, feldolgozására, modellzésére és vizualizálására. Ide tartozik többek között: ggplot2, dplyr, tidyr, readr, purrr és tibble.
- Kezdők az R nyelvben
- Kezdők az adatelemzés és adatok vizualizálás terén
- Résztvevők részére előadások, beszélgetések, gyakorlatok és intenzív gyakorlati feladatok
- Adatelemzés végrehajtása és vonzó vizualizációk készítése
- Hasznos következtetések levonása különböző adatbázisokból
- Adatok szűrése, rendezése és összegzése kutatási kérdések megválaszolására
- Feldolgozott adatok átalakítása informatív vonaldiagramokká, oszlopdiagramokká, hisztogramokká
- Adatok importálása és szűrése különböző forrásokból, beleértve a Excel, CSV és SPSS fájlokat
Bevezetés a Data Visualization-be a Tidyverse-val és R-vel
Záró megjegyzések
Adatok csoportosítása és összefoglalása
Adatok importálása és szűrése
Bevezetés
Adatbázis előkészítése
Munkakörnyezet beállítása
Adatok vizualizálása (görbék, szórtáblák)
Adatok vizualizálása (vonalak, oszlopdiagramok, hisztogramok, dobozábrák)
Nem szokványos adatok kezelése
Adatok formázása
- Tidyverse vs hagyományos R grafikonok
Célközönség
Kurzus formátuma
A kurzus végére a résztvevők képesek lesznek:
Ebben az oktatóvezetett élő képzésben a résztvevők megtanulják, hogyan manipulálhatják és vizualizálhatják az adatokat a Tidyverse-ban található eszközök segítségével.
A Tidyverse egy sokoldalú R csomaggyűjtemény az adatok tisztítására, feldolgozására, modellzésére és vizualizálására. Ide tartozik többek között: ggplot2, dplyr, tidyr, readr, purrr és tibble.
- Kezdők az R nyelvben
- Kezdők az adatelemzés és adatok vizualizálás terén
- Résztvevők részére előadások, beszélgetések, gyakorlatok és intenzív gyakorlati feladatok
- Adatelemzés végrehajtása és vonzó vizualizációk készítése
- Hasznos következtetések levonása különböző adatbázisokból
- Adatok szűrése, rendezése és összegzése kutatási kérdések megválaszolására
- Feldolgozott adatok átalakítása informatív vonaldiagramokká, oszlopdiagramokká, hisztogramokká
- Adatok importálása és szűrése különböző forrásokból, beleértve a Excel, CSV és SPSS fájlokat
- Nem szükséges programozási tapasztalat