SMACK Stack a Data Science-hez Képzés
A SMACK egy adatplatform szoftverek gyűjteménye, mely Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra és Apache Kafka szoftverekből áll. A SMACK stack használatával felhasználók létrehozhatnak és méretezhettek adatfeldolgozási platformokat.
Ez az oktató által vezetett, élő kormányzás (online vagy helyszíni) adatait tudósokra irányul, akik szeretnék használni a SMACK stack-ot nagy adatmegoldásokhoz.
Ez az oktatási program végére a résztvevők képesek lesznek:
- Adatfeldolgozási architektúra kialakítása nagy adatok kezeléséhez.
- Klüster infrastruktúra fejlesztése Apache Mesos és Docker használatával.
- Adatok elemzése Spark és Scala segítségével.
- Strukturálhatatlan adatok kezelése Apache Cassandra használatával.
A képzés formája
- Interaktív előadás és vita.
- Sok gyakorlat és gyakorlás.
- Élő labor környezetben történő kézi megvalósítás.
Képzés személyre szabási opciói
- Egyéni képzés kérése ehhez a programhoz lépjen kapcsolatba velünk a rendezéséhez.
Kurzusleírás
Bevezetés
SMACK Stack áttekintés
- Mi az Apache Spark? Az Apache Spark funkciói
- Mi az Apache Mesos? Az Apache Mesos funkciói
- Mi az Apache Akka? Az Apache Akka funkciói
- Mi az Apache Cassandra? Az Apache Cassandra funkciói
- Mi az Apache Kafka? Az Apache Kafka funkciói
A Scala programozási nyelv
- A Scala szintaxisa és szerkezete
- A Scala vezérlési szerkezetei
Fejlesztőkörnyezet előkészítése
- A SMACK stack telepítése és konfigurálása
- Docker telepítése és konfigurálása
Apache Akka
- Aktőrok használata
Apache Cassandra
- Olvasási műveletekhez adatbázis létrehozása
- Mentések és visszaállítások kezelése
Kapcsolók
- Adatfolyam létrehozása
- Akka alkalmazás készítése
- Adatok tárolása Cassandra-val
- Kapcsolók áttekintése
Apache Kafka
- Klüster működésének kezelése
- Üzenetek létrehozása, publikálása és fogyasztása
Apache Mesos
- Erőforrások elosztása
- Klüster működésének kezelése
- Apache Aurora és Docker használata
- Szolgáltatások és feladatok futtatása
- Spark, Cassandra és Kafka telepítése Mesos-on
Apache Spark
- Adatfolyamok kezelése
- RDD-k és adattáblák használata
- Adatelemzés végrehajtása
Hibaelhárítás
- Szolgáltatások és hibák kezelése
Összefoglaló és következtetés
Követelmények
- Adatfeldolgozási rendszerek ismerete
Célcsoport
- Adatait tudósok
A nyílt képzésekhez 5+ résztvevő szükséges.
SMACK Stack a Data Science-hez Képzés - Foglalás
SMACK Stack a Data Science-hez Képzés - Érdeklődés
SMACK Stack a Data Science-hez - Érdeklődjön a vezetői tanácsadásról!
Érdeklődjön a vezetői tanácsadásról!
Vélemények (1)
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Közelgő kurzusok
Rokon tanfolyam
Adat tudósok ekoszisztémája
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adatkutatóknak szól, akik a Anaconda ökoszisztémát szeretnék használni csomagok és adatelemzési munkafolyamatok egyetlen platformon történő rögzítésére, kezelésére és üzembe helyezésére.
A képzés végére a résztvevők képesek lesznek:
- Telepítse és konfigurálja a Anaconda összetevőket és könyvtárakat.
- Ismerje meg a Anaconda alapfogalmait, szolgáltatásait és előnyeit.
- Csomagok, környezetek és csatornák kezelése a Anaconda Navigátor segítségével.
- Használja a Conda, R és Python csomagokat az adattudományhoz és a gépi tanuláshoz.
- Ismerjen meg néhány gyakorlati felhasználási esetet és technikát több adatkörnyezet kezeléséhez.
Big Data Üzleti Felismerés a Telekommunikációs és Kommunikációs Szolgáltatók Száma
35 Órákáttekintés
A szolgáltatók (CSP) nyomást gyakorolnak a költségek csökkentésére és az átlagos felhasználói bevétel (ARPU) maximalizálására, miközben kiváló ügyfélélményt biztosítanak, de az adatok mennyisége tovább növekszik. A globális mobil adatforgalom növekedni fog egy kombinált éves növekedési ütemben (CAGR) 78 százalékkal 2016-ra, elérve a 10,8 exabyt havonta.
Eközben a CSP-k nagy mennyiségű adatot generálnak, beleértve a hívási részleteket (CDR), a hálózati adatokat és az ügyféladatokat. Azok a cégek, amelyek teljes mértékben kihasználják ezeket az adatokat, versenyképes küszöböt szereznek. A The Economist Intelligence Unit közelmúltbeli felmérése szerint az adatközpontú döntéshozatalt használó vállalatok 5-6% -os termelékenységnövekedést élveznek. Azonban a vállalatok 53 százaléka csak az értékes adataik felét használja fel, és a megkérdezettek egyharmada megjegyezte, hogy a hasznos adatok hatalmas mennyiségét nem használják fel. Az adatok mennyisége olyan magas, hogy a kézi elemzés lehetetlen, és a legtöbb örökletes szoftverrendszer nem tudja megtartani, ami értékes adatokat hagy el vagy figyelmen kívül hagy.
Big Data & Analytics’ nagy sebességű, méretezhető nagy adat szoftverrel a CSP-k minálhatják az összes adatukat a jobb döntéshozatal érdekében kevesebb idő alatt. Különböző termékek és technikák végső szoftver platformot biztosítanak a nagy adatokból származó betekintések gyűjtésére, előkészítésére, elemzésére és bemutatására. Az alkalmazási területek közé tartozik a hálózati teljesítmény nyomon követése, a csalás kimutatása, az ügyfélhullám kimutatása és a hitelkockázatelemzés. Big Data & Analytics termékek skála kezelni terabytes adatokat, de az ilyen eszközök végrehajtása új típusú felhőalapú adatbázis rendszer, mint a Hadoop vagy a tömeges skála párhuzamos számítógépes processzor ( KPU stb.)
Ez a tanfolyam dolgozik Big Data BI for Telco fedezi az összes feltörekvő új területeket, amelyekben a CSP-k befektetnek a termelékenység növelése és megnyitása új üzleti bevételi áram. A kurzus teljes 360 fokos áttekintést nyújt a Big Data BI-ről a Telco-ban, hogy a döntéshozók és a vezetők nagyon széles és átfogó áttekintést kapjanak a Big Data BI lehetőségekről a Telco-ban a termelékenység és a bevételi nyereség érdekében.
kurzus célkitűzései
A kurzus fő célja, hogy új Big Data üzleti intelligencia technikákat vezessen be 4 ágazatban Telecom Business (Marketing/Sales, Network Operation, Financial Operation és Customer Relation Management). A diákokat be kell mutatni a következőkre:
- Bevezetés Big Data-mi a 4Vs (volumen, sebesség, sokszínűség és valószínűség) a Big Data- Generáció, kivonás és menedzsment a Telco perspektívából
- Hogyan különbözik az elemző az öröklési adatok elemzőjétől
- Otthoni indokolás Big Data -Telco perspektívája
- Bevezetés a Hadoop Ökoszisztéma- ismerkedés az összes Hadoop eszközök, mint a Hive, Pig, SPARC – mikor és hogyan használják megoldani Big Data problémát
- Hogyan Big Data kivonható elemezni az analitikai eszköz-hogyan Business Analysis’s csökkentheti a fájdalompontok gyűjtése és elemzése az adatok révén integrált Hadoop dashboard megközelítés
- Az Insight elemzés, a vizualizációs elemzés és az előrejelzési elemzés alapvető bemutatása a Telco számára
- Az ügyfélszóró elemzés és a Big Data-how Big Data elemzés csökkenti az ügyfélszórót és az ügyfél elégedetlenségét a Telco-ügyvizsgálatokban
- Hálózati hibák és szolgáltatási hibák elemzése a Hálózati meta-adatokból és az IPDR-ből
- Pénzügyi elemzés - csalás, csalás és ROI becslés az értékesítésből és az üzemeltetési adatokból
- Ügyfél beszerzési probléma-cél marketing, ügyfél szegmentáció és cross-sales az értékesítési adatokból
- Bevezetés és összefoglaló az összes Big Data analitikai termékről és arról, hogy hol illeszkednek a Telco analitikai térbe
- Következtetés-hogyan lehet lépésről lépésre megközelíteni Big Data Business Intelligence bevezetését a szervezetbe
Célközönség
- Hálózati üzemeltetések, Pénzügyi Menedzserek, CRM menedzserek és vezető IT menedzserek a Telco CIO irodájában.
- Business Az elemzők a Telco
- CFO irodai menedzserek / elemzők
- Operációs menedzserek
- QA menedzserek
A gyakorlati bemutatkozás a Data Science-ba
35 ÓrákAzok a résztvevők, akik elvégzik ezt a képzést, gyakorlati, valós ismereteket szereznek a Data Science-ről és a kapcsolódó technológiákról, módszertanokról és eszközökről.
A résztvevők gyakorlati gyakorlatokon keresztül lehetőséget kapnak arra, hogy ezt a tudást a gyakorlatba is átültessék. A csoportos interakció és az oktatói visszajelzések az óra fontos részét képezik.
A kurzus a Data Science elemi fogalmainak bemutatásával kezdődik, majd a Data Science-ben használt eszközök és módszertanok felé halad.
Közönség
- Fejlesztők
- Műszaki elemzők
- informatikai tanácsadók
A tanfolyam formátuma
- Rész előadás, részben beszélgetés, gyakorlatok és nehéz gyakorlati gyakorlatok
Jegyzet
- Ha személyre szabott képzést szeretne kérni ehhez a tanfolyamhoz, kérjük, vegye fel velünk a kapcsolatot, hogy megbeszéljük.
Adatbányászat Nagyadat-analitika céljára
35 ÓrákA nagy adat olyan adatkészletek, amelyek annyira terjedelmesek és összetettek, hogy a hagyományos adatfeldolgozó alkalmazásszoftverek nem megfelelőek ezek kezelésére. A nagy adat kihívások között szerepel az adatok rögzítése, az adatok tárolása, az adatok elemzése, a keresés, a megosztás, az átvitel, a megjelenítés, a lekérdezés, a frissítés és az adatvédelem.
Data Science alapjai a Marketing/Sales szakemberek számára
21 ÓrákEz a kurz marketing és eladási szakembereket céloz, akik mélyebben be akarnak menni az adattudomány alkalmazásában a marketing és az eladások területén. A kurz részletes leírást ad a különböző adattudományi technikákról, amelyek "felértékesítés", "keresztárusítás", piaci szegmentálás, márkakeresés és CLV céljából használhatók.
Marketing és eladások különbsége - Milyen módon különböznek az eladások és a marketing?
Nagyon egyszerű szavakban, az eladást úgy is lehet értelmezni, mint egy folyamat, amely egyénekre vagy kisebb csoportokra koncentrál. A marketing viszont nagyobb csoportokat vagy a általános közönséget céloz. A marketing kutatásokat tartalmaz (a vásárlók igényeinek azonosítása), termékfejlesztést (innovatív termékek előállítása) és a termék előmozdítását (hirdetések útján) és tudatosságot teremt a termékről a fogyasztók között. Ennek értelmében a marketing potenciális vevők vagy lehetséges ügyfelek előállítása. Amikor a termék piacra kerül, az eladási személy feladata az, hogy meggyőzze a vásárlókat a termék vásárlásáról. Az eladások azt jelenti, hogy a lehetséges ügyfeleket vagy potenciális vevőket megvásárlásokká és rendelésekké alakítják. A marketing hosszabb távú célokat szerveti, míg az eladások rövidebb távú célokat.
Jupyter for Data Science Teams
7 ÓrákEz interaktív, tanárvezetett képzés Magyarország (online vagy helyszínen) bevezeti a közös fejlesztési folyamatot adattudományokban és bemutatja, hogyan lehet a Jupyter segítségével nyomon követni és részt venni egy csapatban a "számítógépi gondolat élettartamának" folyamában. A résztvevőknek bejárják egy mintapélda létrehozását adattudományi projektnek a Jupyter ekoszisztéma alapján.
A képzés végén a résztvevők képesek lesznek:
- Jupyter telepítésére és konfigurálására, beleértve egy csapat depójának létrehozását és integrálását Git-en.
- Jupyter funkcióinak használatára, mint például bővítmények, interaktív widget-ek, több felhasználós mód és több más, hogy lehetővé tegyék a projekt közös munkáját.
- Jupyter Notebookok létrehozására, megosztására és szervezésére csapattagokkal.
- Scala, Python, R között választhatnak, hogy melyik programozási nyelven írjanak és futtassák le a kódot nagyadattárakkal, mint például Apache Spark, mind a Jupyter felületén keresztül.
Kaggle
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik szeretnének tanulni és karrierjüket a Data Science-ban az Kaggle segítségével építeni.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg az adattudományt és a gépi tanulást.
- Fedezze fel az adatelemzést.
- További információ a Kaggle-ről és annak működéséről.
MATLAB Alapok, Adat tudomány és Jelentésgenerálás
35 ÓrákA képzés első részében bemutatjuk az MATLAB alapjait, valamint nyelvként és platformként való funkcióját. Ez a vita tartalmazza a MATLAB szintaxis, a tömbök és mátrixok, az adatvizualizáció, a szkriptfejlesztés és az objektumorientált elvek bevezetését.
A második részben bemutatjuk, hogyan használható az MATLAB adatbányászathoz, gépi tanuláshoz és prediktív elemzéshez. Annak érdekében, hogy a résztvevők világos és gyakorlatias perspektívát kapjanak MATLAB megközelítéséről és erejéről, összehasonlítjuk az MATLAB és más eszközök, például táblázatok, C, C++ és Visual Basic használatával.
A tréning harmadik részében a résztvevők megtanulják, hogyan lehet egyszerűsíteni munkájukat adatfeldolgozásuk és jelentéskészítésük automatizálásával.
A tanfolyam során a résztvevők gyakorlati gyakorlatok során elsajátított ötleteket a gyakorlatba ültetik át laborkörnyezetben. A képzés végére a résztvevők alaposan átlátják MATLAB képességeit, és képesek lesznek alkalmazni azt valós adattudományi problémák megoldására, valamint munkájuk automatizálással történő egyszerűsítésére.
A tanfolyam során értékeléseket végeznek, hogy felmérjék az előrehaladást.
A tanfolyam formátuma
- A kurzus elméleti és gyakorlati gyakorlatokat tartalmaz, beleértve az esetmegbeszéléseket, a mintakód ellenőrzését és a gyakorlati megvalósítást.
jegyzet
- A gyakorlatok előre meghatározott mintaadatjelentés-sablonokon alapulnak. Ha konkrét igényei vannak, kérjük, vegye fel velünk a kapcsolatot, hogy megbeszéljük.
Machine Learning for Data Science with Python
21 ÓrákEz az oktatóvezetett, élő képzés Magyarország (online vagy helyszínen) célcsoportja az intermediate szintű adatanalitikusok, fejlesztők, vagy azok, akik data scientistként szeretnének dolgozni, és akarnak alkalmazni gépészettudományi technikákat Python-ban adatok elemzéséhez, előrejelzéséhez és automatizálni az adatokból származó döntéseket.
A kurzus végén a résztvevők képesek lesznek:
- Érteni és megkülönböztetni a kulcsfontosságú gépészettudományi paradigmákat.
- Felmérni az adatfeldolgozási technikákat és a modellértékelési mértékeket.
- Alkalmazni gépészettudományi algoritmusokat valós világbeli adatproblémák megoldására.
- Használni Python könyvtárakat és Jupyter notebookokat gyakorlati fejlesztéshez.
- Építeni előrejelzésre, osztályozásra, ajánlásra és csoportosításra szolgáló modelleket.
Python Pandas Munkafolyamatok Gyorsítása Modinnal
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik az Modin segítségével párhuzamos számításokat kívánnak készíteni és megvalósítani a Pandas-vel a gyorsabb adatelemzés érdekében.
A képzés végére a résztvevők képesek lesznek:
- Állítsa be a szükséges környezetet a Pandas munkafolyamatok nagyarányú fejlesztésének megkezdéséhez az Modin segítségével.
- Ismerje meg az Modin szolgáltatásait, felépítését és előnyeit.
- Ismerje meg a különbségeket Modin, Dask és Ray között.
- Hajtsa végre a Pandas műveletet gyorsabban az Modin segítségével.
- Valósítsa meg a teljes Pandas API-t és funkciókat.
Python Programozás a Pénzügyekben
35 ÓrákA Python egy olyan programozási nyelv, amely jelentős népszerűséget szerzett a pénzügyi iparban. A legnagyobb befektetési bankok és hedge alapok által is elterjedt, szerte a világon használják különböző pénzügyi alkalmazásokat létrehozni, melyek a központi kereskedelmi programoktól kezdve az eszközkezelési rendszerekig terjednek.
Ebben az oktatási tanfolyamon résztvevők megtanulhatják, hogyan használják a Python-t a pénzügyekben álló konkrét feladatok megoldására irányított alkalmazások fejlesztésére.
A képzés végére a résztvevők képesek lesznek:
- Érteni a Python programozási nyelv alapjait
- Lekérni, telepíteni és karbantartani a legjobb fejlesztési eszközöket a pénzügyi alkalmazásokhoz Pythonban
- Kiválasztani és felhasználni az egyesleges Python csomagokat és programozási technikákat, hogy rendezhesse, megjeleníthesse és elemezze a pénzügyi adatokat különböző forrásból (CSV, Excel, adatbázis, web, stb.)
- Alkalmazásokat építenek olyan problémák megoldására, mint az eszközkezelés, a kockázatanalízis, a befektetési teljesítmény és még sok mást
- Hibaelhárítást, integrálást, telepítést és optimalizálást végezni egy Python-alkalmazás esetében
Célcsoport
- Fejlesztők
- Analitikusok
- Quant-szektorban dolgozó szakemberek
Képzés formája
- Részben előadás, részben viták, gyakorlatok és intenzív gyakorlódás
Megjegyzés
- Ez a képzés megoldásokat kínál néhány főbb pénzügyi szakszerű problémára. Ha van egy bizonyos téma, eszköz vagy technika, amit hozzá szeretne adni vagy részletesebben elmagyarázni, kérjük, lépjen kapcsolatba velünk a rendezéséhez.
Python adatok tudományában
35 ÓrákA képzési kurzus segítséget nyújt a résztvevőknek a Python Programozással történő Webalkalmazás-fejlesztésre és Adat-Analitika használatára való felkészülésében. Ilyen adatvizualizáció kiváló eszköz a Legfelső Vezetésnek a döntéshozatalban.
GPU adat tudomány NVIDIA RAPIDS-szel
14 ÓrákEz az interaktív képzés Magyarország-ban (online vagy helyszíni) adataitudományosok és fejlesztők számára készült, akik GPU-gyorsított adatfolyamatokat, munkafolyamatozásokat és vizualizációkat szeretnének létrehozni a RAPIDS segítségével, alkalmazva gépi tanulási algoritmusokat, mint például az XGBoost-t és a cuML-ot.
A képzés végére a résztvevők képesek lesznek:
- Beállítani az adatmodellek készítéséhez szükséges fejlesztői környezetet a NVIDIA RAPIDS-szel.
- Megérteni a RAPIDS jellemzőit, összetevőit és előnyeit.
- A GPU-kat felhasználni az adat- és elemzőfolyamatok teljes folyamatának gyorsítására.
- Implementálni a GPU-gyorsított adatelőkészítést és ETL-t a cuDF-vel és az Apache Arrow-val.
- Megtanulni, hogyan végezhetnek gépi tanulási feladatokat XGBoost és cuML algoritmusokkal.
- Készíteni adatvizualizációkat és gráf elemzést a cuXfilter-ral és a cuGraph-ral.
Python and Spark for Big Data (PySpark)
21 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megtanulják, hogyan használhatják a Python-t és a Spark-ot a nagy adatok elemzésére, miközben gyakorlati gyakorlatokon dolgoznak.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg, hogyan használja a Sparkot a Python-val a Big Data elemzéséhez.
- Dolgozz olyan gyakorlatokon, amelyek a valós eseteket utánozzák.
- Használjon különféle eszközöket és technikákat a nagy adatelemzéshez az PySpark segítségével.
Stratio: Rocket és Intelligence Modulok PySpark-vel
14 ÓrákStratio egy adatokra összpontosító platform, amely nagy adatok, mesterséges intelligencia (AI) és kormányzati funkciókat integrál egy egyetlen megoldásba. Az Rocket és Intelligence modullai lehetővé teszik a gyors adatfelfedezést, átalakítást és előrehaladott analitikai feladatok végrehajtását vállalati környezetekben.
Ez az oktatóvezetett élő tanfolyam (online vagy helyszínen) középszerű szintű adatszakembereknek szól, akik hatékonyan szeretnék használni az Stratio Rocket és Intelligence modullait PySpark-al, a ciklusok, felhasználódefiniált függvények és előrehaladott adatlogika hangsúlyozásával.
E tanfolyam végére a résztvevők képesek lesznek:
- Navigálni és dolgozni az Stratio platformon az Rocket és Intelligence modullal.
- Alkalmazni PySpark-t az adatbefogadás, átalakítás és elemzés kontextusában.
- Ciklusokat és feltételes logikát használni az adatfolyamok és a jellemzők generálásának ellenőrzéséhez.
- Létrehozni és kezelni felhasználódefiniált függvényeket (UDF) ismételten felhasználható adatműveletekhez PySpark-ban.
A tanfolyam formátuma
- Interaktív előadás és beszélgetés.
- Sokat gyakorolunk és gyakorolunk.
- Kézbesített implementáció élő laboratóriumi környezetben.
A tanfolyam testreszabási lehetőségei
- Egy testreszabott tanfolyam kéréséhez kérjük, lépjen kapcsolatba velünk.