SMACK Stack for Data Science Képzés
A SMACK az adatplatform szoftverek gyűjteménye, nevezetesen Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, és Apache Kafka. A SMACK stack használatával a felhasználók létrehozhatják és méretezhetik az adatfeldolgozó platformokat.
Ez az oktató által vezetett, élő képzés (online vagy on-site) olyan adattudósokra irányul, akik a SMACK stack-t szeretnék használni az adatfeldolgozó platformok létrehozásához a nagy adatmegoldásokhoz.
A képzés befejezése után a résztvevők képesek lesznek:
- A nagy adatok feldolgozására szolgáló adatcsövek architektúrájának megvalósítása.
- Fejleszteni a klaszter infrastruktúráját Apache Mesos és Docker.
- Az adatok elemzése a Spark és Scala segítségével.
- A nem strukturált adatok kezelése az Apache segítségével Cassandra.
A kurzus formája
- Interaktív előadás és vita.
- Rengeteg gyakorlat és gyakorlat.
- Hands-on megvalósítás egy élő laboratóriumi környezetben.
Szakképesítési lehetőségek
- Ahhoz, hogy egy személyre szabott képzést kérjen erre a kurzusra, kérjük, vegye fel velünk a kapcsolatot a rendezéshez.
Kurzusleírás
Bevezetés
SMACK verem áttekintése
- Mi az a Apache Spark? Apache Spark jellemzői
- Mi az a Apache Mesos? Apache Mesos jellemzői
- Mi az Apache Akka? Apache Akka jellemzői
- Mi az Apache Cassandra? Apache Cassandra jellemzői
- Mi az Apache Kafka? Apache Kafka jellemzői
Scala Nyelv
- Scala szintaxis és szerkezet
- Scala szabályozza az áramlást
Fejlesztési környezet előkészítése
- A SMACK verem telepítése és konfigurálása
- Telepítés és konfigurálás Docker
Apache Akka
- Színészek használata
Apache Cassandra
- Adatbázis létrehozása az olvasási műveletekhez
- Biztonsági mentésekkel és helyreállítással végzett munka
Csatlakozók
- Stream létrehozása
- Akka alkalmazás készítése
- Adatok tárolása a Cassandra segítségével
- Csatlakozók áttekintése
Apache Kafka
- Klaszterekkel végzett munka
- Üzenetek létrehozása, közzététele és fogyasztása
Apache Mesos
- Erőforrások elosztása
- Futó klaszterek
- Az Apache Aurora és Docker
- Szolgáltatások és munkák működtetése
- Spark, Cassandra és Kafka telepítése a Mesoson
Apache Spark
- Adatfolyamok kezelése
- Munka RDD-kkel és adatkeretekkel
- Adatelemzés végrehajtása
Hibaelhárítás
- Szolgáltatási hibák és hibák kezelése
Összefoglalás, és következtetés
Követelmények
- Az adatfeldolgozó rendszerek ismerete
Közönség
- Adattudósok
A nyílt képzésekhez 5+ résztvevő szükséges.
SMACK Stack for Data Science Képzés - Booking
SMACK Stack for Data Science Képzés - Enquiry
SMACK Stack for Data Science - Érdeklődjön a vezetői tanácsadásról!
Érdeklődjön a vezetői tanácsadásról!
Vélemények (1)
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Közelgő kurzusok
Rokon tanfolyam
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 ÓrákEz a kurzus azoknak a fejlesztőknek és adattudósoknak szól, akik szeretnék megérteni és megvalósítani a mesterséges intelligenciát alkalmazásaikban. Különös hangsúlyt kap az adatelemzés, az elosztott mesterséges intelligencia és a természetes nyelvi feldolgozás.
Anaconda Ecosystem for Data Scientists
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adatkutatóknak szól, akik a Anaconda ökoszisztémát szeretnék használni csomagok és adatelemzési munkafolyamatok egyetlen platformon történő rögzítésére, kezelésére és üzembe helyezésére.
A képzés végére a résztvevők képesek lesznek:
- Telepítse és konfigurálja a Anaconda összetevőket és könyvtárakat.
- Ismerje meg a Anaconda alapfogalmait, szolgáltatásait és előnyeit.
- Csomagok, környezetek és csatornák kezelése a Anaconda Navigátor segítségével.
- Használja a Conda, R és Python csomagokat az adattudományhoz és a gépi tanuláshoz.
- Ismerjen meg néhány gyakorlati felhasználási esetet és technikát több adatkörnyezet kezeléséhez.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 Órákáttekintés
A szolgáltatók (CSP) nyomást gyakorolnak a költségek csökkentésére és az átlagos felhasználói bevétel (ARPU) maximalizálására, miközben kiváló ügyfélélményt biztosítanak, de az adatok mennyisége tovább növekszik. A globális mobil adatforgalom növekedni fog egy kombinált éves növekedési ütemben (CAGR) 78 százalékkal 2016-ra, elérve a 10,8 exabyt havonta.
Eközben a CSP-k nagy mennyiségű adatot generálnak, beleértve a hívási részleteket (CDR), a hálózati adatokat és az ügyféladatokat. Azok a cégek, amelyek teljes mértékben kihasználják ezeket az adatokat, versenyképes küszöböt szereznek. A The Economist Intelligence Unit közelmúltbeli felmérése szerint az adatközpontú döntéshozatalt használó vállalatok 5-6% -os termelékenységnövekedést élveznek. Azonban a vállalatok 53 százaléka csak az értékes adataik felét használja fel, és a megkérdezettek egyharmada megjegyezte, hogy a hasznos adatok hatalmas mennyiségét nem használják fel. Az adatok mennyisége olyan magas, hogy a kézi elemzés lehetetlen, és a legtöbb örökletes szoftverrendszer nem tudja megtartani, ami értékes adatokat hagy el vagy figyelmen kívül hagy.
Big Data & Analytics’ nagy sebességű, méretezhető nagy adat szoftverrel a CSP-k minálhatják az összes adatukat a jobb döntéshozatal érdekében kevesebb idő alatt. Különböző termékek és technikák végső szoftver platformot biztosítanak a nagy adatokból származó betekintések gyűjtésére, előkészítésére, elemzésére és bemutatására. Az alkalmazási területek közé tartozik a hálózati teljesítmény nyomon követése, a csalás kimutatása, az ügyfélhullám kimutatása és a hitelkockázatelemzés. Big Data & Analytics termékek skála kezelni terabytes adatokat, de az ilyen eszközök végrehajtása új típusú felhőalapú adatbázis rendszer, mint a Hadoop vagy a tömeges skála párhuzamos számítógépes processzor ( KPU stb.)
Ez a tanfolyam dolgozik Big Data BI for Telco fedezi az összes feltörekvő új területeket, amelyekben a CSP-k befektetnek a termelékenység növelése és megnyitása új üzleti bevételi áram. A kurzus teljes 360 fokos áttekintést nyújt a Big Data BI-ről a Telco-ban, hogy a döntéshozók és a vezetők nagyon széles és átfogó áttekintést kapjanak a Big Data BI lehetőségekről a Telco-ban a termelékenység és a bevételi nyereség érdekében.
kurzus célkitűzései
A kurzus fő célja, hogy új Big Data üzleti intelligencia technikákat vezessen be 4 ágazatban Telecom Business (Marketing/Sales, Network Operation, Financial Operation és Customer Relation Management). A diákokat be kell mutatni a következőkre:
- Bevezetés Big Data-mi a 4Vs (volumen, sebesség, sokszínűség és valószínűség) a Big Data- Generáció, kivonás és menedzsment a Telco perspektívából
- Hogyan különbözik az elemző az öröklési adatok elemzőjétől
- Otthoni indokolás Big Data -Telco perspektívája
- Bevezetés a Hadoop Ökoszisztéma- ismerkedés az összes Hadoop eszközök, mint a Hive, Pig, SPARC – mikor és hogyan használják megoldani Big Data problémát
- Hogyan Big Data kivonható elemezni az analitikai eszköz-hogyan Business Analysis’s csökkentheti a fájdalompontok gyűjtése és elemzése az adatok révén integrált Hadoop dashboard megközelítés
- Az Insight elemzés, a vizualizációs elemzés és az előrejelzési elemzés alapvető bemutatása a Telco számára
- Az ügyfélszóró elemzés és a Big Data-how Big Data elemzés csökkenti az ügyfélszórót és az ügyfél elégedetlenségét a Telco-ügyvizsgálatokban
- Hálózati hibák és szolgáltatási hibák elemzése a Hálózati meta-adatokból és az IPDR-ből
- Pénzügyi elemzés - csalás, csalás és ROI becslés az értékesítésből és az üzemeltetési adatokból
- Ügyfél beszerzési probléma-cél marketing, ügyfél szegmentáció és cross-sales az értékesítési adatokból
- Bevezetés és összefoglaló az összes Big Data analitikai termékről és arról, hogy hol illeszkednek a Telco analitikai térbe
- Következtetés-hogyan lehet lépésről lépésre megközelíteni Big Data Business Intelligence bevezetését a szervezetbe
Célközönség
- Hálózati üzemeltetések, Pénzügyi Menedzserek, CRM menedzserek és vezető IT menedzserek a Telco CIO irodájában.
- Business Az elemzők a Telco
- CFO irodai menedzserek / elemzők
- Operációs menedzserek
- QA menedzserek
Data Science for Big Data Analytics
35 ÓrákA nagy adat olyan adatkészletek, amelyek annyira terjedelmesek és összetettek, hogy a hagyományos adatfeldolgozó alkalmazásszoftverek nem megfelelőek ezek kezelésére. A nagy adat kihívások között szerepel az adatok rögzítése, az adatok tárolása, az adatok elemzése, a keresés, a megosztás, az átvitel, a megjelenítés, a lekérdezés, a frissítés és az adatvédelem.
Data Science essential for Marketing/Sales professionals
21 ÓrákEz a kurzus azoknak a Marketing értékesítési szakembereknek szól, akik szeretnének mélyebben elmerülni az adattudomány alkalmazásában a Marketing/ Értékesítés területén. A kurzus részletes ismertetést nyújt az „upsale”, „cross-sale”, piacszegmentáció, márkaépítés és CLV különböző adattudományi technikáiról.
A Marketing és az értékesítés különbsége – Miben különbözik az értékesítés és a marketing?
Nagyon leegyszerűsítve az értékesítést olyan folyamatnak nevezhetjük, amely egyénekre vagy kis csoportokra összpontosít vagy céloz. Marketing másrészt egy nagyobb csoportot vagy a nagyközönséget céloz meg. Marketing magában foglalja a kutatást (a vevő igényeinek azonosítása), a termékfejlesztést (innovatív termékek előállítása) és a termék népszerűsítését (reklámokon keresztül), valamint a termékkel kapcsolatos tudatosság kialakítását a fogyasztók körében. Mivel az ilyen marketing potenciális ügyfelek vagy potenciális ügyfelek generálását jelenti. Miután a termék kikerült a piacra, az értékesítő feladata, hogy rávegye a vásárlót a termék megvásárlására. Az értékesítés azt jelenti, hogy a leadeket vagy potenciális ügyfeleket vásárlásokká és megrendelésekké alakítják, míg a marketing hosszabb távú, az értékesítés rövidebb célokra irányul.
Introduction to Graph Computing
28 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megismerkedhetnek a technológiai kínálatokkal és a grafikonadatok feldolgozásának megvalósítási módszereivel. A cél a valós objektumok, jellemzőik és kapcsolataik azonosítása, majd a kapcsolatok modellezése és adatként való feldolgozása Graph Computing (más néven Graph Analytics) megközelítéssel. Kezdjük egy átfogó áttekintéssel, és leszűkítjük a konkrét eszközöket, miközben esettanulmányok, gyakorlati gyakorlatok és élő telepítések sorozatán lépkedünk végig.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg a grafikonadatok megőrzését és bejárását.
- Válassza ki a legjobb keretrendszert egy adott feladathoz (a gráfadatbázisoktól a kötegelt feldolgozási keretrendszerekig).
- A Hadoop, a Spark, GraphX és a Pregel megvalósítása számos gépen párhuzamosan végezhet gráfszámítást.
- Tekintse meg a valós világban felmerülő big data problémákat grafikonok, folyamatok és bejárások formájában.
Jupyter for Data Science Teams
7 ÓrákThis instructor-led, live training in Magyarország (online or onsite) introduces the idea of collaborative development in data science and demonstrates how to use Jupyter to track and participate as a team in the "life cycle of a computational idea". It walks participants through the creation of a sample data science project based on top of the Jupyter ecosystem.
By the end of this training, participants will be able to:
- Install and configure Jupyter, including the creation and integration of a team repository on Git.
- Use Jupyter features such as extensions, interactive widgets, multiuser mode and more to enable project collaboraton.
- Create, share and organize Jupyter Notebooks with team members.
- Choose from Scala, Python, R, to write and execute code against big data systems such as Apache Spark, all through the Jupyter interface.
Kaggle
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik szeretnének tanulni és karrierjüket a Data Science-ban az Kaggle segítségével építeni.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg az adattudományt és a gépi tanulást.
- Fedezze fel az adatelemzést.
- További információ a Kaggle-ről és annak működéséről.
MATLAB Fundamentals, Data Science & Report Generation
35 ÓrákA képzés első részében bemutatjuk az MATLAB alapjait, valamint nyelvként és platformként való funkcióját. Ez a vita tartalmazza a MATLAB szintaxis, a tömbök és mátrixok, az adatvizualizáció, a szkriptfejlesztés és az objektumorientált elvek bevezetését.
A második részben bemutatjuk, hogyan használható az MATLAB adatbányászathoz, gépi tanuláshoz és prediktív elemzéshez. Annak érdekében, hogy a résztvevők világos és gyakorlatias perspektívát kapjanak MATLAB megközelítéséről és erejéről, összehasonlítjuk az MATLAB és más eszközök, például táblázatok, C, C++ és Visual Basic használatával.
A tréning harmadik részében a résztvevők megtanulják, hogyan lehet egyszerűsíteni munkájukat adatfeldolgozásuk és jelentéskészítésük automatizálásával.
A tanfolyam során a résztvevők gyakorlati gyakorlatok során elsajátított ötleteket a gyakorlatba ültetik át laborkörnyezetben. A képzés végére a résztvevők alaposan átlátják MATLAB képességeit, és képesek lesznek alkalmazni azt valós adattudományi problémák megoldására, valamint munkájuk automatizálással történő egyszerűsítésére.
A tanfolyam során értékeléseket végeznek, hogy felmérjék az előrehaladást.
A tanfolyam formátuma
- A kurzus elméleti és gyakorlati gyakorlatokat tartalmaz, beleértve az esetmegbeszéléseket, a mintakód ellenőrzését és a gyakorlati megvalósítást.
jegyzet
- A gyakorlatok előre meghatározott mintaadatjelentés-sablonokon alapulnak. Ha konkrét igényei vannak, kérjük, vegye fel velünk a kapcsolatot, hogy megbeszéljük.
Machine Learning for Data Science with Python
21 ÓrákEz az oktatóvezetett, élő képzés Magyarország (online vagy helyszínen) célcsoportja az intermediate szintű adatanalitikusok, fejlesztők, vagy azok, akik data scientistként szeretnének dolgozni, és akarnak alkalmazni gépészettudományi technikákat Python-ban adatok elemzéséhez, előrejelzéséhez és automatizálni az adatokból származó döntéseket.
A kurzus végén a résztvevők képesek lesznek:
- Érteni és megkülönböztetni a kulcsfontosságú gépészettudományi paradigmákat.
- Felmérni az adatfeldolgozási technikákat és a modellértékelési mértékeket.
- Alkalmazni gépészettudományi algoritmusokat valós világbeli adatproblémák megoldására.
- Használni Python könyvtárakat és Jupyter notebookokat gyakorlati fejlesztéshez.
- Építeni előrejelzésre, osztályozásra, ajánlásra és csoportosításra szolgáló modelleket.
Accelerating Python Pandas Workflows with Modin
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik az Modin segítségével párhuzamos számításokat kívánnak készíteni és megvalósítani a Pandas-vel a gyorsabb adatelemzés érdekében.
A képzés végére a résztvevők képesek lesznek:
- Állítsa be a szükséges környezetet a Pandas munkafolyamatok nagyarányú fejlesztésének megkezdéséhez az Modin segítségével.
- Ismerje meg az Modin szolgáltatásait, felépítését és előnyeit.
- Ismerje meg a különbségeket Modin, Dask és Ray között.
- Hajtsa végre a Pandas műveletet gyorsabban az Modin segítségével.
- Valósítsa meg a teljes Pandas API-t és funkciókat.
Python Programming for Finance
35 ÓrákPython egy programozási nyelv, amely óriási népszerűségre tett szert a pénzügyi iparban. A legnagyobb befektetési bankok és a fedezeti alapok által elfogadott pénzügyi eszköz széles skáláját építik fel, az alapkereskedelmi programoktól kezdve a kockázatkezelési rendszerekig.
Ebben az oktató által vezetett, élő képzésen a résztvevők megtanulják, hogyan kell használni a Python ot gyakorlati alkalmazások kifejlesztésére számos konkrét pénzügyi vonatkozású probléma megoldására.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a Python programozási nyelv alapjait
- Letölteni, telepíteni és karbantartani a legjobb fejlesztőeszközöket pénzügyi alkalmazások létrehozásához a Python -ben
- Kiválasztani és használni a legmegfelelőbb Python csomagokat és programozási technikákat a pénzügyi adatok rendszerezéséhez, vizualizálásához és elemzéséhez különböző forrásokból (CSV, Excel, adatbázisok, web, stb.)
- Alkalmazásokat létrehozni, amelyek megoldják az eszközallokációval, kockázatelemzéssel, befektetési teljesítménnyel és még sok más kapcsolatos problémákat
- Hibaelhárítani, integrálni, üzembe helyezni és optimalizálni egy Python alkalmazást
Közönség
- Fejlesztők
- Elemzők
- Kvantitatív elemzők
A tantárgy formátuma
- Részben előadás, részben megbeszélés, gyakorlatok és intenzív gyakorlati feladatok
jegyzet
- Ez a képzés megoldást nyújt a pénzügyi szakemberek által felmerülő alapvető problémákra. Ha azonban van egy konkrét témája, eszköze vagy technikája, amelyet szeretne kiegészíteni vagy részletesebben kifejteni, kérjük, vegye fel velünk a kapcsolatot.
GPU Data Science with NVIDIA RAPIDS
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik a RAPIDS segítségével GPU gyorsított adatfolyamokat, munkafolyamatokat és vizualizációkat kívánnak készíteni, gépi tanulási algoritmusokat alkalmazva, mint például az XGBoost, a cuML stb.
A képzés végére a résztvevők képesek lesznek:
- Állítsa be a szükséges fejlesztői környezetet az adatmodellek NVIDIA-val való felépítéséhez RAPIDS.
- Ismerje meg a RAPIDS szolgáltatásait, összetevőit és előnyeit.
- Használja ki az GPU-eket a végpontok közötti adat- és elemzési folyamatok felgyorsításához.
- Valósítson meg GPU-gyorsított adat-előkészítést és ETL-t cuDF-el és Apache Arrow-val.
- Ismerje meg, hogyan hajthat végre gépi tanulási feladatokat XGBoost és cuML algoritmusokkal.
- Készítsen adatvizualizációkat és hajtson végre grafikonelemzést a cuXfilter és cuGraph segítségével.
Python and Spark for Big Data (PySpark)
21 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megtanulják, hogyan használhatják a Python-t és a Spark-ot a nagy adatok elemzésére, miközben gyakorlati gyakorlatokon dolgoznak.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg, hogyan használja a Sparkot a Python-val a Big Data elemzéséhez.
- Dolgozz olyan gyakorlatokon, amelyek a valós eseteket utánozzák.
- Használjon különféle eszközöket és technikákat a nagy adatelemzéshez az PySpark segítségével.
Apache Spark MLlib
35 ÓrákAz MLlib a Spark gépi tanulási (ML) könyvtára. Célja, hogy a gyakorlati gépi tanulás méretezhető és egyszerű legyen. Közös tanulási algoritmusokból és segédprogramokból áll, beleértve a besorolást, a regressziót, a klaszterezést, az együttműködő szűrést, a dimenziócsökkentést, valamint az alacsonyabb szintű optimalizálási primitíveket és a magasabb szintű csővezeték API-kat.
Ez két csomagra oszlik:
A spark.mllib tartalmazza az RDD-re épített eredeti API-t.
A spark.ml magasabb szintű API-t kínál, amely a DataFrames tetején épült ML-csővezetékek építéséhez.
Közönség
Ez a tanfolyam olyan mérnökökre és fejlesztőkre irányul, akik egy beépített gépkönyvtárat kívánnak használni az Apache Spark