Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Részletes képzési vázlat
- Bevezetés a Természetes Nyelvfeldolgozásba
- A Természetes Nyelvfeldolgozás megértése
- NLP keretrendszerek
- A Természetes Nyelvfeldolgozás kereskedelmi alkalmazásai
- Adatok gyűjtése a web-ről
- Különböző API-k használata szöveges adatok lekéréséhez
- Szöveges korpuszok kezelése és tárolása, tartalom és releváns metaadatok mentése
- A Python és az NLTK használatának előnyei és gyorstalpaló
- Gyakorlati megértés a korpuszról és adathalmazról
- Miért van szükség korpuszra?
- Korpuszanalízis
- Adatattribútumok típusai
- Különböző fájlformátumok korpuszokhoz
- Adathalmaz előkészítése NLP alkalmazásokhoz
- A mondatszerkezet megértése
- A Természetes Nyelvfeldolgozás összetevői
- Természetes nyelv megértése
- Morfológiai elemzés - szótő, szó, token, beszédcímkék
- Szintaktikai elemzés
- Szematikus elemzés
- Kétértelműség kezelése
- Szöveges adatok előfeldolgozása
- Korpusz - nyers szöveg
- Mondat tokenizálás
- Szótőválasztás nyers szöveghez
- Lemmatizálás nyers szöveghez
- Stop szavak eltávolítása
- Korpusz - nyers mondatok
- Szó tokenizálás
- Szó lemmatizálás
- Term-Dokumentum/Dokumentum-Term mátrixok kezelése
- Szöveg tokenizálása n-grammokra és mondatokra
- Gyakorlati és testreszabott előfeldolgozás
- Korpusz - nyers szöveg
- Szöveges adatok elemzése
- NLP alapvető jellemzői
- Elemzők és elemzés
- POS címkézés és címkézők
- Elnevezett entitások felismerése
- N-grammok
- Szókészlet
- NLP statisztikai jellemzői
- Lineáris algebra alapjai az NLP-hez
- Valószínűségszámítás az NLP-hez
- TF-IDF
- Vektorizálás
- Kódolók és dekódolók
- Normalizálás
- Valószínűségi modellek
- Haladó jellemzőmérnökség és NLP
- A word2vec alapjai
- A word2vec modell összetevői
- A word2vec modell logikája
- A word2vec koncepció kiterjesztése
- A word2vec modell alkalmazása
- Esettanulmány: Szókészlet alkalmazása: automatikus szövegösszefoglalás egyszerűsített és valós Luhn-algoritmusokkal
- NLP alapvető jellemzői
- Dokumentumok csoportosítása, osztályozása és témamodellezés
- Dokumentumok csoportosítása és mintakeresés (hierarchikus csoportosítás, k-közép csoportosítás stb.)
- Dokumentumok összehasonlítása és osztályozása TFIDF, Jaccard és koszinusz távolságmérőkkel
- Dokumentumok osztályozása Naïv Bayes és Maximum Entropy módszerekkel
- Fontos szövegelemek azonosítása
- Dimenziócsökkentés: Főkomponens-analízis, Szinguláris Értékfelbontás, nem-negatív mátrix faktorizáció
- Témamodellezés és információlekérdezés Latent Szemantikus Analízis segítségével
- Entitás kinyerése, érzelmek elemzése és haladó témamodellezés
- Pozitív vs. negatív: érzelem mértéke
- Elemválasz elmélet
- Beszédrész címkézés és alkalmazása: személyek, helyek és szervezetek azonosítása szövegben
- Haladó témamodellezés: Latent Dirichlet Allocation
- Esettanulmányok
- Strukturálatlan felhasználói vélemények bányászata
- Érzelmek osztályozása és termékértékelési adatok vizualizációja
- Keresési naplók bányászata használati mintákhoz
- Szövegosztályozás
- Témamodellezés
Követelmények
Alapvető ismeretek a Természetes Nyelvfeldolgozás elveiről és a mesterséges intelligencia üzleti alkalmazásairól.
21 Órák
Vélemények (1)
Egyéni támogatás
Simon the 2nd - Cboost
Kurzus - ROS: Programming for Robotics
Gépi fordítás