Kurzusleírás

Részletes képzési vázlat

    Bevezetés az NLP-be Az NLP megértése NLP-keretrendszerek Az NLP kereskedelmi alkalmazásai Adatok lemásolása a webről Különféle API-k használata szöveges adatok lekéréséhez Szövegkorpusok munkája és tárolása tartalom és releváns metaadatok mentése A Python és az NLTK összeomlási kurzus használatának előnyei A korpusz és adatkészlet gyakorlati ismerete Miért szükségünk van korpuszra? Korpuszelemzés Az adatattribútumok típusai Különböző fájlformátumok korpuszokhoz Adatkészlet készítése NLP alkalmazásokhoz Mondatszerkezet megértése Az NLP összetevői Természetes nyelvi megértés Morfológiai elemzés - tő, szó, token, beszédcímkék Szintaktikai elemzés Szemantikai elemzés Kétértelműség kezelése Szöveges adatok előfeldolgozása Korpusz - nyers szöveg Mondattokenizálás Stemming a nyers szöveghez Nyers szöveg lemmizálása Szóeltávolítás leállítása Corpus-raw mondatok Word tokenizálás Word lemmatizálás Term-Dokument/Dokumentum-kifejezés mátrixokkal való munka Szöveg tokenizálás n-grammokba és mondatokba Praktikus és testreszabott előfeldolgozás Szövegadatok elemzése Az NLP elemzők alapvető jellemzői, valamint a POS címkézés és címkézők elemzése Név entitás felismerés N-gramok Szavak zsákja Az NLP statisztikai jellemzői Lineáris algebra az NLP-hez Valószínűségi elmélet az NLP-hez TF-IDF vektorizációs kódolók és dekóderek normalizálás valószínűségi modellek Fejlett jellemző tervezés és NLP A word2vec alapjai A word2vec modell komponensei A word2vec modell logikája A word2vec koncepció kiterjesztése Word2vec modell alkalmazása Esettanulmány: Szavak alkalmazása: automatikus szövegösszegzés egyszerűsített és igaz Luhn-algoritmusokkal Dokumentum klaszterezés, osztályozás és témamodellezés Dokumentum klaszterezés és mintabányászat (hierarchikus klaszterezés, k-középek, klaszterezés stb.) Dokumentumok összehasonlítása és osztályozása TFIDF, Jaccard és koszinusz távolságmértékekkel Dokumentumosztályozás Naív Bayes és maximális entrópia használatával Fontos szövegelemek azonosítása Dimenziócsökkentés: Főkomponens-elemzés, Szinguláris Értékbontás nem-negatív mátrixfaktorizáció Témamodellezés és információkeresés látens szemantikus elemzés entitáskivonás, érzelemelemzés és haladó témamodellezés segítségével Pozitív vs. negatív: a hangulat foka Tétel Válaszelmélet A beszédcímkézés része és alkalmazása: a ben említett személyek, helyek és szervezetek megtalálása szöveg Speciális témamodellezés: Látens Dirichlet-allokáció Esettanulmányok Strukturálatlan felhasználói vélemények bányászata Érzelmi besorolás és termékértékelési adatok megjelenítése Használati minták keresési naplóinak bányászata Szövegbesorolás Témamodellezés

Követelmények

Az NLP alapelveinek ismerete és ismerete, valamint az AI üzleti alkalmazásának elismerése

 21 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (2)

Rokon tanfolyam

Smart Robots for Developers

84 Hours

Rokon kategóriák