Kurzusleírás

Részletes képzési vázlat

  1. Bevezetés az NLP-be
    • NLP megértése
    • NLP keretek
    • NLP kereskedelmi alkalmazásai
    • Adatok kinyerése a webről
    • Különböző API-k használata szöveges adatok visszaállítására
    • Szövegkorpuszok kezelése és tárolása, tartalom és releváns metadatumok mentése
    • Python és NLTK gyorskurzusok előnyei
  2. A korpusz és adathalmaz gyakorlati megértése
    • Miért szükséges egy korpusz?
    • Korpusz-analízis
    • Adattulajdonságok típusai
    • Korpuszok különböző fájlformátumai
    • Adathalmaz előkészítése NLP alkalmazásokra
  3. A mondatok szerkezetének megértése
    • NLP komponensei
    • Természetes nyelvértés
    • Morfológiai elemzés - gyök, szó, tokennelés, beszédcímkék
    • Szintaktikus elemzés
    • Szemantikus elemzés
    • Homonimák kezelése
  4. Szövegadatok előfeldolgozása
    • Korpusz - nyers szöveg
      • Mondatok tokennelése
      • Nyers szöveg származékos alakja
      • Nyers szöveg szótőképzése
      • Stop szavak eltávolítása
    • Korpusz - nyers mondatok
      • Word tokennelés
      • Word szótőképzés
    • Term-Document/Document-Term mátrixokkal való munkavégzés
    • Szöveg tokennelése n-gramokká és mondatokká
    • Praktikus és testreszabott előfeldolgozás
  5. Szövegadatok elemzése
    • NLP alapvető jellemzői
      • Szintaktikus elemzők és elemzés
      • POS címkézés és címkézők
      • Névszemantikai felismerés
      • N-gramok
      • Szavakat tartalmazó tasak
    • NLP statisztikai jellemzői
      • Lineáris algebra alapfogalmai az NLP-hez
      • Valószínűségi elmélet az NLP-hez
      • TF-IDF
      • Vektorizálás
      • Kódolók és dekódolók
      • Normalizálás
      • Valószínűségi modellek
    • Haladó jellemzőképzés és NLP
      • Word2vec alapjai
      • A word2vec modell komponensei
      • A word2vec modell logikája
      • A word2vec koncepció kiterjesztése
      • A word2vec modell alkalmazása
    • Eseménytanulmány: Szavakat tartalmazó tasak alkalmazása: automatizált szövegösszegzés egyszerűsített és valódi Luhn-algoritmusokkal
  6. Dokumentumcsoportosítás, osztályozás és témamodellezés
    • Dokumentumcsoportosítás és mintázati bányászat (hierarchikus csoportosítás, k-means csoportosítás stb.)
    • Dokumentumok összehasonlítása és osztályozása TF-IDF, Jaccard és cosinus távolságmérésekkel
    • Dokumentum osztályozása Naïve Bayes és Maximum Entropy segítségével
  7. A fontos szövegek azonosítása
    • Dimenziócsökkentés: főkomponens-analízis, singularis érték-bontás és nemnegatív mátrix-faktorizálás
    • Témamodellezés és információkeresés Latent Semantic Analysis segítségével
  8. Entitáskivonás, Sentiment Analysis és haladó témamodellezés
    • Pozitív vs. negatív: érzelemfok
    • Tételválasz-elmélet
    • Szószemantikai címkézés és alkalmazása: személyek, helyek és szervezetek megnevezése a szövegekben
    • Haladó témamodellezés: Latent Dirichlet Allocation
  9. Eseménytanulmányok
    • Strukturálatlan felhasználói vélemények bányászata
    • Termékvisszajelzések érzelemosztályozása és vizualizálása
    • Keresési naplók bányászata használati mintákra
    • Szöveg osztályozása
    • Témamodellezés

Követelmények

Ismeretele és tudatossága az NLP alapelvéről és az AI alkalmazásának értékelése a üzleti életben
 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák