Kurzusleírás

Részletes képzési tervezet

  1. NLP bemutatása
    • NLP megértése
    • NLP keretrendszerek
    • NLP kereskedelmi alkalmazásai
    • Adatok webes szemantikus elemzése
    • Versenyzők API-jainak használata szövegadatok lekéréséhez
    • Szöveg adattárak kezelése és tárolása, tartalom és releváns metaadatok mentése
    • Python és NLTK rövid áttekintése - előnyei
  2. A korpusz és az adathalmaz praktikus megértése
    • Miért szükség van a korpuszra?
    • Korpusz elemzés
    • Adattípusok
    • Különböző fájlformátumok korpuszokhoz
    • Egy NLP alkalmazásokhoz való adathalmaz előkészítése
  3. Mondatstruktúra megértése
    • NLP összetevői
    • Természetes nyelv értelmezése
    • Morfológiai elemzés - gyök, szó, token, beszédbeli cimkék
    • Szintaktikai elemzés
    • Szemszintgörbítési elemzés
    • Ellentmondás kezelése
  4. Szövegadat előfeldolgozása
    • Korpusz - nyers szöveg
      • Mondatok tokenizálása
      • Nyers szöveg gyökölése
      • Nyers szöveg lemmatizálása
      • Stop szavak eltávolítása
    • Korpusz - nyers mondatok
      • Szavak tokenizálása
      • Szavak lemmatizálása
    • Az állomány-dokumentum/dokumentum-állomány mátrixok használata
    • Mondatok és n-gramek szövegtokenizálása
    • Egyedi és praktikus előfeldolgozás
  5. Szövegadat elemzése
    • NLP alapfunkciói
      • Párolók és párolás
      • POS cimkeezés és cimkeszemélyek
      • Név-entitás felismerés
      • n-gramek
      • Szavak zsákja
    • NLP statisztikai funkciói
      • Lineáris algebra alapjai NLP szempontból
      • NLP valószínűségi elmélete
      • TF-IDF
      • Vektorizálás
      • Kódolók és dekódolók
      • Normálítás
      • Valószínűségi modellek
    • NLP haladó funkciói
      • Word2vec alapjai
      • Word2vec modell összetevői
      • Word2vec modell logikája
      • Word2vec koncept kiterjesztése
      • Word2vec modell alkalmazása
    • Kétféle eset: A szavak zsákja alkalmazása - automatikus összefoglalók a Luhn algoritmusának egyszerűsített és valós változatával
  6. Dokumentumcsoportosítás, osztályozás és téma modellezés
    • Dokumentumcsoportosítás és minta kivitelezés (hirarchikus csoportosítás, k-átlag, stb.)
    • Dokumentumok összehasonlítása és osztályozása a TFIDF, Jaccard és koszinusz távolság mérőszámok segítségével
    • Dokumentumok osztályozása Naïve Bayes és Maximum Entropy módszerekkel
  7. Kiemelkedő szövegelemek azonosítása
    • Dimenziók redukciója: főkomponens elemzés, egyszerűsített érték bontás, nem negatív mátrix faktorizáció
    • Téma modellezés és információs visszaadás latens szemantikus elemzés segítségével
  8. Entitás kivonása, érzékelőelemzés és haladó téma modellezés
    • Pozitív vs. negatív: érzékenység foka
    • Tételválaszthatóság elmélet
    • Beszédbeli cimkeezés és alkalmazása: személyek, helyek és szervezetek felismerése a szövegben
    • Haladó téma modellezés: latens Dirichlet eloszlás
  9. Kétféle eset
    • Nyers felhasználói vélemények kivitelezése
    • Termék vélemény adatok érzékelőelemzése és vizualizációja
    • Keresési naplók elemzése használati mintákért
    • Szöveg osztályozása
    • Téma modellezés

Követelmények

Tudás és elismertség az NLP elvölgyezéseiről, valamint az mesterséges intelligencia alkalmazásaival kapcsolatban a vállalkozásokban

 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák