Kurzusleírás
Az NLP-vel kapcsolatos Python csomag áttekintése
Bevezetés az NLP-be (természetesen példák a Python-ben)
Egyszerű szövegmanipuláció Szövegszámlálás keresése Word Szövegek felosztása Word Lexikális diszperzióra
Összetett struktúrák feldolgozása Szöveg ábrázolása listákban
Indexelő listákKollokációkBiggramokFrekvenciaelosztásokFeltételek Word-ekkelWord-ek összehasonlítása (kezdődik, végződik, kisebb, isalpha, stb...)Természetes nyelv megértése Word ÉrzékleírásNévmás felbontása
Gépi fordítások (statisztikai, szabályalapú, szó szerinti stb...)FeladatokNLP a Python-ben példákban
Szövegkorpórák és lexikai források elérése A korpuszok közös forrásai Feltételes frekvenciaeloszlások Számlálás Word műfaj szerint Saját korpusz készítése Kiejtés Szótár Cipősdoboz és eszköztár Lexikonok Érzékek és szinonimák Hierarchiák Lexikai kapcsolatok: Meronimák, Holonimák Szemantikai hasonlóságNyers szöveg nyomtatásának feldolgozásaStrukturáló
A húr részeinek kinyerése
Accessegyéni karakterek
Searchkihelyezés, csere, felosztás, összeillesztés, indexelés stb...Reguláris kifejezések használataSzóminták észleléseSzármazásTokenizálásA szöveg normalizálásaWord Szegmentáció (különösen kínai nyelven)Kategorizálás és címkézés Words Tagged CorporaCímkézett tokenekBeszédrész-címkekészletPython SzótárakWord a Propertieis leképezéshez
Automatikus címkézésEgy Word kategóriájának meghatározása (morfológiai, szintaktikai, szemantikai)Szöveges osztályozás (Machine Learning) Felügyelt osztályozásMondatszegmentációCross ValidationDöntési fákInformáció kinyerése a szövegdarabolásbólCsicsergés
Címkék vs fákMondatszerkezeti kontextus elemzése Ingyenes nyelvtanElemzőkFunkcióalapú nyelvtanok létrehozása Nyelvtani jellemzőkFunkcióstruktúrák feldolgozása
A mondatok jelentésének elemzése Szemantika és logikaPropozíciós logikaElsőrendű logikaDiskurzusszemantika
Nyelvi adatok adatformátumainak kezelése (lexikon vs szöveg)Metaadatok