Kurzusleírás

A hangosztályozás alapjai

  • Hangesemények típusai: környezeti, mechanikus, ember által generált
  • Használati esetek áttekintése: felügyelet, monitorozás, automatizálás
  • Hangosztályozás vs észlelés vs szegmentálás

Hangadatok és jellemzőkinyerés

  • Hangfájlok típusai és formátumai
  • Mintavételi gyakoriság, ablakozás, keretméret szempontjai
  • MFCC-k, kromatikus jellemzők, mel-spektrogramok kinyerése

Adatelőkészítés és annotálás

  • UrbanSound8K, ESC-50 és egyéni adathalmazok
  • Hangesemények címkézése és időbeli határok
  • Adathalmazok kiegyensúlyozása és hangok augmentálása

Hangosztályozási modellek építése

  • Konvolúciós neurális hálózatok (CNN-k) használata hangokhoz
  • Modell bemenet: nyers hullámforma vs jellemzők
  • Veszteségfüggvények, értékelési metrikák és túlilleszkedés

Eseményészlelés és időbeli lokalizálás

  • Keret-alapú és szegmens-alapú észlelési stratégiák
  • Észlelések utófeldolgozása küszöbértékekkel és simítással
  • Előrejelzések vizualizálása hangidővonalon

Haladó témák és valós idejű feldolgozás

  • Transzfertanulás alacsony adatmennyiségű helyzetekben
  • Modellek üzembe helyezése TensorFlow Lite vagy ONNX segítségével
  • Hangfolyam feldolgozás és késleltetési szempontok

Projektfejlesztés és alkalmazási forgatókönyvek

  • Teljes folyamat tervezése: betöltéstől osztályozásig
  • Prototípus fejlesztése felügyeletre, minőségellenőrzésre vagy monitorozásra
  • Naplózás, riasztás és integráció irányítópultokkal vagy API-kkal

Összefoglalás és következő lépések

Követelmények

  • A gépi tanulás alapfogalmainak és modelltanításának ismerete
  • Tapasztalat Python programozásban és adatelőfeldolgozásban
  • Ismeret a digitális hang alapjaival

Közönség

  • Adattudósok
  • Gépi tanulási mérnökök
  • Kutatók és fejlesztők a hangjel-feldolgozás területén
 21 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák