06046410 : การประมวลผลภาษาธรรมชาติเบื้องต้น

รหัสวิชา (Subject ID) 06046410
ชื่อวิชา การประมวลผลภาษาธรรมชาติเบื้องต้น
Subject name INTRODUCTION TO NATURAL LANGUAGE PROCESSING
วิชาบังคับก่อน (Prerequisite) ไม่มี

รายละเอียดวิชา

แนะนำการประมวลผลภาษาธรรมชาติ พื้นฐานการประมวลผลข้อความ นิพจน์ปกติ พื้นฐานการขูดเว็บ ไปป์ไลน์การประมวลผลภาษา พื้นฐานการเตรียมประมวลผลภาษา การตัดโทเคน การทำสเต็มมิ่ง การทำเลมม่า คำหยุด การกระจายความถี่ของคำ การกระจายความถี่ของคำแบบมีเงื่อนไข เอ็นแกรม ทีเอฟ-ไอดีเอฟ แนะนำเวกเตอร์แทนคำและเวกเตอร์แทนเอกสาร การกำกับส่วนหน้าที่ของคำ การรู้จำชื่อเฉพาะ การจำแนกข้อความ เมตริกซ์การวัดประสิทธิภาพ แนะนำตัวแจกแจงไวยากรณ์และไวยากรณ์ คลังข้อมูลภาษาและทรัพยากรภาษา การวิเคราะห์ความรู้สึก แบบจำลองหัวข้อเรื่อง แนะนำออโตมาต้าและทฤษฏีภาษาทางการ แนะนำการเรียนรู้เชิงลึกสำหรับการประมวลผลภาษา
Introduction to natural language processing; text processing basics, regular expression; web scrapping basics; language processing pipeline; language preprocessing basics, tokenization, stemming, lemmatization, stop words, word frequency distribution, conditional frequency distribution, n-grams, TF-IDF, introduction to doc2vec and word2vec; part-of-speech tagging; name entity recognition; text classification, confusion matrix; introduction to parsers and grammars; corpus and language resources; sentiment analysis; topic modeling; introduction to automata and formal language theory; introduction to deep learning for NLP