06026159 : PRACTICAL DATA SCIENCE

รหัสวิชา (Subject ID) 06026159
ชื่อวิชา วิทยาการข้อมูลภาคปฏิบัติ
Subject name PRACTICAL DATA SCIENCE
วิชาบังคับก่อน (Prerequisite) -

รายละเอียดวิชา

เครื่องมือทั่วไปสำหรับการเขียนโปรแกรม การพัฒนา และการจัดการข้อมูล เช่น คำสั่งและประโยชน์ของยูนิกซ์ ภาษาการเขียนโปรแกรมไพทอน และการคิวรี (ดึงข้อมูล) จากฐานข้อมูลแบบพื้นฐาน เข้าใจการการแทนที่ที่แตกต่างกันของข้อมูล ได้แก่ ออปเจ็ค (วัตถุ) ความสัมพันธ์ และสารสนเทศ การบันทึกและค้นคืนข้อมูลในหลากหลากรูปแบบทั่วไป การทำความสะอาดข้อมูลโดยใช้คำสั่งเกรปและนิพจน์ปรกติ การปฏิสัมพันธ์กับฐานข้อมูลเพื่อเตรียมจุดจัดเก็บข้อมูลสำหรับสร้างแบบจำลอง การหาสหสัมพันธ์ระหว่างคุณลักษณะของออปเจ็ค สร้างแผนภาพข้อมูลสำหรับการวิเคราะห์เชิงสำรวจและยืนยัน สร้างแบบจำลองเพื่อการทำนายและจัดหมวดหมู่วัตถุตามข้อมูลนำเข้า การเปลี่ยนข้อมูลดิบเป็นฟีเจอร์ (คุณลักษณะเด่น) สำหรับโมเดลการทำนาย ประเมินประสิทธิภาพของโมเดลการทำนาย การติดตั้งโมเดลและระบบข้อมูล

Common tools for data access, processing, visualization and management such as Unix command line and utilities, Python programming language and basic database querying; understand-ing the different representations of data, i.e., objects, relationships and information; storing and re-trieving data in a variety of common formats; data cleansing using grep command and regular expres-sion; interaction with database to provide a storage point for building models; finding correlation be-tween attributes of objects; visualizing data for exploratory and confirmatory analysis; building models to make predictions and categorize objects given data; transforming raw data into features for predic-tive models; evaluating predictive models; deploying models and data systems.