| Batch processing | | การประมวลผลข้อมูลปริมาณการใช้ไฟฟ้าในรอบเดือน |
| Stream processing | | แยกข้อมูลเป็น 2 ส่วน: Train --> สร้างโมเดล, Test --> ทดสอบโมเดล |
| Digitization | | จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น positive |
| First principal component | | ค่าคำตอบจริงเป็น positive โมเดลทำนายเป็น negative |
| Dimensionality reduction | | อธิบายประสิทธิภาพของ classification model |
| Feature extraction | | การแปลงอินพุตภาพหรือเสียงให้เป็นค่าตัวเลขดิจิตอล |
| Train/Test split | | การเลือก principal component หรือตัวแปรที่สำคัญๆ และตัดตัวอื่นๆทิ้ง |
| K-fold Cross Validation | | โมเดลทำนายผลชุดข้อมูลทั้ง training set และ test set ได้ไม่ดีเนื่องจาก โมเดลมี complexity ต่ำเกินไป |
| Model training | | การตรวจสอบการโจมตีเครือข่ายคอมพิวเตอร์ทางออนไลน์ |
| Overfitting model | | ตัวแปรที่เก็บข้อมูลเดิม (variance) อยู่มากที่สุด |
| Accuracy, Confusion Matrix | | จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น negative |
| R-squared, Root Mean Square Error | | กระบวนการปรับ model parameters จนกระทั่งผลต่างของค่าที่โมเดลทำนายกับค่าคำตอบจริงมีค่าต่ำสุด |
| False Negative (FN) | | จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทผิดพลาด |
| FP + FN | | แยกข้อมูลออกเป็น K ส่วนเท่าๆกัน โดย K-1 ส่วนใช้สร้างโมเดล อีก 1 ส่วนใช้ทดสอบ และทำวนไปกับข้อมูลทุกส่วนจำนวน K ครั้ง |
| TP + FN | | โมเดลทำนายผลชุดข้อมูล training set ได้ดี แต่ทำนายผลชุด test set ได้ไม่ดี |
| TP + FP | | จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทเป็น positive |
| Missing phrase1 - 16 | | อธิบายประสิทธิภาพของ regression model |
| Missing phrase1 - 17 | | การแปลงข้อมูลอินพุตให้เป็นข้อมูลที่ ML algorithm สามารถประมวลผลต่อได้ |