ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (ML) ກັບສະຖິຕິແບບດັ້ງເດີມ ແຕກຕ່າງກັນແນວໃດ?
ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (Machine Learning) ກັບ ສະຖິຕິແບບດັ້ງເດີມ ແຕກຕ່າງກັນແນວໃດ?
ສະບາຍດີນັກສຶກສາມະຫາວິທະຍາໄລແຫ່ງຊາດ (ມຊ) ທຸກຄົນ! ຖ້ານ້ອງໆເຄີຍຮຽນວິຊາຄະນິດສາດ ຫຼື ພວມສຶກສາໃນສາຍວິທະຍາສາດຄອມພິວເຕີ, ອາດຈະເຄີຍໄດ້ຍິນຄຳວ່າ “Machine Learning” (ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ຫຼື ຫຍໍ້ວ່າ ML) ທີ່ກຳລັງເປັນກະແສໃນຍຸກນີ້. ຫຼາຍຄົນມັກຈະຕັ້ງຄຳຖາມວ່າ ມັນແຕກຕ່າງຫຍັງກັບວິຊາ “ສະຖິຕິ” (Statistics) ທີ່ພວກເຮົາຮຽນກັນຢູ່ໃນຫ້ອງ?
ບາງຄົນອາດຈະບອກວ່າ ML ກໍຄືສະຖິຕິທີ່ຖືກປ່ຽນຊື່ໃໝ່ໃຫ້ເບິ່ງທັນສະໄໝຊື່ໆ. ແຕ່ໃນຄວາມເປັນຈິງແລ້ວ, ເຖິງແມ່ນວ່າທັງສອງຈະມີພື້ນຖານຄ້າຍຄືກັນ ແຕ່ຈຸດປະສົງໃນການນຳໃຊ້ນັ້ນແຕກຕ່າງກັນຢ່າງຊັດເຈນ. ບົດຄວາມນີ້ຈະມາໄຂຂໍ້ຂ້ອງໃຈແບບເຂົ້າໃຈງ່າຍ ໂດຍບໍ່ມີສົມຜົນຊັບຊ້ອນໃຫ້ປວດຫົວ!
ສະຖິຕິແບບດັ້ງເດີມ (Traditional Statistics) ແມ່ນຫຍັງ?
ສະຖິຕິແບບດັ້ງເດີມ ແມ່ນວິທະຍາສາດທີ່ເນັ້ນໃສ່ ການເຮັດຄວາມເຂົ້າໃຈຂໍ້ມູນ ແລະ ການອະນຸມານ (Inference). ມັນຊ່ວຍໃຫ້ເຮົາສາມາດອະທິບາຍເຖິງຄວາມສຳພັນລະຫວ່າງຕົວປ່ຽນຕ່າງໆ ແລະ ຕອບຄຳຖາມວ່າ “ເປັນຫຍັງເຫດການໃດໜຶ່ງຈຶ່ງເກີດຂຶ້ນ?” ໂດຍອີງໃສ່ກຸ່ມຕົວຢ່າງ (Sample).
ຕົວຢ່າງໃນຊີວິດຈິງ: ສົມມຸດວ່າອາຈານຢູ່ ມຊ ຢາກຮູ້ວ່າ “ຄະແນນເສັງຂອງນັກສຶກສາພົວພັນກັບຈຳນວນຊົ່ວໂມງທີ່ພວກເຂົາເຂົ້າຫໍສະໝຸດຫຼືບໍ່?“. ອາຈານຈະເກັບກຳຂໍ້ມູນຈາກນັກສຶກສາຈຳນວນໜຶ່ງ ແລ້ວໃຊ້ວິທີທາງສະຖິຕິເພື່ອຫາຄ່າສະເລ່ຍ ແລະ ຢັ້ງຢືນວ່າການເຂົ້າຫໍສະໝຸດມີຜົນຕໍ່ຄະແນນເສັງແທ້ໆ ບໍ່ແມ່ນພຽງແຕ່ເລື່ອງບັງເອີນ.
ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (Machine Learning ຫຼື ML) ແມ່ນຫຍັງ?
Machine Learning (ML) ແມ່ນສາຂາໜຶ່ງຂອງປັນຍາປະດິດ (AI) ທີ່ສຸມໃສ່ “ການທຳນາຍ” (Prediction). ແທນທີ່ຈະຂຽນກົດເກນຕາຍຕົວໃຫ້ຄອມພິວເຕີເຮັດຕາມ, ພວກເຮົາຈະປ້ອນຂໍ້ມູນຈຳນວນມະຫາສານໃຫ້ຄອມພິວເຕີ (ເຄື່ອງຈັກ) ເພື່ອໃຫ້ມັນຮຽນຮູ້ທີ່ຈະຊອກຫາຮູບແບບ (Patterns) ເອົາເອງ.
ຕົວຢ່າງໃນຊີວິດຈິງ: ຖ້ານ້ອງໆເປີດແອັບເບິ່ງການຈະລາຈອນເພື່ອກວດສອບເສັ້ນທາງແຖວໄຟແດງດົງໂດກ ວ່າລົດຕິດຫຼືບໍ່. ML ຈະບໍ່ພຽງແຕ່ບອກວ່າ “ໂດຍສະເລ່ຍລົດຈະຕິດເວລາ 5 ໂມງແລງ” (ນັ້ນຄືສະຖິຕິ), ແຕ່ ML ຈະປະມວນຜົນຂໍ້ມູນຈາກມື້ກ່ອນໆ, ສະພາບອາກາດມື້ນີ້ (ມີຝົນຕົກບໍ່), ແລະ ວັນພັກຕ່າງໆ ແລ້ວທຳນາຍລ່ວງໜ້າວ່າ “ມື້ນີ້ເວລາ 17:15 ລົດຈະຕິດໜັກເປັນພິເສດ ເພາະມີຝົນຕົກ ແລະ ເປັນວັນສຸກ”.
ຄວາມແຕກຕ່າງຫຼັກໆ ທີ່ນັກສຶກສາຄວນຮູ້
ເພື່ອໃຫ້ເຫັນພາບແຈ້ງຂຶ້ນ, ເຮົາມາເບິ່ງຄວາມແຕກຕ່າງຫຼັກໆ 3 ຂໍ້ດັ່ງນີ້:
- ເປົ້າໝາຍ (Goal):
- ສະຖິຕິ: ຕ້ອງການ “ອະທິບາຍ” (Inference) ວ່າຂໍ້ມູນພົວພັນກັນແນວໃດ (ຖາມວ່າ: ຍ້ອນຫຍັງ?).
- ML: ຕ້ອງການ “ທຳນາຍ” (Prediction) ສິ່ງທີ່ຈະເກີດຂຶ້ນຕໍ່ໄປໃຫ້ແມ່ນຢໍາທີ່ສຸດ (ຖາມວ່າ: ຈະເກີດຫຍັງຂຶ້ນຕໍ່ໄປ?).
- ປະລິມານຂໍ້ມູນ (Data Size):
- ສະຖິຕິ: ມັກອອກແບບມາໃຫ້ໃຊ້ກັບຂໍ້ມູນຂະໜາດນ້ອຍ ຫຼື ກຸ່ມຕົວຢ່າງ (Sample) ກໍສາມາດຫາຂໍ້ສະຫຼຸບໄດ້.
- ML: ຫິວໂຫຍຂໍ້ມູນ! ຕ້ອງການຂໍ້ມູນຂະໜາດໃຫຍ່ມະຫາສານ (Big Data) ເພື່ອໃຫ້ອັລກໍຣິທຶມຮຽນຮູ້ ແລະ ຝຶກຝົນຕົນເອງໄດ້ດີຂຶ້ນ.
- ວິທີການ (Method):
- ສະຖິຕິ: ໃຊ້ສົມຜົນທາງຄະນິດສາດທີ່ຊັດເຈນ ເພື່ອທົດສອບສົມມຸດຕິຖານ.
- ML: ໃຊ້ອັລກໍຣິທຶມເພື່ອປັບປຸງຄວາມຜິດພາດຂອງຕົວມັນເອງ ເຮັດແນວໃດກໍໄດ້ໃຫ້ຜົນການທຳນາຍອອກມາໃກ້ຄຽງຄວາມຈິງທີ່ສຸດ.
ສົມທຽບໃຫ້ເຫັນພາບ: ການປູກກາເຟຢູ່ປາກຊ່ອງ
ລອງວາດພາບເຖິງຊາວສວນກາເຟຢູ່ເມືອງປາກຊ່ອງ ແຂວງຈຳປາສັກ:
- ຖ້າຊາວສວນໃຊ້ “ສະຖິຕິ”: ເຂົາເຈົ້າອາດຈະທົດລອງໃສ່ປຸ໋ຍ 2 ຊະນິດໃນສວນ ແລ້ວນຳໃຊ້ວິທີທາງສະຖິຕິເພື່ອສະຫຼຸບວ່າ “ປຸ໋ຍຊະນິດ A ເຮັດໃຫ້ໄດ້ໝາກກາເຟຫຼາຍກວ່າປຸ໋ຍຊະນິດ B ຢ່າງມີໄນສຳຄັນ”. (ເນັ້ນຄວາມເຂົ້າໃຈສາເຫດ).
- ຖ້າຊາວສວນໃຊ້ “Machine Learning”: ເຂົາເຈົ້າຈະເກັບຂໍ້ມູນອຸນຫະພູມ, ຄວາມຊຸ່ມຊື່ນຂອງດິນ, ຮູບພາບໃບກາເຟ, ແລະ ປະລິມານນໍ້າຝົນໃນແຕ່ລະວັນ ປ້ອນເຂົ້າໃນລະບົບ AI. ຈາກນັ້ນ, ລະບົບ ML ຈະທຳນາຍວ່າ “ຕົ້ນກາເຟຕົ້ນທີ 45 ມີໂອກາດທີ່ຈະເກີດພະຍາດເຊື້ອຣາໃນອາທິດໜ້າສູງເຖິງ 80%, ກະລຸນາໄປກວດສອບດ່ວນ!“. (ເນັ້ນການທຳນາຍລ່ວງໜ້າ).
ສິ່ງສຳຄັນທີ່ຄວນຈື່ (Key Takeaways)
- Machine Learning ແລະ ສະຖິຕິ ບໍ່ແມ່ນສັດຕູກັນ, ແຕ່ ML ແມ່ນໄດ້ຮັບການຕໍ່ຍອດ ແລະ ມີຮາກຖານມາຈາກທິດສະດີທາງສະຖິຕິ.
- ສະຖິຕິຊ່ວຍໃຫ້ເຮົາເຂົ້າໃຈຄວາມຈິງທີ່ຊ່ອນຢູ່ໃນຂໍ້ມູນ (ອະດີດເຖິງປັດຈຸບັນ).
- Machine Learning ຊ່ວຍສະກັດເອົາຄວາມຮູ້ຈາກຂໍ້ມູນ ເພື່ອສ້າງເປັນຫຼັກການໃນການຄາດເດົາອະນາຄົດ.
ບົດສະຫຼຸບ
ສຳລັບນັກສຶກສາ ມຊ ທີ່ສົນໃຈຢາກກ້າວເຂົ້າສູ່ສາຍງານ Data Science (ວິທະຍາສາດຂໍ້ມູນ) ຫຼື AI, ການຮູ້ພຽງແຕ່ Machine Learning ອາດຈະເຮັດໃຫ້ເຮົາຂາດຄວາມເຂົ້າໃຈຢ່າງເລິກເຊິ່ງ, ຂະນະດຽວກັນການຮູ້ແຕ່ສະຖິຕິກໍອາດຈະເຮັດໃຫ້ເຮົາແກ້ໄຂບັນຫາທີ່ຊັບຊ້ອນໃນໂລກຍຸກໃໝ່ໄດ້ຍາກ. ດັ່ງນັ້ນ, ຄວາມເຂົ້າໃຈທັງ “ສະຖິຕິ” (ເພື່ອຄວາມໜັກແໜ້ນທາງທິດສະດີ) ແລະ “Machine Learning” (ເພື່ອທັກສະການປະຍຸກໃຊ້ເຕັກໂນໂລຊີ) ແມ່ນກຸນແຈສຳຄັນທີ່ຈະຊ່ວຍນຳພາປະເທດລາວເຮົາກ້າວເຂົ້າສູ່ຍຸກດິຈິຕອນໄດ້ຢ່າງເຕັມຕົວ. ຂໍໃຫ້ນ້ອງໆທຸກຄົນມ່ວນຊື່ນກັບການຮຽນຮູ້!