ເຄືອຂ່າຍປະສາດທຽມ (Neural Networks) ສາມາດຈຳແນກລາຍມືໄດ້ແນວໃດ
ເຄືອຂ່າຍປະສາດທຽມ (Neural Networks) ສາມາດຈຳແນກລາຍມືໄດ້ແນວໃດ
ລອງຈິນຕະນາການເຖິງຕອນທີ່ທ່ານໄດ້ຮັບກ່ອງພັດສະດຸຈາກບໍລິສັດຂົນສົ່ງທ້ອງຖິ່ນ ເຊັ່ນ: ຮຸ່ງອາລຸນ ຫຼື ອານຸສິດ ຂົນສົ່ງ. ບາງຄັ້ງ ເບີໂທລະສັບ ຫຼື ລະຫັດໄປສະນີທີ່ຂຽນດ້ວຍມືພະນັກງານຢູ່ໜ້າກ່ອງນັ້ນກໍອ່ານຍາກຫຼາຍຈົນເຮົາເອງຍັງຕ້ອງໄດ້ເພັ່ງສາຍຕາເບິ່ງ. ແລ້ວຄອມພິວເຕີສາມາດ “ອ່ານ” ແລະ ເຂົ້າໃຈຕົວເລກທີ່ຂຽນຍຸກຍິກເຫຼົ່ານັ້ນໄດ້ແນວໃດ?
ຄຳຕອບແມ່ນສິ່ງທີ່ເອີ້ນວ່າ ເຄືອຂ່າຍປະສາດທຽມ (Neural Networks). ໃນບົດຄວາມນີ້, ເຮົາຈະມາໄຂຂໍ້ສົງໄສກ່ຽວກັບວິທີທີ່ເຕັກໂນໂລຊີ AI ສາມາດອ່ານລາຍມືຂອງທ່ານໄດ້ ໂດຍຈະອະທິບາຍຜ່ານບັນຫາຄລາສສິກຂອງວົງການນັກພັດທະນາ AI ທີ່ເອີ້ນວ່າ “MNIST” ແບບເຂົ້າໃຈງ່າຍທີ່ສຸດ ແລະ ບໍ່ຈຳເປັນຕ້ອງມີພື້ນຖານດ້ານໄອທີມາກ່ອນ.
ເຄືອຂ່າຍປະສາດທຽມ (Neural Networks) ແມ່ນຫຍັງ?
ເຄືອຂ່າຍປະສາດທຽມ (Neural Networks ຫຍໍ້ວ່າ NN) ແມ່ນໂປຣແກຣມຄອມພິວເຕີປະເພດໜຶ່ງທີ່ຖືກອອກແບບມາໃຫ້ຮຽນຮູ້ ແລະ ຄິດຄ້າຍຄືກັບສະໝອງຂອງມະນຸດ. ແທນທີ່ເຮົາຈະຂຽນຄຳສັ່ງທີ່ຕາຍຕົວບອກຄອມພິວເຕີວ່າເຕັມ 100% ວ່າ “ນີ້ຄືເລກ 8”, ເຮົາພຽງແຕ່ສ້າງ “ຊັ້ນຂອງເຊວສະໝອງທຽມ” (Layers) ຂຶ້ນມາຫຼາຍໆຊັ້ນ ແລ້ວປ່ອຍໃຫ້ມັນຮຽນຮູ້ທີ່ຈະຈຳແນກຮູບແບບ (Patterns) ດ້ວຍຕົວມັນເອງຜ່ານການເບິ່ງຮູບພາບຈຳນວນຫຼວງຫຼາຍ.
ການອ່ານລາຍມື: ບັນຫາທີ່ໂດ່ງດັງທີ່ສຸດຂອງ AI
ໃນວົງການປັນຍາປະດິດ, ມີຊຸດຂໍ້ມູນໜຶ່ງທີ່ທຸກຄົນຕ້ອງໄດ້ຮຽນ ເອີ້ນວ່າ MNIST dataset. ມັນຄືຫໍສະໝຸດທີ່ເກັບກຳຮູບພາບຕົວເລກ 0 ຫາ 9 ທີ່ຂຽນດ້ວຍມືຈຳນວນຫຼາຍໝື່ນຮູບພາບ.
ປຽບທຽບງ່າຍໆ: ມັນຄືກັບຊຸດແຜ່ນບັດຄຳສັບ (Flashcards) ທີ່ນາຍຄູເອົາໄວ້ສອນນັກຮຽນອະນຸບານ. ຄອມພິວເຕີຈະຖືກຝຶກຝົນໂດຍການເບິ່ງຮູບຕົວເລກເຫຼົ່ານີ້ເທື່ອລະຮູບ ແລ້ວທວາຍວ່າແມ່ນເລກຫຍັງ ຈົນກວ່າມັນຈະເກັ່ງ ແລະ ທວາຍຖືກຕ້ອງທີ່ສຸດ.
ຄອມພິວເຕີມອງເຫັນຕົວເລກແນວໃດ? ແບບຈຳລອງພາບແບບຫົວຕໍ່ (Pixels)
ມະນຸດເຮົາເບິ່ງຮູບພາບແລ້ວຮູ້ທັນທີວ່ານັ້ນຄືເສັ້ນໂຄ້ງ ຫຼື ເສັ້ນຊື່, ແຕ່ຄອມພິວເຕີບໍ່ມີຕາຄືເຮົາ. ມັນມອງເຫັນຮູບພາບເປັນພຽງແຕ່ “ຕາຕະລາງຕົວເລກ”.
ລອງນຶກພາບຝາຜະໜັງທີ່ປະດັບດ້ວຍແຜ່ນກະໂລ່ນ້ອຍໆ (Mosaic) ຢູ່ຫໍພະແກ້ວ. ຮູບພາບຕົວເລກທີ່ຂຽນດ້ວຍມືຈະຖືກແບ່ງອອກເປັນຊ່ອງສີ່ຫຼ່ຽມນ້ອຍໆທີ່ເຮົາເອີ້ນວ່າ “ພິກເຊລ” (Pixels).
- ຖ້າຊ່ອງໃດເປັນສີຂາວລ້ວນ ມັນຈະໃຫ້ຄ່າເປັນເລກ 0
- ຖ້າຊ່ອງໃດເປັນສີດຳເຂັ້ມ (ຮອຍນ້ຳມິກ) ມັນຈະໃຫ້ຄ່າເປັນ 255
- ສ່ວນສີເທົາອ່ອນໆຕາມຂອບໜັງສື ກໍຈະເປັນຕົວເລກລະຫວ່າງກາງ.
ຂັ້ນຕອນການຕັດສິນໃຈຂອງ Neural Networks
ຫຼັງຈາກປ່ຽນຮູບພາບເປັນຕົວເລກແລ້ວ, Neural Networks ຈະເຮັດວຽກຜ່ານ 3 ຂັ້ນຕອນຫຼັກ:
- ຮັບຂໍ້ມູນ (Input Layer): ຄອມພິວເຕີຈະດູດເອົາຂໍ້ມູນຕົວເລກຄວາມເຂັ້ມຂອງສີຈາກທຸກໆຊ່ອງ (Pixels) ເຂົ້າໄປໃນລະບົບ.
- ວິເຄາະຮູບແບບ (Hidden Layers): ນີ້ຄືພາກສ່ວນທີ່ອັດສະລິຍະທີ່ສຸດ. ມັນຈະແບ່ງໜ້າທີ່ກັນເຮັດວຽກ ເຊັ່ນ: ກຸ່ມທຳອິດຊອກຫາ “ເສັ້ນຊື່ແນວຕັ້ງ”, ກຸ່ມທີສອງຊອກຫາ “ວົງມົນ”, ກຸ່ມທີສາມຊອກຫາ “ເສັ້ນໂຄ້ງ”. ຕົວຢ່າງ: ຖ້າມັນກວດພົບວົງມົນຢູ່ທາງເທິງ ແລະ ມີເສັ້ນໂຄ້ງລົງມາທາງລຸ່ມຂວາ, ກຸ່ມນີ້ຈະສົ່ງສັນຍານບອກວ່າ “ມີໂອກາດສູງທີ່ຈະເປັນເລກ 9!“.
- ສະແດງຜົນຕັດສິນໃຈ (Output Layer): ລະບົບຈະຄຳນວນຄວາມໜ້າຈະເປັນ (Probability) ແລ້ວຕອບອອກມາເຊັ່ນ: “ຂ້ອຍໝັ້ນໃຈ 95% ວ່ານີ້ຄືເລກ 3, ແລະ 5% ວ່າອາດຈະເປັນເລກ 8”.
ເປັນຫຍັງເຕັກໂນໂລຊີນີ້ຈຶ່ງສຳຄັນສຳລັບທຸລະກິດໃນລາວ?
ທ່ານອາດຈະຄິດວ່າ ການອ່ານຕົວເລກໄດ້ມັນກໍເປັນພຽງເລື່ອງນ້ອຍໆ, ແຕ່ປະໂຫຍດຂອງມັນກວ້າງຂວາງຫຼາຍ:
- ການເງິນ ແລະ ທະນາຄານ: ທະນາຄານໃນນະຄອນຫຼວງວຽງຈັນສາມາດໃຊ້ AI ເພື່ອສະແກນ ແລະ ອ່ານບິນຝາກ-ຖອນເງິນ ຫຼື ເຊັກປາຍທາງໄດ້ອັດຕະໂນມັດ ໂດຍທີ່ພະນັກງານບໍ່ຕ້ອງພິມຕົວເລກໃໝ່ທຸກຄັ້ງ ຊ່ວຍຫຼຸດຄວາມຜິດພາດ.
- ການຂົນສົ່ງ (Logistics): ລະບົບຄັດແຍກພັດສະດຸຈະວ່ອງໄວຂຶ້ນພຽງແຕ່ສະແກນໜ້າກ່ອງ, ລະບົບກໍຮູ້ທັນທີວ່າເຄື່ອງນີ້ຕ້ອງສົ່ງໄປແຂວງຈຳປາສັກ ຫຼື ຫຼວງພະບາງ.
- ຂະຫຍາຍສູ່ພາສາທ້ອງຖິ່ນ: ການທີ່ AI ຮຽນຮູ້ທີ່ຈະອ່ານຕົວເລກ ເປັນບາດກ້າວສຳຄັນທີ່ຈະນຳໄປສູ່ການໃຫ້ AI ສາມາດອ່ານ “ຕົວໜັງສືລາວລ້ານຊ້າງ” ຫຼື ລາຍມືພາສາລາວຈາກເອກະສານເກົ່າແກ່ໃນອະນາຄົດ.
ຈຸດສຳຄັນທີ່ຄວນຈື່ (Key Takeaways)
- ບໍ່ມີເວດມົນ: AI ບໍ່ໄດ້ໃຊ້ສາຍຕາເບິ່ງຄືຄົນ ແຕ່ມັນເບິ່ງຮູບພາບເປັນຕາຕະລາງຕົວເລກ (Pixels).
- ຮຽນຮູ້ດ້ວຍຕົວຢ່າງ: Neural Networks ເກັ່ງຂຶ້ນໄດ້ຈາກການເບິ່ງຮູບພາບຕົວຢ່າງຕົວເລກທີ່ຂຽນດ້ວຍມື (MNIST) ຊ້ຳໆເປັນຈຳນວນຫຼາຍ.
- ແຍກຍ່ອຍປັນຫາ: ລະບົບມັນຮຽນຮູ້ໂດຍການແຍກຮູບໜຶ່ງຮູບ ອອກເປັນອົງປະກອບຍ່ອຍໆ ເຊັ່ນ: ເສັ້ນຊື່, ວົງມົນ ກ່ອນຈະນຳມາປະກອບການຕັດສິນໃຈ.
ສະຫຼຸບ ເຕັກໂນໂລຊີ Neural Networks ທີ່ໃຊ້ໃນການຈຳແນກລາຍມື ຖືເປັນຈຸດເລີ່ມຕົ້ນທີ່ເຮັດໃຫ້ເຮົາເຂົ້າໃຈວ່າ ຄອມພິວເຕີຮຽນຮູ້ສັນຍະລັກຕ່າງໆເທິງໂລກປະຈຳວັນແນວໃດ. ຈາກການເບິ່ງຮູບຕົວເລກນ້ອຍໆ ພັດທະນາໄປສູ່ການຈົດຈຳໃບໜ້າ, ການຂັບລົດອັດຕະໂນມັດ, ແລະ ອີກຫຼາຍໆຢ່າງ ທີ່ກຳລັງເຂົ້າມາມີບົດບາດສຳຄັນໃນການພັດທະນາທຸລະກິດ ແລະ ເສດຖະກິດໃນປະເທດລາວ. ຖ້າເຮົາເຂົ້າໃຈພື້ນຖານຂອງມັນ ເຮົາກໍພ້ອມທີ່ຈະກ້າວຕາມໂລກຍຸກໃໝ່ໄດ້ຢ່າງໝັ້ນໃຈ.