5 ແຫຼ່ງຂໍ້ມູນ (Datasets) ແບບເປີດກວ້າງກ່ຽວກັບປະເທດລາວທີ່ທ່ານສາມາດນຳໃຊ້ໄດ້ໃນມື້ນີ້
5 ແຫຼ່ງຂໍ້ມູນ (Datasets) ແບບເປີດກວ້າງກ່ຽວກັບປະເທດລາວທີ່ທ່ານສາມາດນຳໃຊ້ໄດ້ໃນມື້ນີ້
ຍິນດີຕ້ອນຮັບທຸກທ່ານເຂົ້າສູ່ໂລກຂອງການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ຫຼື Machine Learning (ML)! ຖ້າປຽບທຽບເຕັກໂນໂລຊີ AI ເປັນເຄື່ອງຈັກຂອງລົດຍົນ, “ຊຸດຂໍ້ມູນ” ຫຼື ທີ່ພວກເຮົາເອີ້ນກັນວ່າ Dataset ກໍຄື “ນໍ້າມັນ” ທີ່ເຮັດໃຫ້ລົດຄັນນັ້ນແລ່ນໄດ້.
ສຳລັບຜູ້ທີ່ຫາກໍເລີ່ມຕົ້ນສຶກສາ, ການຈະສ້າງໂປຣແກຣມອັດສະລິຍະທຳອິດຂຶ້ນມາ ອາດເປັນເລື່ອງທີ່ເບິ່ງຄືວ່າຍາກ ໂດຍສະເພາະການຊອກຫາຂໍ້ມູນທີ່ກ່ຽວຂ້ອງກັບບ້ານເຮົາ. ແຕ່ຄວາມຈິງແລ້ວ, ມີແຫຼ່ງຂໍ້ມູນແບບເປີດກວ້າງ (Open Source) ກ່ຽວກັບປະເທດລາວຫຼາຍຢ່າງ ທີ່ທ່ານສາມາດດາວໂຫຼດມາຝຶກຝົນໄດ້ຟຣີ! ມື້ນີ້, ພວກເຮົາຈະມາແນະນຳ 5 ແຫຼ່ງຂໍ້ມູນທີ່ໜ້າສົນໃຈ ສຳລັບນຳໄປຝຶກສອນ AI ຂອງທ່ານໃຫ້ເກັ່ງຂຶ້ນ ແລະ ແກ້ໄຂບັນຫາໃນທ້ອງຖິ່ນໄດ້ຈິງ.
5 ແຫຼ່ງຂໍ້ມູນເປີດ (Open Source Datasets) ທີ່ທ່ານບໍ່ຄວນພາດ
1. ຂໍ້ມູນລະດັບນ້ຳຂອງ ແລະ ອຸຕຸນິຍົມວິທະຍາ (Mekong River Commission Data)
- ມັນຄືຫຍັງ? ຄະນະກຳມາທິການແມ່ນ້ຳຂອງ (MRC) ໄດ້ເປີດເຜີຍຂໍ້ມູນສະຖິຕິລະດັບນ້ຳ, ປະລິມານນ້ຳຝົນ ແລະ ສະພາບອາກາດໃນລ້ອງແມ່ນ້ຳຂອງ ທີ່ມີການບັນທຶກໄວ້ຫຼາຍສິບປີ.
- ນຳໄປໃຊ້ປະໂຫຍດແນວໃດ? ຂໍ້ມູນນີ້ສຳຄັນຫຼາຍ! ທ່ານສາມາດໃຊ້ Machine Learning ເພື່ອວິເຄາະ ແລະ ຄາດເດົາລະດັບນ້ຳຂອງໃນອາທິດໜ້າ. ຜົນໄດ້ຮັບຈາກ AI ຂອງທ່ານ ສາມາດກາຍເປັນລະບົບແຈ້ງເຕືອນໄພນ້ຳຖ້ວມລ່ວງໜ້າ ທີ່ຊ່ວຍຊີວິດ ແລະ ຊັບສິນຂອງປະຊາຊົນລຽບຕາມແຄມຂອງ ໃນນະຄອນຫຼວງວຽງຈັນ ຫຼື ແຂວງຫຼວງພະບາງ ໄດ້ຢ່າງທັນທ່ວງທີ.
2. ຂໍ້ມູນແຜນທີ່ທາງພູມິສາດ (OpenStreetMap ປະເທດລາວ)
- ມັນຄືຫຍັງ? OpenStreetMap (OSM) ເປັນເໝືອນ Wikipedia ຂອງແຜນທີ່. ມັນລວບລວມຂໍ້ມູນຕັ້ງແຕ່ເສັ້ນທາງຫຼັກ, ຮ່ອມນ້ອຍ, ໄປຈົນເຖິງຮ້ານອາຫານ ແລະ ທີ່ຕັ້ງຂອງຕຶກອາຄານຕ່າງໆໃນປະເທດລາວ.
- ນຳໄປໃຊ້ປະໂຫຍດແນວໃດ? ສຳລັບຜູ້ເລີ່ມຕົ້ນ, ທ່ານສາມາດເອົາຂໍ້ມູນຖະໜົນຫົນທາງເຫຼົ່ານີ້ ມາສ້າງໂປຣແກຣມຄາດເດົາການຈະລາຈອນ. ລອງນຶກພາບເບິ່ງວ່າ ທ່ານສາມາດສ້າງແອັບຯທີ່ຊ່ວຍຄົນຫຼີກລ່ຽງລົດຕິດໃນຊົ່ວໂມງຮີບດ່ວນຢູ່ແຖວປະຕູໄຊ ຫຼື ຕະຫຼາດເຊົ້າ ໂດຍອີງໃສ່ຂໍ້ມູນພື້ນທີ່ຈິງ.
3. ຂໍ້ມູນດ້ານພາສາລາວ (Lao Wikipedia ແລະ OSCAR Corpus)
- ມັນຄືຫຍັງ? ການທີ່ AI ຈະເຂົ້າໃຈພາສາລາວໄດ້, ມັນຕ້ອງອ່ານໜັງສືລາວໃຫ້ຫຼາຍທີ່ສຸດ. ຊຸດຂໍ້ມູນເຊັ່ນ ບົດຄວາມຈາກ Wikipedia ພາສາລາວ ແລະ ຊຸດຂໍ້ມູນ OSCAR (ເຊິ່ງດູດຂໍ້ຄວາມພາສາລາວຈາກອິນເຕີເນັດ) ແມ່ນມີໃຫ້ດາວໂຫຼດຟຣີ.
- ນຳໄປໃຊ້ປະໂຫຍດແນວໃດ? ຂໍ້ມູນເຫຼົ່ານີ້ແມ່ນຈຸດເລີ່ມຕົ້ນຂອງສິ່ງທີ່ເອີ້ນວ່າ Natural Language Processing (NLP) ຫຼື ການປະມວນຜົນພາສາທຳມະຊາດ. ທ່ານສາມາດຝຶກສອນ AI ໃຫ້ແປພາສາລາວ, ສ້າງລະບົບກວດຄຳຜິດ, ຫຼື ແມ່ນແຕ່ສ້າງ Chatbot ທີ່ເວົ້າພາສາລາວ ເພື່ອຊ່ວຍຕອບຄຳຖາມລູກຄ້າໃຫ້ກັບທຸລະກິດ SME ຂອງລາວ.
4. ຂໍ້ມູນດ້ານເສດຖະກິດ-ສັງຄົມ (Lao DECIDE Info / World Bank)
- ມັນຄືຫຍັງ? ເວັບໄຊທ໌ເຊັ່ນ Lao DECIDE (ເຊິ່ງຮວບຮວມຂໍ້ມູນຈາກລັດຖະບານລາວ) ຫຼື ທະນາຄານໂລກ (World Bank) ໄດ້ເກັບກຳສະຖິຕິກ່ຽວກັບປະຊາກອນ, ການສຶກສາ, ໂຮງໝໍ ແລະ ເສດຖະກິດຂອງແຕ່ລະເມືອງໃນປະເທດລາວ.
- ນຳໄປໃຊ້ປະໂຫຍດແນວໃດ? ການໃຊ້ຂໍ້ມູນຕົວເລກນີ້ ຈະຊ່ວຍໃຫ້ທ່ານເຫັນພາບລວມຂອງປະເທດ. ສາມາດໃຊ້ ML ເພື່ອຄົ້ນຫາຮູບແບບ (Patterns) ເຊັ່ນ: ການຄາດເດົາວ່າເມືອງໃດຈະມີຄວາມຕ້ອງການດ້ານອຸປະກອນການແພດຫຼາຍທີ່ສຸດ ຫຼື ວິເຄາະແນວໂນ້ມຕະຫຼາດທີ່ຈະຊ່ວຍໃຫ້ຜູ້ປະກອບການຕັດສິນໃຈເປີດທຸລະກິດໃໝ່ໄດ້ຖືກຈຸດ.
5. ຂໍ້ມູນຮູບພາບດາວທຽມ (Satellite Imagery ຜ່ານ Google Earth Engine)
- ມັນຄືຫຍັງ? ຮູບຖ່າຍຈາກຊັ້ນບັນຍາກາດທີ່ສະແດງໃຫ້ເຫັນພື້ນທີ່ຕ່າງໆ ທັງປ່າໄມ້, ພູເຂົາ, ແລະ ພື້ນທີ່ກະສິກຳ ທົ່ວປະເທດລາວ.
- ນຳໄປໃຊ້ປະໂຫຍດແນວໃດ? ນີ້ແມ່ນຂໍ້ມູນທີ່ຊົງພະລັງສຳລັບຂະແໜງການກະເສດ. ທ່ານສາມາດສອນຄອມພິວເຕີ (Computer Vision) ໃຫ້ເບິ່ງຮູບດາວທຽມເຫຼົ່ານີ້ ແລ້ວແຍກແຍະວ່າພື້ນທີ່ໃດເປັນປ່າໄມ້, ພື້ນທີ່ໃດແມ່ນເນື້ອທີ່ການກະເສດ. ເຕັກນິກນີ້ສາມາດນຳໄປໃຊ້ປະເມີນສຸຂະພາບຂອງສວນກາເຟຢູ່ເມືອງປາກຊ່ອງ ຫຼື ຄາດຄະເນຜົນຜະລິດແນວພັນເຂົ້າໃນທົ່ງພຽງວຽງຈັນ ໂດຍທີ່ບໍ່ຕ້ອງລົງໄປນັບດ້ວຍຕົວເອງ!
Key Takeaways (ສິ່ງສຳຄັນທີ່ຄວນຈື່)
- ຂໍ້ມູນຄືນໍ້າມັນ: Machine Learning ບໍ່ສາມາດເຮັດວຽກໄດ້ ຖ້າຂາດຂໍ້ມູນ (Data). ຍິ່ງຂໍ້ມູນມີຄຸນນະພາບ, AI ຂອງທ່ານກໍຍິ່ງສະຫຼາດ.
- ມີຂອງຟຣີໃຫ້ໃຊ້: ທ່ານບໍ່ຈຳເປັນຕ້ອງໄປຊື້ຂໍ້ມູນແພງໆ; ແຫຼ່ງຂໍ້ມູນເປີດ (Open Source Datasets) ຈະຊ່ວຍໃຫ້ທ່ານເລີ່ມຕົ້ນຮຽນຮູ້ໄດ້ທັນທີແບບບໍ່ມີຄ່າໃຊ້ຈ່າຍ.
- ແກ້ໄຂບັນຫາໃກ້ຕົວ: ການນຳໃຊ້ຂໍ້ມູນທີ່ກ່ຽວຂ້ອງກັບລາວ (ເຊັ່ນ: ລະດັບນ້ຳຂອງ, ພາສາລາວ, ຫຼື ສວນກາເຟ) ຈະເຮັດໃຫ້ການຮຽນຮູ້ຂອງທ່ານມີຄວາມໝາຍ ແລະ ສ້າງປະໂຫຍດໃຫ້ກັບສັງຄົມເຮົາໄດ້ຢ່າງແທ້ຈິງ.
ສະຫຼຸບ (Conclusion)
ການກ້າວເຂົ້າສູ່ໂລກຂອງການພັດທະນາ AI ແລະ Machine Learning ບໍ່ຈຳເປັນຕ້ອງໃຊ້ຂໍ້ມູນທີ່ສົມບູນແບບຈາກຕ່າງປະເທດສະເໝີໄປ. ການເລີ່ມຕົ້ນຈາກຂໍ້ມູນທີ່ໃກ້ຕົວ ແລະ ມີຄວາມກ່ຽວຂ້ອງກັບບໍລິບົດຂອງປະເທດລາວ ບໍ່ພຽງແຕ່ຊ່ວຍໃຫ້ທ່ານເຂົ້າໃຈຫຼັກການເຮັດວຽກຂອງ ML ໄດ້ງ່າຍຂຶ້ນ, ແຕ່ຍັງເປັນການເປີດປະຕູສູ່ການສ້າງນະວັດຕະກຳໃໝ່ໆ ທີ່ສາມາດແກ້ໄຂບັນຫາໃຫ້ກັບຊຸມຊົນຂອງພວກເຮົາເອງ. ລອງເລືອກໜຶ່ງໃນ 5 ແຫຼ່ງຂໍ້ມູນນີ້ ດາວໂຫຼດມາໄວ້ໃນເຄື່ອງ ແລ້ວເລີ່ມຕົ້ນສ້າງຜົນງານ Machine Learning ອັນທຳອິດຂອງທ່ານໃນມື້ນີ້ເລີຍ! ຖ້າທ່ານມີໄອເດຍໃໝ່ໆ ກໍສາມາດແບ່ງປັນໃຫ້ກັບໝູ່ເພື່ອນໃນວົງການເຕັກໂນໂລຊີບ້ານເຮົາໄດ້ຮັບຮູ້ໄປພ້ອມກັນ.