AI ແປພາສາ (ເຊັ່ນ Google Translate) ເຮັດວຽກແນວໃດແທ້?
AI ແປພາສາ (ເຊັ່ນ Google Translate) ເຮັດວຽກແນວໃດແທ້?
ທ່ານເຄີຍຍ່າງຫຼິ້ນຢູ່ງານບຸນທາດຫຼວງ ແລ້ວມີນັກທ່ອງທ່ຽວຕ່າງຊາດເຂົ້າມາຖາມທາງ, ຈາກນັ້ນທ່ານພຽງແຕ່ຈົກໂທລະສັບຂຶ້ນມາເປີດແອັບ Google Translate ກໍສາມາດສື່ສານກັບເຂົາເຈົ້າໄດ້ຢ່າງເຂົ້າໃຈບໍ່? ຫຼື ທ່ານອາດຈະເປັນເຈົ້າຂອງທຸລະກິດ SME ຢູ່ທີ່ນະຄອນຫຼວງວຽງຈັນ ທີ່ຈຳເປັນຕ້ອງອ່ານເອກະສານສັນຍາຈາກຕ່າງປະເທດ ແລ້ວໃຊ້ AI ຊ່ວຍແປພາຍໃນພຽງສອງວິນາທີ.
ເຕັກໂນໂລຊີທີ່ປຽບສະເໝືອນ “ເວດມົນ” ນີ້ ມີຊື່ເອີ້ນເປັນທາງການວ່າ Natural Language Processing (NLP) ຫຼື ການປະມວນຜົນພາສາທຳມະຊາດ. ເຊິ່ງແມ່ນຂະແໜງການໜຶ່ງຂອງ AI ທີ່ຊ່ວຍໃຫ້ຄອມພິວເຕີສາມາດອ່ານ, ເຂົ້າໃຈ ແລະ ໂຕ້ຕອບດ້ວຍພາສາຂອງມະນຸດໄດ້.
ແຕ່ທ່ານຮູ້ຫຼືບໍ່ວ່າ? ກ່ອນທີ່ AI ແປພາສາຈະສະຫຼາດ ແລະ ເປັນທຳມະຊາດຄືທຸກມື້ນີ້, ມັນໄດ້ຜ່ານວິວັດທະນາການອັນຍາວນານ. ມື້ນີ້ເຮົາມາເບິ່ງກັນວ່າ ມັນມີການພັດທະນາມາແນວໃດ.
ຍຸກທຳອິດ: ການແປຕາມກົດເກນໄວຍາກອນ (Rule-Based Machine Translation)
ໃນຍຸກເລີ່ມຕົ້ນ, ການສອນໃຫ້ຄອມພິວເຕີແປພາສາ ແມ່ນຄ້າຍຄືກັບການຈ້າງນັກຮຽນທີ່ທ່ອງຈຳ “ວັດຈະນານຸກົມ” ແລະ “ປຶ້ມໄວຍາກອນ” ແບບເປະໆ. ວິທະຍາສາດຄອມພິວເຕີໃນຕອນນັ້ນ ຕ້ອງຂຽນກົດເກນທາງໄວຍາກອນຫຼາຍພັນຂໍ້ເຂົ້າໄປໃນລະບົບ.
- ວິທີການເຮັດວຽກ: ມັນຈະຕັດປະໂຫຍກອອກເປັນຄຳໆ, ປ່ຽນຄຳສັບຈາກພາສາໜຶ່ງໄປເປັນອີກພາສາໜຶ່ງຕາມວັດຈະນານຸກົມ ແລ້ວຈັດລຽງໃໝ່ຕາມກົດໄວຍາກອນ.
- ເປັນຫຍັງມັນຈຶ່ງຫຼົ້ມແຫຼວ? ພາສາຂອງມະນຸດມີຄວາມຊັບຊ້ອນເກີນກວ່າຈະໃຊ້ກົດຕາຍຕົວ ໂດຍສະເພາະພາສາລາວທີ່ບໍ່ມີການຍະຫວ່າງ (Spaces) ລະຫວ່າງຄຳສັບ. ຕົວຢ່າງ: ຖ້າເຮົາພິມຄຳວ່າ “ຂ້ອຍໄປກິນເຂົ້າ”, ລະບົບຍຸກເກົ່າອາດຈະແປກົງຕົງເປັນຄຳໆວ່າ “I go eat rice” ແທນທີ່ຈະເປັນປະໂຫຍກທີ່ຖືກຕ້ອງຕາມບໍລິບົດຄື “I am going to have a meal”.
ຍຸກກາງ: ການຮຽນຮູ້ຜ່ານສະຖິຕິ (Statistical Machine Translation)
ເມື່ອການໃຊ້ກົດເກນມັນຍາກເກີນໄປ, ລະບົບແປພາສາຈຶ່ງປ່ຽນມາໃຊ້ວິທີ “ການຄາດເດົາຈາກສະຖິຕິ”. ແທນທີ່ຈະປ້ອນກົດໄວຍາກອນໃຫ້ນຳໃຊ້, ນັກພັດທະນາໄດ້ນຳເອົາເອກະສານທີ່ເຄີຍຖືກແປໄວ້ແລ້ວ (ເຊັ່ນ: ເອກະສານຂອງອົງການສະຫະປະຊາຊາດ) ຈຳນວນຫຼາຍລ້ານໜ້າ ມາໃຫ້ຄອມພິວເຕີອ່ານ.
- ວິທີການເຮັດວຽກ: ຄອມພິວເຕີຈະປຽບທຽບເອກະສານສອງພາສາ ແລ້ວຊອກຫາຄວາມໜ້າຈະເປັນ. ຖ້າມັນເຫັນຄຳວ່າ “ສະບາຍດີ” ມັກຈະຢູ່ຄູ່ກັບຄຳວ່າ “Hello” ໃນເອກະສານຕົ້ນສະບັບຢູ່ສະເໝີ, ມັນກໍຈະຈື່ໄວ້ວ່າຄວນແປແບບນີ້.
- ຜົນກະທົບ: ວິທີນີ້ເຮັດໃຫ້ການແປໄວຂຶ້ນ ແລະ ດີຂຶ້ນຫຼາຍ. ແຕ່ເນື່ອງຈາກມັນຍັງແປເປັນທ່ອນໆ (Phrases) ໂດຍບໍ່ເຂົ້າໃຈຄວາມໝາຍຂອງທັງປະໂຫຍກ, ຜົນລັບທີ່ອອກມາຈຶ່ງຍັງອ່ານແລ້ວຮູ້ສຶກແຂງໆ ຄືກັບຫຸ່ນຍົນເວົ້າ.
ຍຸກປັດຈຸບັນ: ສະໝອງກົນທີ່ເຂົ້າໃຈບໍລິບົດ (Neural Machine Translation)
ນີ້ຄືເຕັກໂນໂລຊີທີ່ຢູ່ເບື້ອງຫຼັງຄວາມອັດສະຈັນຂອງ Google Translate ແລະ AI ດັງໆໃນຍຸກປະຈຸບັນ. ມັນໃຊ້ເຕັກໂນໂລຊີທີ່ເອີ້ນວ່າ ໂຄງຂ່າຍປະສາດທຽມ (Neural Networks) ເຊິ່ງເປັນການຈຳລອງການເຮັດວຽກຂອງສະໝອງມະນຸດ.
- ວິທີການເຮັດວຽກ: ແທນທີ່ AI ຈະແປເທື່ອລະຄຳ ຫຼື ເທື່ອລະທ່ອນ, ມັນຈະອ່ານ “ທັງປະໂຫຍກ” ເພື່ອທຳຄວາມເຂົ້າໃຈ ບໍລິບົດ (Context) ກ່ອນທີ່ຈະສ້າງປະໂຫຍກແປໃນພາສາປາຍທາງ.
- ຕົວຢ່າງຮູບປະທຳໃນບ້ານເຮົາ: ສົມມຸດທ່ານເປັນ SME ຂາຍກາເຟປາກຊ່ອງ ແລະ ມີລູກຄ້າຣີວິວເປັນພາສາລາວວ່າ: “ກາເຟຮ້ານນີ້ປຸກແຮງຫຼາຍ”. ຖ້າເປັນລະບົບເກົ່າ, ມັນອາດຈະແປວ່າ “This coffee shop wakes up very strongly” (ເຊິ່ງຜິດພ້ຽນໄປໃຫຍ່). ແຕ່ Neural Machine Translation ເຂົ້າໃຈບໍລິບົດຂອງຄຳວ່າ “ປຸກ” ໃນເລື່ອງຂອງກາເຟ, ມັນຈຶ່ງແປອອກມາຢ່າງສະຫຼາດວ່າ “The coffee here is very strong and keeps you awake”.
ຈຸດສຳຄັນທີ່ຄວນຈື່ (Key Takeaways)
- NLP ເປັນຂົວຕໍ່: ມັນຄືເຕັກໂນໂລຊີທີ່ທຳລາຍກຳແພງພາສາ ຊ່ວຍໃຫ້ທຸລະກິດ ແລະ ການສື່ສານໃນຊີວິດປະຈຳວັນງ່າຍຂຶ້ນ.
- ອະດີດຄືກົດເກນ: ຍຸກທຳອິດອີງໃສ່ກົດໄວຍາກອນ ເຊິ່ງແຂງກະດ້າງ ແລະ ບໍ່ທຳມະຊາດ (Rule-based).
- ກາງທາງຄືສະຖິຕິ: ຮຽນຮູ້ຜ່ານການປຽບທຽບເອກະສານເພື່ອກະກຽມການແປ (Statistical).
- ປັດຈຸບັນຄືສະໝອງກົນ: ວິເຄາະທັງປະໂຫຍກເພື່ອເຂົ້າໃຈບໍລິບົດຢ່າງເລິກເຊິ່ງ ເຮັດໃຫ້ການແປລ່ຽນໄຫຼຄືຄົນແທ້ໆ (Neural).
ບົດສະຫຼຸບ
ການພັດທະນາຂອງ AI ແປພາສາ ໄດ້ກ້າວກະໂດດຈາກພຽງແຕ່ວັດຈະນານຸກົມດິຈິຕອນ ມາເປັນຜູ້ຊ່ວຍທີ່ເຂົ້າໃຈພາສາ ແລະ ວັດທະນະທຳຂອງມະນຸດຢ່າງເລິກເຊິ່ງ. ໃນຂະນະທີ່ເຕັກໂນໂລຊີກ້າວໜ້າໄປໜ້າ, ໃນອະນາຄົດພວກເຮົາຄົງຈະໄດ້ເຫັນ AI ທີ່ເຂົ້າໃຈພາສາລາວໄດ້ດີຂຶ້ນ, ຮູ້ຈັກຄຳສະແລງ ຫຼື ແມ່ນແຕ່ສຽງຂຶ້ນລົງອັນເປັນເອກະລັກຂອງທ້ອງຖິ່ນເຮົາ ເຊິ່ງຈະຊ່ວຍຫຍໍ້ໂລກທັງໜ່ວຍໃຫ້ມາເຊື່ອມຕໍ່ກັບປະເທດລາວໄດ້ງ່າຍກວ່າທີ່ເຄີຍເປັນມາ.