ເປັນຫຍັງຜູ້ຊ່ວຍສຽງ (Voice Assistants) ຈຶ່ງຍັງເວົ້າພາສາລາວບໍ່ໄດ້?
ເປັນຫຍັງຜູ້ຊ່ວຍສຽງ (Voice Assistants) ຈຶ່ງຍັງເວົ້າພາສາລາວບໍ່ໄດ້?
ລອງຈິນຕະນາການເບິ່ງວ່າ ທຸກໆເຊົ້າທີ່ທ່ານຂັບລົດໄປວຽກຜ່ານສີ່ແຍກໄຟແດງທາດຫຼວງທີ່ລົດຕິດແອອັດ ແລ້ວທ່ານສາມາດເວົ້າກັບໂທລະສັບໄດ້ງ່າຍໆວ່າ “Siri, ຊອກທາງທີ່ລົດບໍ່ຕິດໄປແຖວສີຫອມໃຫ້ແດ່” ຫຼື “Google, ອ່ານຂ່າວລະດັບນ້ຳຂອງມື້ນີ້ໃຫ້ຟັງແນ່” ແລ້ວພວກມັນກໍຕອບກັບມາເປັນພາສາລາວທີ່ຊັດເຈນແລະເປັນທຳມະຊາດ. ມັນຄົງຈະສະດວກສະບາຍຫຼາຍແມ່ນບໍ່?
ແຕ່ໃນຄວາມເປັນຈິງ, ເຖິງວ່າເຕັກໂນໂລຊີ AI ໃນໂລກຈະກ້າວໜ້າໄປໄກສ່ຳໃດ, ຜູ້ຊ່ວຍສຽງອັດສະລິຍະ (Voice Assistants) ເຫຼົ່ານີ້ ກໍຍັງບໍ່ສາມາດເຂົ້າໃຈ ຫຼື ເວົ້າພາສາລາວໄດ້ດີເທົ່າທີ່ຄວນ. ເປັນຫຍັງຈຶ່ງເປັນແນວນັ້ນ? ມື້ນີ້ເຮົາຈະມາໄຂຂໍ້ຂ້ອງໃຈກ່ຽວກັບເລື່ອງນີ້ ໃນພາສາທີ່ເຂົ້າໃຈງ່າຍທີ່ສຸດ.
NLP: ສະໝອງທີ່ເຮັດໃຫ້ຄອມພິວເຕີເຂົ້າໃຈພາສາຄົນ
ກ່ອນອື່ນໝົດ, ເຮົາມາຮູ້ຈັກກັບຄຳວ່າ NLP (Natural Language Processing) ຫຼື ການປະມວນຜົນພາສາທຳມະຊາດ. ນີ້ຄືເຕັກໂນໂລຊີສະໝອງກົນ (AI) ທີ່ພະຍາຍາມຮຽນຮູ້ ແລະ ເຂົ້າໃຈພາສາຂອງມະນຸດ.
ໃນໂລກຂອງຜູ້ຊ່ວຍສຽງ, NLP ປະກອບມີ 2 ສ່ວນສຳຄັນຄື:
- Speech-to-Text (STT): ການປ່ຽນ “ສຽງເວົ້າ” ໃຫ້ກາຍເປັນ “ຕົວໜັງສື”. (ໃຫ້ຄອມພິວເຕີຟັງເຮົາແລ້ວພິມອອກມາ).
- Text-to-Speech (TTS): ການປ່ຽນ “ຕົວໜັງສື” ໃຫ້ກາຍເປັນ “ສຽງເວົ້າ”. (ໃຫ້ຄອມພິວເຕີອ່ານໜັງສືໃຫ້ເຮົາຟັງ).
ລະບົບເຫຼົ່ານີ້ຈະເຮັດວຽກໄດ້ດີ ກໍຕໍ່ເມື່ອມັນໄດ້ຮັບການ “ຝຶກຝົນ” ຢ່າງໜັກ, ຄືກັນກັບການສົ່ງເດັກນ້ອຍເຂົ້າໂຮງຮຽນເພື່ອຮຽນຮູ້ການອ່ານແລະການຂຽນນັ້ນເອງ.
ບັນຫາຫຼັກ: “ຊ່ອງຫວ່າງທາງຂໍ້ມູນ” (The Data Gap)
ຖ້າ AI ເປັນນັກຮຽນ, “ຂໍ້ມູນ” (Data) ກໍຄືປຶ້ມແບບຮຽນ. ສາເຫດຫຼັກທີ່ Google ຫຼື Siri ຍັງເວົ້າພາສາລາວບໍ່ເກັ່ງ ແມ່ນຍ້ອນສິ່ງທີ່ເອີ້ນວ່າ “ຊ່ອງຫວ່າງທາງຂໍ້ມູນ” (Data Gap).
ສຳລັບພາສາສະກົນ ເຊັ່ນ ພາສາອັງກິດ, ນັກພັດທະນາມີຂໍ້ມູນສຽງແລະຂໍ້ຄວາມມະຫາສານທີ່ຢູ່ໃນອິນເຕີເນັດໃຫ້ AI ໄດ້ຮຽນຮູ້ ເປັນຈຳນວນຫຼາຍລ້ານໆຊົ່ວໂມງ. ແຕ່ສຳລັບພາສາລາວແລ້ວ, ພວກເຮົາຍັງຂາດແຄນຂໍ້ມູນດິຈິຕອນທີ່ເປັນລະບຽບ (Structured Data). ການທີ່ບໍ່ມີໄຟລ໌ສຽງຫຼາຍພຽງພໍ ທີ່ຈັບຄູ່ກັບຕົວໜັງສືລາວທີ່ຖືກຕ້ອງ ເຮັດໃຫ້ AI ບໍ່ມີ “ປຶ້ມແບບຮຽນ” ທີ່ພຽງພໍສຳລັບການຮຽນຮູ້ພາສາຂອງພວກເຮົາ.
ຄວາມທ້າທາຍຂອງພາສາລາວທີ່ AI ຕ້ອງກຸ້ມຫົວ
ນອກຈາກເລື່ອງຂໍ້ມູນແລ້ວ, ໂຄງສ້າງຂອງພາສາລາວເອງກໍມີຄວາມຊັບຊ້ອນທີ່ເຮັດໃຫ້ AI (ທີ່ມັກຖືກສ້າງມາສຳລັບພາສາຕາເວັນຕົກ) ຮຽນຮູ້ໄດ້ຍາກຫຼາຍ:
1. ການຂຽນທີ່ບໍ່ມີການຍະຫວ່າງ (No Word Spaces)
ພາສາລາວເຮົາຂຽນຕິດກັນເປັນປະໂຫຍກຍາວໆ ໂດຍບໍ່ມີການຍະຫວ່າງລະຫວ່າງຄຳ ເຊັ່ນ: “ຂ້ອຍຢາກກິນເຂົ້າປຽກ” ແທນທີ່ຈະເປັນ “ຂ້ອຍ ຢາກ ກິນ ເຂົ້າ ປຽກ”. ສຳລັບຄົນເຮົາ, ການແຍກຄຳແມ່ນເລື່ອງອັດຕະໂນມັດ, ແຕ່ສຳລັບ AI ມັນເປັນເລື່ອງຍາກຫຼາຍທີ່ຈະຊອກຫາວ່າຄຳໜຶ່ງຈົບຢູ່ໃສ ແລະ ຄຳໃໝ່ເລີ່ມຕົ້ນຢູ່ໃສ.
2. ພາສາທີ່ມີສຽງວັນນະຍຸດ (Tonal Language)
ພາສາລາວມີສຽງສູງ, ຕ່ຳ, ເອກ, ໂທ ທີ່ປ່ຽນຄວາມໝາຍຂອງຄຳສັບໄດ້ທັນທີ. ຕົວຢ່າງຄຳວ່າ:
- ປາ (ສັດນ້ຳ)
- ປ່າ (ປ່າໄມ້)
- ປ້າ (ເອື້ອຍຂອງພໍ່ ຫຼື ແມ່)
AI ຕ້ອງເກັ່ງຫຼາຍຈຶ່ງຈະແຍກອອກວ່າ ເຮົາກຳລັງເວົ້າເຖິງ “ການໄປຫາປາ” ຫຼື “ການໄປຫາປ້າ”.
3. ສຳນຽງທ້ອງຖິ່ນທີ່ຫຼາກຫຼາຍ (Dialects)
ຄົນແຕ່ລະແຂວງໃນລາວມີສຳນຽງແລະການໃຊ້ຄຳສັບທີ່ແຕກຕ່າງກັນ. ການເວົ້າຂອງຄົນຫຼວງພະບາງ, ຄົນວຽງຈັນ ແລະ ຄົນປາກເຊ ແມ່ນມີເອກະລັກສະເພາະຕົວ. ການຈະສ້າງ AI ໜຶ່ງຕົວໃຫ້ເຂົ້າໃຈທຸກສຳນຽງຮຽກຮ້ອງໃຫ້ຕ້ອງມີການເກັບກຳຂໍ້ມູນຈາກທຸກໆພາກຂອງປະເທດ.
ເປັນຫຍັງເຕັກໂນໂລຊີສຽງຈຶ່ງສຳຄັນສຳລັບຄົນລາວ?
ທ່ານອາດຈະຖາມວ່າ “ກໍແຄ່ໃຊ້ສຽງສັ່ງການບໍ່ໄດ້ ກໍພິມເອົາກໍໄດ້ຕວ໋ະ?”
ແຕ່ໃນຄວາມເປັນຈິງ, ເຕັກໂນໂລຊີ Voice Assistants ມີປະໂຫຍດໃນຊີວິດປະຈຳວັນຫຼາຍກວ່ານັ້ນ:
- ຊ່ວຍເຫຼືອຊາວກະສິກອນ: ຊາວສວນກາເຟຢູ່ປາກຊ່ອງ ທີ່ອາດຈະບໍ່ຖະໜັດໃນການພິມໜັງສືລົງໃນສະມາດໂຟນ ສາມາດໃຊ້ສຽງຖາມ AI ກ່ຽວກັບລາຄາກາເຟ ຫຼື ພະຍາກອນອາກາດລ່ວງໜ້າໄດ້ທັນທີ.
- ທຸລະກິດ SME ທ້ອງຖິ່ນ: ຮ້ານຄ້າຕ່າງໆສາມາດນຳໃຊ້ລະບົບຕອບຮັບອັດຕະໂນມັດ (Voice Bot) ທີ່ເວົ້າພາສາລາວ ເພື່ອຮັບອໍເດີລູກຄ້າໄດ້ຕະຫຼອດ 24 ຊົ່ວໂມງ.
- ຄວາມປອດໄພເທິງທ້ອງຖະໜົນ: ໃນຍາມທີ່ການຈາລະຈອນແອອັດໃນນະຄອນຫຼວງວຽງຈັນ, ການສັ່ງໃຫ້ມືຖືສົ່ງຂໍ້ຄວາມດ້ວຍສຽງ ຈະຊ່ວຍຫຼຸດຜ່ອນອຸບັດຕິເຫດຈາກການກົ້ມໜ້າເບິ່ງຈໍໄດ້.
- ການເຂົ້າເຖິງຂອງຜູ້ສູງອາຍຸ: ຜູ້ເຖົ້າທີ່ຕາບໍ່ຄ່ອຍດີກໍສາມາດເຂົ້າເຖິງແຫຼ່ງຂໍ້ມູນຂ່າວສານຕ່າງໆໄດ້ງ່າຍຂຶ້ນພຽງແຕ່ໃຊ້ສຽງ.
ຈຸດສຳຄັນທີ່ຄວນຈື່ (Key Takeaways)
- NLP (Natural Language Processing) ແມ່ນເຕັກໂນໂລຊີ AI ທີ່ເຮັດໃຫ້ຄອມພິວເຕີເຂົ້າໃຈ ແລະ ສື່ສານເປັນພາສາມະນຸດໄດ້.
- “ຊ່ອງຫວ່າງທາງຂໍ້ມູນ” (Data Gap) ແມ່ນສາເຫດຫຼັກທີ່ເຮັດໃຫ້ AI ຍັງເວົ້າລາວບໍ່ໄດ້, ເພາະພວກເຮົາຍັງຂາດແຄນຂໍ້ມູນສຽງ ແລະ ຕົວໜັງສືໃນລະບົບດິຈິຕອນທີ່ພຽງພໍ.
- ຄວາມຊັບຊ້ອນຂອງພາສາລາວ ເຊັ່ນ: ສຽງວັນນະຍຸດ, ກົດລະບຽບການບໍ່ຍະຫວ່າງຄຳ ແລະ ສຳນຽງທ້ອງຖິ່ນທີ່ຫຼາກຫຼາຍ ເຮັດໃຫ້ນັກພັດທະນາຕ້ອງໃຊ້ເວລາພະຍາຍາມຫຼາຍຂຶ້ນ.
ບົດສະຫຼຸບ
ການທີ່ພວກເຮົາຈະມີ Voice Assistant ທີ່ສາມາດເຂົ້າໃຈພາສາລາວໄດ້ຢ່າງສົມບູນ ບໍ່ແມ່ນເລື່ອງທີ່ໄກເກີນຈິງ, ແຕ່ມັນຮຽກຮ້ອງໃຫ້ທຸກພາກສ່ວນ ເຊັ່ນ: ນັກພັດທະນາຊອັບແວ (Developers), ມະຫາວິທະຍາໄລ, ພາກລັດ ແລະ ເຖິງແມ່ນແຕ່ພວກເຮົາທຸກຄົນ ຊ່ວຍກັນສ້າງ ແລະ ແບ່ງປັນຂໍ້ມູນພາສາລາວ (Data Sets) ຂຶ້ນມາເທິງໂລກດິຈິຕອນ. ມື້ໜຶ່ງ, ການສັ່ງການໃຫ້ສະມາດໂຟນສັ່ງເຂົ້າປຽກແຊບໆຈັກຖ້ວຍໃຫ້ເຮົາໃນຕອນເຊົ້າ ດ້ວຍສຽງພາສາລາວອາດຈະກາຍເປັນເລື່ອງປົກກະຕິໃນຊີວິດປະຈຳວັນຂອງພວກເຮົາກໍເປັນໄດ້.