ສຽງກັອບປີ້ (Voice Clones): ເບື້ອງຫຼັງເຕັກໂນໂລຊີ Deep Learning ທີ່ສ້າງ Audio Deepfakes

ໂພສເມື່ອ 2025-06-20 # Deep Learning # AI Safety # Audio Deepfakes —

ສຽງກັອບປີ້ (Voice Clones): ເບື້ອງຫຼັງເຕັກໂນໂລຊີ Deep Learning ທີ່ສ້າງ Audio Deepfakes

ລອງຈິນຕະນາການເບິ່ງວ່າ… ໃນຕອນບ່າຍມື້ໜຶ່ງ ທ່ານໄດ້ຮັບສາຍໂທເຂົ້າຈາກຍາດພີ່ນ້ອງທີ່ຢູ່ນະຄອນປາກເຊ ໂທມາບອກວ່າເກີດອຸບັດຕິເຫດ ແລະ ຕ້ອງການໃຫ້ທ່ານໂອນເງິນດ່ວນຜ່ານແອັບ BCEL One. ສຽງທີ່ທ່ານໄດ້ຍິນນັ້ນ ຄືສຽງຂອງເພິ່ນແທ້ໆ 100% ທັງນໍ້າສຽງ ແລະ ຈັງຫວະການເວົ້າ. ແຕ່ຄວາມຈິງແລ້ວ ນັ້ນບໍ່ແມ່ນສຽງຂອງຍາດພີ່ນ້ອງຂອງທ່ານເລີຍ… ມັນຄືສຽງທີ່ຖືກສ້າງຂຶ້ນໂດຍ AI (ປັນຍາປະດິດ).

ນີ້ຄືສິ່ງທີ່ໃນວົງການເຕັກໂນໂລຊີເອີ້ນວ່າ Audio Deepfake ມັນກຳລັງກາຍເປັນຮູບແບບໃໝ່ຂອງການຫຼອກລວງໃນຍຸກດິຈິຕອນ. ແລະ ຢູ່ເບື້ອງຫຼັງຄວາມສາມາດອັນໜ້າທຶ້ງ (ແຕ່ແຝງໄປດ້ວຍອັນຕະລາຍ) ນີ້ ກໍຄືເຕັກໂນໂລຊີທີ່ຊື່ວ່າ Deep Learning.

Deep Learning ແລະ Audio Deepfake ແມ່ນຫຍັງ?

ເວົ້າໃຫ້ເຂົ້າໃຈງ່າຍໆ, Deep Learning (ການຮຽນຮູ້ແບບເລິກເຊິ່ງ) ແມ່ນສະໝອງຂອງຄອມພິວເຕີທີ່ຖືກອອກແບບມາໃຫ້ຮຽນແບບວິທີການຄິດຂອງສະໝອງມະນຸດ. ມັນສາມາດປະມວນຜົນຂໍ້ມູນຈຳນວນມະຫາສານ ເພື່ອຊອກຫາຮູບແບບ ຫຼື ຈຸດເດັ່ນໃນຂໍ້ມູນນັ້ນໆ.

ເມື່ອເຮົາເອົາເຕັກໂນໂລຊີ Deep Learning ມາໃຊ້ກັບ “ສຽງ”, ມັນຈຶ່ງເກີດມີ Audio Deepfake ເຊິ່ງໝາຍເຖິງການໃຊ້ AI ເພື່ອສັງເຄາະ ຫຼື ກັອບປີ້ສຽງຂອງຄົນໃດຄົນໜຶ່ງ ໃຫ້ອອກມາສົມຈິງຈົນຫູຂອງຄົນທົ່ວໄປຍາກທີ່ຈະແຍກອອກ.

ເຖິງແມ່ນວ່າເຕັກໂນໂລຊີນີ້ນຳມາໃຊ້ໃນທາງທີ່ດີໄດ້ ເຊັ່ນ: ການອ່ານປຶ້ມສຽງໃຫ້ນັກຮຽນຕາບອດຟັງ ຫຼື ການສ້າງຜູ້ຊ່ວຍສະເໝືອນຈິງ (Virtual Assistant) ທີ່ເວົ້າພາສາລາວໄດ້ເປັນທຳມະຊາດ, ແຕ່ກໍປະຕິເສດບໍ່ໄດ້ວ່າ ມັນຖືກນຳໃຊ້ໃນທາງທີ່ຜິດຫຼາຍຂຶ້ນເລື້ອຍໆ.

AI ກັອບປີ້ສຽງຄົນເຮົາໄດ້ແນວໃດ?

ທ່ານອາດຈະຄິດວ່າການຈະສ້າງສຽງປອມໄດ້ ຕ້ອງໃຊ້ການອັດສຽງໃນສະຕູດິໂອເປັນເວລາດົນ. ແຕ່ໃນປັດຈຸບັນ, ດ້ວຍຄວາມເກັ່ງກາດຂອງ Deep Learning, ທຸກຢ່າງງ່າຍຂຶ້ນຫຼາຍ. ຂະບວນການເຮັດວຽກຂອງມັນມີພຽງ 3 ຂັ້ນຕອນຫຼັກ:

1. ການເກັບກຳຂໍ້ມູນ (Data Collection): AI ຕ້ອງການພຽງແຕ່ຕົວຢ່າງສຽງເວົ້າສັ້ນໆ ບາງຄັ້ງແຄ່ 3 ຫາ 5 ວິນາທີເທົ່ານັ້ນ. ຂໍ້ມູນເຫຼົ່ານີ້ອາດຈະມາຈາກວິດີໂອທີ່ທ່ານເຄີຍອັບໂຫຼດລົງໃນ TikTok, ເຟສບຸກ (Facebook) ໄລຟ໌ ຫຼື ວິດີໂອສຳພາດຕ່າງໆ.
2. ວິເຄາະຫາເອກະລັກ (Feature Extraction): ລະບົບ Deep Learning ຈະເຂົ້າມາເຮັດໜ້າທີ່ວິເຄາະຫາ “ລັກສະນະສະເພາະ” ຂອງສຽງນັ້ນ. ມັນຈະຮຽນຮູ້ວ່າ ທ່ານມີການເນັ້ນສຽງແນວໃດ, ຫາຍໃຈຈັງຫວະໃດ, ຫຼື ແມ່ນແຕ່ສຳນຽງການເວົ້າ (ເຊັ່ນ: ສຳນຽງຫຼວງພະບາງທີ່ອ່ອນຊ້ອຍ ຫຼື ສຳນຽງວຽງຈັນທີ່ມີຈັງຫວະສະເພາະຕົວ).
3. ສ້າງສຽງໃໝ່ (Generation): ເມື່ອ AI ເຂົ້າໃຈ “DNA ສຽງ” ຂອງທ່ານແລ້ວ, ມິດສາຊີບພຽງແຕ່ພິມຂໍ້ຄວາມ (Text) ທີ່ຕ້ອງການລົງໃນຄອມພິວເຕີ. ລະບົບຈະປ່ຽນຕົວໜັງສືນັ້ນ ໃຫ້ກາຍເປັນສຽງເວົ້າຂອງທ່ານໄດ້ທັນທີ.

ຄວາມສ່ຽງທີ່ອາດຈະເກີດຂຶ້ນຕໍ່ກັບຄົນລາວ

ເຕັກໂນໂລຊີນີ້ບໍ່ໄດ້ຢູ່ໄກຕົວອີກຕໍ່ໄປ ແຕ່ມັນມີຜົນກະທົບໂດຍກົງຕໍ່ກັບຊີວິດປະຈຳວັນ ແລະ ທຸລະກິດໃນບ້ານເຮົາ:

ການຫຼອກລວງໂອນເງິນ: ນີ້ຄືໄພຂົ່ມຂູ່ທີ່ໜ້າຢ້ານທີ່ສຸດ. ແກ້ງມິດສາຊີບ (Scammers) ອາດຈະໂທຫາເຖົ້າແກ່ ຫຼື ພໍ່ແມ່ຢູ່ຕ່າງແຂວງ ດ້ວຍສຽງຂອງທ່ານ ເພື່ອຫຼອກໃຫ້ໂອນເງິນ. ດ້ວຍຄວາມຕົກໃຈ ແລະ ໄດ້ຍິນສຽງລູກຫຼານແທ້ໆ, ຫຼາຍຄົນຈຶ່ງຫຼົງເຊື່ອ ແລະ ໂອນເງິນຜ່ານທາງໂທລະສັບມືຖືທັນທີ.
ການສ້າງຂ່າວປອມ (Fake News): ການປອມສຽງຂອງບຸກຄົນສຳຄັນ, ຜູ້ນຳທ້ອງຖິ່ນ ຫຼື ດາລາຄົນດັງໃນລາວ ເພື່ອປ່ອຍຂ່າວລືກ່ຽວກັບເລື່ອງເສດຖະກິດ, ອັດຕາແລກປ່ຽນເງິນຕາ, ຫຼື ການເມືອງ ທີ່ອາດຈະສ້າງຄວາມແຕກຕື່ນໃນສັງຄົມ.
ຜົນກະທົບຕໍ່ SME ພາຍໃນປະເທດ: ທຸລະກິດຂະໜາດນ້ອຍທີ່ມັກຈະມີການສັ່ງຊື້ສິນຄ້າ ຫຼື ຕົກລົງທຸລະກິດຜ່ານທາງການໂທສັ່ງ ຖ້າເຈົ້າຂອງຮ້ານໄດ້ຮັບສາຍທີ່ປອມສຽງເປັນລູກຄ້າຂາປະຈຳເພື່ອສັ່ງເຄື່ອງກ່ອນຈ່າຍຕາມຫຼັງ ອາດຈະເຮັດໃຫ້ເກີດຄວາມເສຍຫາຍທາງທຸລະກິດໄດ້.

ວິທີປ້ອງກັນຕົວເອງຈາກສຽງປອມ (Audio Deepfakes)

ເຖິງແມ່ນວ່າ AI ຈະສະຫຼາດຂຶ້ນ, ແຕ່ເຮົາກໍສາມາດປ້ອງກັນຕົນເອງ ແລະ ປົກປ້ອງຄົນໃນຄອບຄົວໄດ້ ດ້ວຍວິທີງ່າຍໆດັ່ງນີ້:

ຕັ້ງ “ລະຫັດລັບ” ໃນຄອບຄົວ: ຕົກລົງກັນກັບຄົນໃນຄອບຄົວວ່າ ຖ້າມີເຫດການສຸກເສີນທີ່ຕ້ອງໄດ້ໂອນເງິນ, ໃຫ້ຖາມຫາ “ລະຫັດລັບ” (Safe word) ເຊິ່ງອາດຈະເປັນຄຳສັບແປກໆ ຫຼື ຊື່ອາຫານທີ່ຮູ້ກັນແຄ່ໃນຄອບຄົວ ເຊັ່ນ: “ມື້ກ່ອນກິນຕຳໝາກຫຸ່ງໃສ່ຫຍັງ?“.
ຟັງຫາຄວາມຜິດປົກກະຕິ: ສຽງຈາກ AI ຍັງມີຈຸດອ່ອນ. ຈົ່ງສັງເກດຟັງວ່າ ສຽງນັ້ນມີຄວາມຮາບພຽງເກີນໄປບໍ່, ຂາດສຽງຫາຍໃຈ ຫຼື ການຍະຫວ່າງຄຳສັບໃນພາສາລາວທີ່ເບິ່ງຜິດທຳມະຊາດບໍ່.
ວາງສາຍແລ້ວໂທກວດສອບພາຍຫຼັງ: ຖ້າທ່ານຮູ້ສຶກສະກິດໃຈ ຫຼື ສົງໄສວ່າສາຍທີ່ໂທອາດຈະເປັນສຽງປອມ, ໃຫ້ວາງສາຍທັນທີ ແລ້ວເປັນຝ່າຍໂທກັບໄປຫາເບີຂອງບຸກຄົນນັ້ນໂດຍກົງ.

ຈຸດສຳຄັນທີ່ຄວນຈື່ (Key Takeaways)

Deep Learning ແມ່ນເຕັກໂນໂລຊີ AI ທີ່ສາມາດຮຽນແບບການຮຽນຮູ້ຂອງມະນຸດ ຊ່ວຍໃຫ້ມັນສາມາດຖອດລະຫັດ ແລະ ກັອບປີ້ເອກະລັກສຽງຂອງຄົນເຮົາໄດ້.
Audio Deepfakes ຕ້ອງການພຽງສຽງຕົ້ນສະບັບສັ້ນໆ ຈາກສື່ສັງຄົມອອນລາຍເຊັ່ນ: TikTok ຫຼື Facebook ກໍສາມາດນຳໄປສ້າງເປັນປະໂຫຍກໃໝ່ແນວໃດກໍໄດ້.
ຄວາມສ່ຽງທີ່ໃຫຍ່ທີ່ສຸດຄື ການຫຼອກລວງໃຫ້ໂອນເງິນ ແລະ ການປ່ອຍຂ່າວປອມ.
ມີສະຕິສະເໝີ ແລະ ຕັ້ງລະຫັດລັບ (Safe words) ໃນຄອບຄົວ ຄືເກາະປ້ອງກັນທີ່ດີທີ່ສຸດ.

ສະຫຼຸບ: ການເຕີບໂຕຂອງເຕັກໂນໂລຊີ AI ເປັນດາບສອງຄົມເຊິ່ງເອື້ອອຳນວຍຄວາມສະດວກສະບາຍ ແຕ່ກໍມາກັບໄພຂົ່ມຂູ່ທີ່ມາໃນຮູບແບບໃໝ່. ເຕັກໂນໂລຊີ Deep Learning ອາດຈະເກັ່ງກາດຈົນສາມາດກັອບປີ້ສຽງຂອງຄົນເຮົາໄດ້ເໝືອນຈິງ 100%, ແຕ່ສິ່ງໜຶ່ງທີ່ AI ຍັງຮຽນແບບບໍ່ໄດ້ ກໍຄື “ສະຕິ ແລະ ການຄິດວິເຄາະ” ຂອງມະນຸດ. ໃນຖານະພົນລະເມືອງດິຈິຕອນ ຖ້າເຮົາຮຽນຮູ້ ແລະ ເຂົ້າໃຈທັນເຕັກໂນໂລຊີ ເຮົາກໍຈະບໍ່ຕົກເປັນເຫຍື່ອຂອງມິດສາຊີບໃນຍຸກນີ້.