Doctor AI

Dr. Savath Saypadith

240 ບົດຄວາມ

ແນະນຳໃຫ້ຮູ້ຈັກກັບ Qwen: ສຸດຍອດໂມເດວ Open-Source ຈາກ Alibaba

ໂພສເມື່ອ # Model Updates # AI Ecosystems # Large Language Models # Natural Language Processing

ແນະນຳໃຫ້ຮູ້ຈັກກັບ Qwen: ສຸດຍອດໂມເດວ Open-Source ຈາກ Alibaba

ຍິນດີຕ້ອນຮັບນັກພັດທະນາ ແລະ ຜູ້ສົນໃຈ AI ທຸກທ່ານ! ໃນຍຸກທີ່ Large Language Models (LLMs) ກາຍເປັນຫົວໃຈສຳຄັນຂອງເຕັກໂນໂລຊີ, ຫຼາຍຄົນອາດຈະເຄີຍປະສົບກັບບັນຫາເມື່ອຕ້ອງນຳໃຊ້ໂມເດວຊື່ດັງຈາກຕາເວັນຕົກເພື່ອມາປະມວນຜົນພາສາທ້ອງຖິ່ນໃນພາກພື້ນອາຊີ. ເນື່ອງຈາກຂໍ້ຈຳກັດທາງດ້ານຂໍ້ມູນການຝຶກອົບຮົມ, ການປະມວນຜົນພາສາຕ່າງໆ ເຊັ່ນ: ພາສາລາວ, ໄທ ຫຼື ຫວຽດນາມ ມັກຈະໃຊ້ພະລັງງານສູງ, ສິ້ນເປືອງ Tokens ຫຼາຍ ແລະ ບາງຄັ້ງກໍໄດ້ຮັບໝາກຜົນທີ່ບໍ່ເປັນທຳມະຊາດ.

ແຕ່ມື້ນີ້, ວົງການ AI ໄດ້ມີການປ່ຽນແປງຄັ້ງໃຫຍ່. ພວກເຮົາຈະມາທຳຄວາມຮູ້ຈັກກັບ Qwen (Tongyi Qianwen), ໂມເດວ Open-Source ຊັ້ນນຳຈາກ Alibaba Cloud ທີ່ອອກແບບມາເພື່ອປິດຊ່ອງຫວ່າງນີ້ໂດຍສະເພາະ. ສຳລັບນັກພັດທະນາ ຫຼື ບໍລິສັດ SME ໃນນະຄອນຫຼວງວຽງຈັນ ທີ່ກຳລັງສ້າງແອັບພລິເຄຊັນ AI ເພື່ອຄົນລາວ, Qwen ແມ່ນໜຶ່ງໃນທາງເລືອກ (Ecosystem) ທີ່ໜ້າສົນໃຈທີ່ສຸດໃນປະຈຸບັນ.

ເປັນຫຍັງ Qwen ຈຶ່ງມີປະສິດທິພາບສູງສຳລັບພາສາອາຊີ?

ສາເຫດຫຼັກທີ່ Qwen ເຮັດວຽກໄດ້ດີກວ່າໃນບໍລິບົດຂອງພາສາອາຊີ ແມ່ນມາຈາກການອອກແບບສະຖາປັດຕະຍະກຳ (Architecture) ແລະ ວິທີການຈັດການກັບຂໍ້ມູນ:

ລອງຂຽນໂຄດນຳໃຊ້ Qwen (Hands-on Setup)

ສຳລັບນັກພັດທະນາ (Developers) ທີ່ມີພື້ນຖານ Python ແລະ ເຄີຍນຳໃຊ້ Hugging Face ແລ້ວ, ການດຶງເອົາ Qwen ມາໃຊ້ງານໃນເຄື່ອງ Local ຫຼື Cloud server ຂອງທ່ານແມ່ນງ່າຍດາຍຫຼາຍ.

ລຸ່ມນີ້ແມ່ນຕົວຢ່າງການຂຽນໂຄດ (Code snippet) ເພື່ອໂຫຼດໂມເດວ Qwen ມາຂຽນແຄັບຊັນ (Caption) ສຳລັບທຸລະກິດຮ້ານກາເຟໃນວຽງຈັນ:

# ຕິດຕັ້ງ library ທີ່ຈຳເປັນ: pip install transformers accelerate torch

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# ເລືອກໂມເດວ Qwen ລຸ້ນລ່າສຸດ (ໃນທີ່ນີ້ເລືອກລຸ້ນ 1.5B ເຊິ່ງເໝາະກັບການທົດລອງແລະບໍ່ກິນສະເປັກເຄື່ອງຫຼາຍ)
model_name = "Qwen/Qwen2.5-1.5B-Instruct"

print("ກຳລັງໂຫຼດ Tokenizer ແລະ Model...")
tokenizer = AutoTokenizer.from_pretrained(model_name)

# ໂຫຼດ Model ໂດຍໃຊ້ປະເພດຂໍ້ມູນ fp16 ເພື່ອປະຢັດ VRAM
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto"
)

# ສ້າງ Prompt ທີ່ກ່ຽວຂ້ອງກັບບໍລິບົດທ້ອງຖິ່ນໃນລາວ
prompt_text = "ຊ່ວຍຂຽນແຄັບຊັນເປັນພາສາລາວ ສຳລັບໂປຣໂມດຮ້ານກາເຟເປີດໃໝ່ ແຖວແຄມຂອງ ນະຄອນຫຼວງວຽງຈັນ ໃຫ້ໜ້ອຍໜຶ່ງ. ຂໍແບບເປັນກັນເອງ, ໜ້າສົນໃຈ ແລະ ກະຕຸ້ນໃຫ້ຄົນຢາກມາຖ່າຍຮູບ."

# ໃຊ້ຮູບແບບ Chat Template ຕາມມາດຕະຖານຂອງ Qwen
messages = [
    {"role": "system", "content": "ທ່ານຄືຜູ້ຊ່ວຍ AI ທີ່ຊ່ຽວຊານດ້ານການຕະຫຼາດອອນລາຍ ແລະ ເຂົ້າໃຈວັດທະນະທຳລາວເປັນຢ່າງດີ."},
    {"role": "user", "content": prompt_text}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# ສັ່ງໃຫ້ໂມເດວສ້າງຂໍ້ຄວາມ (Inference Generation)
print("ກຳລັງສ້າງຂໍ້ຄວາມ...")
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=250,
    temperature=0.7,
    repetition_penalty=1.1
)

# ຕັດເອົາສະເພາະສ່ວນທີ່ໂມເດວສ້າງຂຶ້ນມາໃໝ່ (ບໍ່ລວມ prompt)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print("\n--- ຄຳຕອບຈາກ Qwen ---")
print(response)

ເມື່ອທ່ານ Run ສຳເລັດ, ໝາກຜົນທີ່ໄດ້ຈະເຫັນວ່າ Qwen ສາມາດເຂົ້າໃຈຄຳສັ່ງທີ່ຊັບຊ້ອນ ແລະ ສາມາດຜະລິດຂໍ້ຄວາມທີ່ກ່ຽວຂ້ອງກັບ “ແຄມຂອງ” ແລະ “ນະຄອນຫຼວງວຽງຈັນ” ໄດ້ຢ່າງຖືກຕ້ອງຕາມບໍລິບົດ ເຊິ່ງແຕກຕ່າງຈາກໂມເດວເກົ່າໆທີ່ມັກຈະແປງພາສາລາວຜິດພ້ຽນ.

ການນຳໃຊ້ຕົວຈິງສຳລັບອົງກອນ ແລະ ທີມພັດທະນາໃນລາວ

ຖ້າຫາກທ່ານເປັນນັກພັດທະນາໃນລາວ, Qwen ຈະເຂົ້າມາຊ່ວຍປ່ຽນແປງວິທີການເຮັດວຽກໄດ້ຄື:

ໃຈຄວາມສຳຄັນ (Key Takeaways)

ສະຫຼຸບ

Qwen ໄດ້ພິສູດໃຫ້ເຫັນແລ້ວວ່າມັນເປັນໜຶ່ງໃນກຳລັງສຳຄັນຂອງລະບົບນິເວດ (Ecosystem) ຂອງ Open-Source ໂດຍສະເພາະຢ່າງຍິ່ງໃນການລົບລ້າງຂໍ້ຈຳກັດທາງດ້ານພາສາທີ່ບໍ່ແມ່ນພາສາອັງກິດ. ສຳລັບວົງການເຕັກໂນໂລຊີ ແລະ ນັກພັດທະນາໃນປະເທດລາວ, Qwen ເປັນທາງເລືອກທີ່ສາມາດນຳໄປທົດລອງ, ຕໍ່ຍອດ ແລະ ສ້າງເປັນແອັບພລິເຄຊັນທີ່ແກ້ໄຂບັນຫາໃຫ້ກັບປະຊາຊົນ ແລະ ທຸລະກິດທ້ອງຖິ່ນໄດ້ຢ່າງມີປະສິດທິຜົນ. ຖ້າທ່ານຍັງບໍ່ເຄີຍທົດລອງໃຊ້ ຂໍແນະນຳໃຫ້ລອງເປີດ Google Colab ແລ້ວນຳເອົາ Code ດ້ານເທິງໄປລອງໃຊ້ເບິ່ງໄດ້ເລີຍ!