ການນຳໃຊ້ Ollama ເພື່ອຣັນໂມເດວ AI ຢູ່ເຄື່ອງຂອງທ່ານ: ຄູ່ມືສຳລັບນັກພັດທະນາ
ການນຳໃຊ້ Ollama ເພື່ອຣັນໂມເດວ AI ຢູ່ເຄື່ອງຂອງທ່ານ: ຄູ່ມືສຳລັບນັກພັດທະນາ
ລອງຈິນຕະນາການເບິ່ງວ່າ: ທ່ານກຳລັງພັດທະນາລະບົບ AI ວິເຄາະຂໍ້ມູນໃຫ້ກັບທຸລະກິດ SME ໃນນະຄອນຫຼວງວຽງຈັນ, ເຊັ່ນ: ລະບົບຈັດການຂໍ້ມູນລູກຄ້າຂອງຮ້ານກາເຟ ຫຼື ແອັບພລິເຄຊັນສະຫຼຸບລາຍງານການຂົນສົ່ງ. ການສົ່ງຂໍ້ມູນທີ່ເປັນຄວາມລັບຂອງທຸລະກິດຜ່ານກາງອິນເຕີເນັດໄປຫາບໍລິການ API ຕ່າງປະເທດ ອາດມີຄວາມສ່ຽງດ້ານຄວາມປອດໄພຂອງຂໍ້ມູນ ແລະ ຍັງມີຄ່າໃຊ້ຈ່າຍທີ່ສູງຂຶ້ນເລື້ອຍໆ. ນອກຈາກນັ້ນ ບາງຄັ້ງທີ່ອິນເຕີເນັດບໍ່ສະຖຽນຕອນຝົນຕົກໜັກ ການເອີ້ນໃຊ້ Cloud API ກໍອາດພາໃຫ້ລະບົບຊັກຊ້າ.
ຈະດີກວ່າບໍ່ ຖ້າທ່ານສາມາດນຳສະເໜີທາງອອກທີ່ປອດໄພກວ່າ ແລະ ປະຢັດກວ່າ ໂດຍການ “ຣັນໂມເດວ AI ຢູ່ເທິງເຄື່ອງຂອງທ່ານເອງ” (Local Deployment)?
ໃນບົດຄວາມນີ້, ເຮົາຈະມາເຈາະເລິກວິທີການນຳໃຊ້ເຄື່ອງມືທີ່ຊື່ວ່າ Ollama ເພື່ອຕິດຕັ້ງ ແລະ ນຳໃຊ້ໂມເດວ Large Language Models (LLMs) ຍອດຮິດເຊັ່ນ Gemma ຈາກ Google ແລະ Mistral ຜ່ານ Command Line ເທິງ Macbook ຂອງທ່ານແບບເຮັດຕາມໄດ້ທັນທີ.
ເປັນຫຍັງຕ້ອງ Ollama?
ສຳລັບນັກພັດທະນາລະດັບກາງ (Intermediate), ການເຊັດອັບ (Setup) ໂມເດວ LLM ແບບ Local ດ້ວຍຕົວເອງຕັ້ງແຕ່ຕົ້ນ ອາດເປັນເລື່ອງທີ່ຫຍຸ້ງຍາກ ເພາະຕ້ອງຈັດການກັບ Python environments, ຊຸດຫໍສະໝຸດ (libraries) ຕ່າງໆເຊັ່ນ PyTorch ຫຼື Hugging Face transformers.
Ollama ມາແກ້ໄຂບັນຫານີ້ ໂດຍການປ່ຽນທຸກຢ່າງໃຫ້ງ່າຍຂຶ້ນຄືກັບການໃຊ້ Docker. ພຽງແຕ່ໃຊ້ຄຳສັ່ງດຽວ ທ່ານກໍສາມາດດາວໂຫຼດ, ຣັນ ແລະ ສ້າງ API ໃຫ້ພ້ອມໃຊ້ງານໄດ້ເລີຍ. ມັນຍັງຖືກອອກແບບມາໃຫ້ເຮັດວຽກໄດ້ດີຫຼາຍກັບຊິບ Apple Silicon (M1, M2, M3) ເທິງ Macbook.
ກຽມຄວາມພ້ອມກ່ອນເລີ່ມຕົ້ນ
- ຮາດແວຣ໌ (Hardware): Macbook ທີໃຊ້ຊິບ M-Series ແມ່ນແນະນຳທີ່ສຸດ ເພາະມີ Unified Memory ທີ່ຊ່ວຍປະມວນຜົນ AI ໄດ້ໄວ.
- ຊອບແວຣ໌ (Software): ຄວາມຮູ້ພື້ນຖານໃນການນຳໃຊ້ Terminal (Command Line) ແລະ Python ເລັກນ້ອຍ.
ວິທີການຕິດຕັ້ງ Ollama ເທິງ macOS
ການຕິດຕັ້ງແມ່ນງ່າຍດາຍຫຼາຍ, ທ່ານສາມາດເລືອກເຮັດໄດ້ 2 ວິທີ:
- ດາວໂຫຼດຈາກເວັບໄຊໂດຍກົງ: ເຂົ້າໄປທີ່ Ollama.com ແລ້ວກົດດາວໂຫຼດເວີຊັນ macOS ມາຕິດຕັ້ງຄືແອັບທົ່ວໄປ.
- ຕິດຕັ້ງຜ່ານ Homebrew (ສຳລັບສາຍ Dev):
ເປີດ Terminal ຂຶ້ນມາແລ້ວພິມຄຳສັ່ງ:
ເມື່ອຕິດຕັ້ງສຳເລັດ, ໃຫ້ສັ່ງເປີດ service ດ້ວຍຄຳສັ່ງ:brew install ollama
(ປ່ອຍໜ້າຈໍ Terminal ນີ້ຣັນໄວ້ ແລ້ວເປີດໜ້າຈໍ Terminal ອັນໃໝ່ເພື່ອພິມຄຳສັ່ງຕໍ່ໄປ)ollama serve
ການດຶງ ແລະ ຣັນໂມເດວຜ່ານ Command Line
ຕອນນີ້ Ollama ພ້ອມເຮັດວຽກແລ້ວ. ພວກເຮົາຈະມາທົດລອງຣັນໂມເດວ 2 ຕົວທີ່ກຳລັງມາແຮງ: Gemma ແລະ Mistral.
1. ຣັນໂມເດວ Gemma (ໂດຍ Google)
Gemma ເປັນໂມເດວ Open-weights ທີ່ອອກແບບໂດຍ Google ເຊິ່ງມີປະສິດທິພາບສູງ ແລະ ກິນສະເປັກເຄື່ອງນ້ອຍ. ໃນ Terminal, ໃຫ້ພິມຄຳສັ່ງ:
ollama run gemma
ເມື່ອພິມຄຳສັ່ງນີ້ເປັນຄັ້ງທຳອິດ, Ollama ຈະທຳການດາວໂຫຼດໂຕໂມເດວ (ຂະໜາດປະມານ 5GB ສຳລັບເວີຊັນ 7B). ຫຼັງຈາກດາວໂຫຼດສຳເລັດ, ມັນຈະປ່ຽນໜ້າຈໍເປັນ Prompt >>> ເພື່ອໃຫ້ທ່ານລົມກັບ AI ໄດ້ທັນທີ.
ຕົວຢ່າງການໃຊ້ງານ:
>>> What are some good business ideas for a young entrepreneur in Vientiane?
(Gemma ຈະຕອບກັບດ້ວຍໄອເດຍທຸລະກິດ ເຊັ່ນ: ຮ້ານກາເຟສະຕາຍລ້ານຊ້າງ, ແອັບນຳທ່ຽວ, ຫຼື ແອັບສົ່ງອາຫານທ້ອງຖິ່ນ)
2. ຣັນໂມເດວ Mistral
Mistral ເປັນໂມເດວຈາກຝຣັ່ງ ທີ່ໂດດເດັ່ນເລື່ອງການສະຫຼຸບໃຈຄວາມ ແລະ ການຂຽນໂຄດ. ການເອີ້ນໃຊ້ກໍງ່າຍເຊັ່ນດຽວກັນ:
ollama run mistral
(ສາມາດກົດ Ctrl + D ເພື່ອອອກຈາກໜ້າຈໍສົນທະນາຂອງ Ollama)
ນຳໃຊ້ Ollama API ສະໄຕລ໌ນັກພັດທະນາ (Python Edition)
ການລົມຜ່ານ Terminal ແມ່ນດີສຳລັບການທົດສອບ, ແຕ່ໃນການເຮັດວຽກຈິງ ທ່ານຈຳເປັນຕ້ອງເຊື່ອມຕໍ່ AI ເຂົ້າກັບແອັບພລິເຄຊັນຂອງທ່ານ. ຂໍ້ດີຂອງ Ollama ແມ່ນມັນຈະເປີດ REST API ໄວ້ໃຫ້ທີ່ http://localhost:11434 ໂດຍອັດຕະໂນມັດ.
ມາລອງຂຽນ Python Script ງ່າຍໆ ເພື່ອໃຊ້ Mistral ສະຫຼຸບຄຳຕິຊົມຂອງລູກຄ້າທີ່ມາພັກໂຮງແຮມຢູ່ຫຼວງພະບາງ:
import requests
import json
# ກຳນົດຈຸດເຊື່ອມຕໍ່ API ຂອງ Ollama ທີ່ຣັນຢູ່ເຄື່ອງ
url = "http://localhost:11434/api/generate"
# ຂໍ້ຄວາມທີ່ລູກຄ້າຣີວິວ (ພາສາອັງກິດ)
customer_review = """
The room in this Luang Prabang hotel was very clean and had a great view of the Mekong river.
However, the Wi-Fi was quite slow during the heavy rain, and the breakfast options were limited.
"""
# ຈັດກຽມຂໍ້ມູນ Payload
data = {
"model": "mistral",
"prompt": f"Please summarize the following hotel review into two bullet points (Pros and Cons): {customer_review}",
"stream": False # ກຳນົດເປັນ False ເພື່ອໃຫ້ຕອບກັບມາບາດດຽວ
}
print("ກຳລັງປະມວນຜົນ ໂດຍໃຊ້ Local AI...")
response = requests.post(url, json=data)
if response.status_code == 200:
result = response.json()
print("\n--- ຜົນການສະຫຼຸບ ---")
print(result['response'])
else:
print("ເກີດຂໍ້ຜິດພາດໃນການເຊື່ອມຕໍ່.")
ພຽງເທົ່ານີ້, ທ່ານກໍສາມາດສ້າງລະບົບວິເຄາະຂໍ້ມູນລູກຄ້າພາຍໃນບໍລິສັດ ໂດຍບໍ່ຕ້ອງສົ່ງຂໍ້ມູນອອກໄປນອກເຄື່ອງເລີຍ! ປອດໄພ, ວ່ອງໄວ, ແລະ ບໍ່ມີຄ່າໃຊ້ຈ່າຍ API (Token cost).
ຂໍ້ຄວນລະວັງ ແລະ ການປັບແຕ່ງ
- ຊັບພະຍາກອນເຄື່ອງ (Hardware Limits): ໂມເດວ LLM ໃຊ້ RAM ຂ້ອນຂ້າງຫຼາຍ. ຖ້າ Macbook ຂອງທ່ານມີ RAM 8GB, ຄວນເລືອກໃຊ້ໂມເດວລຸ້ນນ້ອຍ ເຊັ່ນ gemma:2b ຫຼື qwen. ຖ້າມີ RAM 16GB ຂຶ້ນໄປ ແມ່ນສາມາດຣັນເວີຊັນ 7B ຫຼື 8B (ເຊັ່ນ Mistral ຫຼື Llama 3) ໄດ້ສະບາຍ.
- ຄວາມໄວ (Latency): ຄວາມໄວໃນການຕອບກັບ (Tokens per second) ຈະຂຶ້ນກັບລຸ້ນຂອງຊິບ M-series ຂອງທ່ານ. M3 Max ຈະຕອບສະໜອງໄດ້ໄວກວ່າ M1 ລຸ້ນເລີ່ມຕົ້ນຫຼາຍເທົ່າຕົວ.
ສິ່ງທີ່ໄດ້ຮຽນຮູ້ (Key Takeaways)
- Ollama ຊ່ວຍຫຼຸດຄວາມຫຍຸ້ງຍາກໃນການ Setup ໂມເດວ AI ແບບ Local, ເຮັດໃຫ້ເບົາເຄື່ອງ ແລະ ຄຸ້ມຄ່າກວ່າ.
- ການໃຊ້ທຸລະກິດໃນລາວ: ສາມາດນຳໃຊ້ວິທີນີ້ເພື່ອສ້າງລະບົບພາຍໃນ (Internal Tools) ໃຫ້ກັບທຸລະກິດການແພດ, ທະນາຄານ, ຫຼື SME ທີ່ຕ້ອງການຄວາມເປັນສ່ວນຕົວຂອງຂໍ້ມູນສູງສຸດ.
- ດ້ວຍຄຳສັ່ງພຽງແຕ່
ollama run [ຊື່ໂມເດວ], ທ່ານກໍສາມາດທົດລອງໃຊ້ງານໂມເດວໃໝ່ໆລະດັບໂລກໄດ້ພາຍໃນບໍ່ຈັກນາທີ.
ສະຫຼຸບ
ການ Deploy ໂມເດວ LLM ລົງເທິງເຄື່ອງ Local ບໍ່ແມ່ນເລື່ອງທີ່ຫຍຸ້ງຍາກ ຫຼື ຕ້ອງໃຊ້ Server ຫຼັກແສນອີກຕໍ່ໄປ. ດ້ວຍ Macbook ຄູ່ໃຈ ແລະ ເຄື່ອງມືອັດສະລິຍະຢ່າງ Ollama, ທ່ານສາມາດພັດທະນາແອັບພລິເຄຊັນ AI ທີ່ຊ່ວຍແກ້ໄຂບັນຫາໃຫ້ກັບອົງກອນທ້ອງຖິ່ນໃນລາວໄດ້ຢ່າງປອດໄພ ແລະ ມີປະສິດທິຜົນ. ລອງເອົາໄປປັບໃຊ້ກັບໂປຣເຈັກຂອງທ່ານເບິ່ງ, ແລ້ວທ່ານຈະພົບວ່າການຂຽນ AI Application ຢູ່ເທິງເຄື່ອງຕົວເອງນັ້ນ ມ່ວນ ແລະ ງ່າຍກວ່າທີ່ຄິດ!