Doctor AI

Dr. Savath Saypadith

240 ບົດຄວາມ

ເຕັກນິກການສ້າງຕົວລະຄອນໃຫ້ຄືເກົ່າສະເໝີໃນ AI Art

ໂພສເມື່ອ # Generative AI # Prompt Engineering # Stable Diffusion # AI Art

ເຕັກນິກການສ້າງຕົວລະຄອນໃຫ້ຄືເກົ່າສະເໝີໃນ AI Art

ເຈົ້າເຄີຍປະສົບກັບບັນຫານີ້ບໍ່? ເວລາທີ່ເຮົາຢາກສ້າງປຶ້ມນິທານ, ອອກແບບກາຕູນສຳລັບການຕະຫຼາດໃຫ້ກັບທຸລະກິດ SMEs ໃນລາວ, ຫຼື ເຮັດສື່ໂຄສະນາ ໂດຍໃຊ້ເຕັກໂນໂລຊີ AI ແຕ້ມຮູບ. ເຮົາສັ່ງໃຫ້ AI ແຕ້ມຕົວລະຄອນ “ນາງ ຄຳຜົງ” ໃຫ້ຍ່າງຫຼິ້ນຢູ່ແຄມຂອງ ແລ້ວຕໍ່ມາຢາກໃຫ້ນາງຂີ່ລົດຈັກຜ່ານດົງລົດຕິດໃນນະຄອນຫຼວງວຽງຈັນ. ສິ່ງທີ່ເກີດຂຶ້ນຄື: ໜ້າຕາ, ຊົງຜົມ ແລະ ຊຸດຂອງນາງພັດປ່ຽນໄປໝົດທຸກຄັ້ງ!

ຄວາມບໍ່ສະໝ່ຳສະເໝີ (Inconsistency) ຄືໜຶ່ງໃນສິ່ງທ້າທາຍທີ່ໃຫຍ່ທີ່ສຸດຂອງເຕັກໂນໂລຊີ Generative AI ໃນປະຈຸບັນ. ໃນບົດຄວາມນີ້, ເຮົາຈະມາເຈາະເລິກວິທີການທາງເຕັກນິກລະດັບກາງ (Intermediate) ເພື່ອລ໋ອກໜ້າຕາ ແລະ ລັກສະນະຂອງຕົວລະຄອນໃຫ້ຄືເກົ່າສະເໝີ ໂດຍໃຊ້ທັງເຕັກນິກການຂຽນ Prompt ຂັ້ນສູງ ແລະ ການໃຊ້ Frameworks ຍອດຮິດເຊັ່ນ Midjourney ແລະ Stable Diffusion.

1. ເຕັກນິກການໃຊ້ Keyword ແລະ ການປະສົມຊື່ (The Name Blending Technique)

ສຳລັບໂມເດວ LLMs ແລະ Text-to-Image ທີ່ບໍ່ມີລະບົບ Reference ຮູບໂດຍກົງ (ຕົວຢ່າງ: ລະບົບພື້ນຖານ), ວິທີທີ່ດີທີ່ສຸດໃນການລ໋ອກໜ້າຕາແມ່ນການສ້າງ “DNA ຂອງຕົວລະຄອນ” ຈາກການປະສົມຊື່ທີ່ມີຢູ່ໃນຖານຂໍ້ມູນຂອງ AI.

ຕົວຢ່າງການລ໋ອກ Prompt:

“A portrait of [Actress A: Actress B: 0.5], realistic Lao woman, wearing traditional silk Sinh, walking around That Luang stupa, sunny day, highly detailed.”

ການໃຊ້ສົມຜົນ [A:B:0.5] ຈະຊ່ວຍໃຫ້ເອກະລັກຂອງຕົວລະຄອນຖືກດຶງມານຳໃຊ້ໃນອັດຕາສ່ວນທີ່ຄົງທີ່. ນອກຈາກນີ້ ການກຳນົດສີເສື້ອຜ້າ, ເຄື່ອງປະດັບ, ຫຼື ຕຳນິ (ເຊັ່ນ: ໄຝເທິງແກ້ມ) ໃຫ້ຊັດເຈນໃນທຸກໆ Prompt ຈະຊ່ວຍເພີ່ມຄວາມຕໍ່ເນື່ອງໄດ້.

2. ການໃຊ້ Character Reference ໃນ Midjourney (--cref)

ຖ້າທ່ານໃຊ້ Midjourney v6, ການສ້າງຕົວລະຄອນໃຫ້ຄືເກົ່າແມ່ນງ່າຍຂຶ້ນຫຼາຍດ້ວຍ Parameter ໃໝ່ທີ່ເອີ້ນວ່າ Character Reference (--cref).

ຕົວຢ່າງການໃຊ້ງານ:

/imagine prompt: A Lao young woman drinking Paksong coffee at a modern cafe in Vientiane --cref https://link-to-your-image.jpg --cw 0

3. ສາຍ Developer: ການກຳນົດທິດທາງດ້ວຍ IP-Adapter ໃນ Stable Diffusion

ສຳລັບຜູ້ທີ່ລົງເລິກຝັ່ງ Tech ແລະ ໃຊ້ງານ Open-source ໂມເດວເຊັ່ນ Stable Diffusion (SD1.5 ຫຼື SDXL), ການໃຊ້ກົນໄກເສີມເຊັ່ນ IP-Adapter ແມ່ນຄຳຕອບທີ່ຊັດເຈນທີ່ສຸດ.

IP-Adapter (Image Prompt Adapter) ແມ່ນເຕັກນິກທີ່ດຶງເອົາ Features ຫຼື ຈຸດເດັ່ນຂອງຮູບພາບຕົ້ນສະບັບ ໄປປ້ອນເຂົ້າໃນໂຄງສ້າງ U-Net ຂອງ Stable Diffusion ໂດຍກົງຜ່ານກົນໄກ Cross-Attention, ເຮັດໃຫ້ໂມເດວ “ເຂົ້າໃຈ” ໂຄງສ້າງໃບໜ້າຂອງຕົວລະຄອນໂດຍທີ່ບໍ່ຕ້ອງອະທິບາຍຍາວ.

ຕົວຢ່າງການຂຽນ Code ດ້ວຍ Python (Diffusers Library): ການສ້າງພາບຕົວລະຄອນຄືເກົ່າຢືນຢູ່ແຄມນ້ຳຂອງ ດັ່ງຕົວຢ່າງດ້ານລຸ່ມນີ້:

import torch
from diffusers import StableDiffusionPipeline
from diffusers.utils import load_image

# 1. ໂຫຼດ Base Model
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", 
    torch_dtype=torch.float16
)

# 2. ໂຫຼດ IP-Adapter ຮ່ວມກັບ Model ຫຼັກ
pipe.load_ip_adapter(
    "huggingface/ip-adapter", 
    subfolder="models", 
    weight_name="ip-adapter_sd15.bin"
)
pipe.set_ip_adapter_scale(0.8) # ປັບນ້ຳໜັກຄວາມຄືຂອງໜ້າຕາ (0.0 ຫາ 1.0)
pipe.to("cuda")

# 3. ໂຫຼດຮູບຕົວລະຄອນຕົ້ນສະບັບ (ນາງ ຄຳຜົງ)
ref_image = load_image("khamphong_base.jpg")

prompt = "1girl, lao woman, wearing traditional lao Sinh, standing by the mekong river at sunset, masterpiece, high quality, highly detailed"
negative_prompt = "mutated, ugly, deformed, text, worst quality"

# 4. ສ້າງຮູບພາບໃໝ່ ໂດຍກຳນົດ Seed ໃຫ້ຄົງທີ່ຖ້າເປັນໄປໄດ້
generator = torch.Generator(device="cpu").manual_seed(1024)

images = pipe(
    prompt=prompt,
    ip_adapter_image=ref_image,
    negative_prompt=negative_prompt,
    num_inference_steps=30,
    generator=generator
).images

images[0].save("khamphong_at_mekong.png")

ດ້ວຍການນຳໃຊ້ IP-Adapter, ຕົວລະຄອນຂອງທ່ານຈະສາມາດໄປຢູ່ທຸກສະຖານທີ່—ບໍ່ວ່າຈະເປັນງານບຸນທາດຫຼວງ, ສວນກາເຟປາກຊ່ອງ, ຫຼື ຕະຫຼາດເຊົ້າ ໂດຍທີ່ໃບໜ້າຍັງຄົງເປັນຄົນດຽວກັນຢ່າງແນ່ນອນ.

4. ທາງອອກລະດັບສູງສຸດ: ການຝຶກສອນ LoRA ສະເພາະຕົວ

ຖ້າທຸລະກິດຂອງທ່ານຕ້ອງການຄວາມຖືກຕ້ອງ 100% ສະເໝີ, ວິທີທີ່ຍືນຍົງທີ່ສຸດຄືການຝຶກສອນ (Train) ເຂົ້າໄປໃນນ້ຳໜັກຂອງ AI ໂດຍຕົງ. ທ່ານສາມາດນຳໃຊ້ເຕັກນິກ Low-Rank Adaptation (LoRA) ໂດຍການລວບລວມຮູບພາບຕົວລະຄອນຂອງທ່ານໃນຫຼາກຫຼາຍມຸມມອງ (ໜ້າຊື່, ດ້ານຂ້າງ, ເຕັມຕົວ) ປະມານ 15-20 ຮູບ. ການທຳຄວາມເຂົ້າໃຈການ Train LoRA ດ້ວຍເຄື່ອງມືເຊັ່ນ Kohya_ss ຈະຊ່ວຍສ້າງໄຟລ໌ໂມເດວນ້ອຍໆ ທີ່ທ່ານສາມາດແນບເຂົ້າໄປໃນການ Generate ທຸກໆຄັ້ງໄດ້ຢ່າງອິດສະຫຼະ.

ບົດສະຫຼຸບ

ການຈະສ້າງຕົວລະຄອນໃນ AI Art ໃຫ້ສາມາດເລົ່າເລື່ອງລາວໄດ້ຢ່າງຕໍ່ເນື່ອງ, ປ່ຽນສະຖານທີ່ ແລະ ປ່ຽນເຄື່ອງນຸ່ງໄດ້ ໂດຍບໍ່ເສຍເອກະລັກຂອງໃບໜ້າ ແມ່ນຈຳເປັນຕ້ອງອາໄສວິສະວະກຳທາງ AI ຮ່ວມດ້ວຍ. ທ່ານສາມາດເລີ່ມຈາກເຕັກນິກການປະສົມຊື່ໃນ Prompt, ຂະຫຍັບໄປໃຊ້ Parameters ສຳເລັດຮູບໃນ Midjourney, ຫຼື ຖ້າຕ້ອງການຄວບຄຸມແບບ 100% ການຫັນມາໃຊ້ IP-Adapter ໃນ Stable Diffusion ແມ່ນວິທີການທີ່ທາງສາຍນັກພັດທະນາເລືອກໃຊ້. ເມື່ອທ່ານຊຳນານເຕັກນິກເຫຼົ່ານີ້ແລ້ວ ການສ້າງສື່ໃຫ້ກັບທຸລະກິດໃນລາວ ກໍຈະສະດວກ, ວ່ອງໄວ, ເປັນມືອາຊີບ ແລະ ຫຼຸດຕົ້ນທຶນໄດ້ຢ່າງມະຫາສານ.