.
ภาพสมองหุ่นยนต์ทำงานภายในยานอวกาศ สร้างสรรค์ด้วย Generative AI ในสไตล์ไซไฟ

เบื้องหลังการทำงานของ Generative AI

แม้ Generative AI จะดูเหมือนเวทมนตร์ แต่แท้จริงแล้วขับเคลื่อนด้วยเทคโนโลยีซับซ้อนที่เรียนรู้จากข้อมูลและประยุกต์ใช้รูปแบบเพื่อสร้างสิ่งใหม่ๆ เมื่อแยกย่อยทีละส่วน "เวทมนตร์" นี้ก็จะเข้าใจได้ง่ายขึ้น

Generative AI คือปัญญาประดิษฐ์ที่ไม่เพียงแค่วิเคราะห์ข้อมูลที่มีอยู่ แต่ยังสร้างเนื้อหาใหม่ได้ โมเดลถูกฝึกด้วยชุดข้อมูลขนาดใหญ่ทั้งข้อความ ภาพ เสียง หรือวิดีโอ ซึ่งช่วยให้เรียนรู้รูปแบบ ความสัมพันธ์ และสไตล์ต่างๆ เมื่อคุณป้อนข้อมูลเข้าไป เช่น พรอมต์ข้อความหรือรูปภาพอ้างอิง โมเดลจะนำสิ่งที่เรียนรู้มาใช้เพื่อสร้างผลลัพธ์ใหม่ที่ตรงตามความต้องการของคุณ

นี่คือเหตุผลที่คุณสามารถขอให้แชทบอทแนะนำสโลแกนและได้ไอเดียใหม่ๆ ในเวลาไม่กี่วินาที หรือใช้ Firefly เปลี่ยนคำอธิบายให้กลายเป็นภาพที่ดูเหมือนวาดด้วยมือหรือสมจริง นอกจากงานสร้างสรรค์แล้ว Generative AI ยังถูกนำไปใช้ในวงการวิทยาศาสตร์และการแพทย์ เพื่อออกแบบโปรตีนใหม่ ปรับปรุงการรักษามะเร็ง และเร่งงานวิจัย ศักยภาพของ AI ประเภทนี้ไม่ได้จำกัดอยู่แค่การเล่นคำ แต่กำลังปฏิวัติอุตสาหกรรมต่างๆ อย่างรวดเร็ว

ทำไม Generative AI ถึงฉลาดเหลือเกิน

ในอดีต แอปพลิเคชันคอมพิวเตอร์ไม่สามารถทำงานได้หากไม่ได้รับคำสั่งที่ชัดเจนจากมนุษย์ก่อน คำสั่งเหล่านี้เรียกว่า "การเขียนโปรแกรม" แม้ว่าการเขียนโปรแกรมที่ซับซ้อนจะให้ผลลัพธ์ที่น่าประทับใจ แต่แอปพลิเคชันคอมพิวเตอร์แบบดั้งเดิมก็ไม่สามารถทำสิ่งที่มนุษย์ไม่ได้รวมไว้ในการเขียนโปรแกรมได้

ระบบ Generative AI นั้นมีความยืดหยุ่นมากกว่าเนื่องจากอาศัยแมชชีนเลิร์นนิง ซึ่งไม่จำเป็นต้องใช้การเขียนโปรแกรมที่ชัดเจน แต่มนุษย์ต้องให้คอมพิวเตอร์เข้าถึงข้อมูลปริมาณมหาศาลแทน จากนั้นแมชชีนจะฝึกตัวเองเพื่อให้รู้จำรูปแบบในข้อมูลนั้นๆ และที่สำคัญที่สุดคือสรุปผลสิ่งที่ได้เรียนรู้ (ซึ่งส่วนการเรียนรู้ของ “แมชชีนเลิร์นนิง” จะเข้ามาช่วยในจุดนี้) ขนาดและคุณภาพของชุดข้อมูลก็มีความสำคัญ AI จะมีประสิทธิภาพมากหรือน้อยเพียงใดนั้นขึ้นอยู่กับข้อมูลที่ใช้ฝึก

การตอบคำถามว่า "Generative AI ทำงานอย่างไร" นั้นซับซ้อน และต้องใช้ความพยายามอย่างมากในการทำความเข้าใจอย่างลึกซึ้ง แต่ความงดงามของ Generative AI คือคุณไม่จำเป็นต้องเข้าใจทุกอย่างเกี่ยวกับมันเพื่อที่จะได้รับประโยชน์ คุณเพียงแค่หาแอปอย่าง Firefly พิมพ์สิ่งที่คุณต้องการเห็น เช่น "ลูกสุนัขลาบราดูเดิลสามตัววิ่งบนสนามหญ้า" และทันใดนั้น คุณก็จะกลายเป็นผู้ใช้ Generative AI แล้ว โดยไม่จำเป็นต้องมีปริญญาด้านการเขียนโปรแกรม

ภาพที่สร้างโดย AI แสดงลูกสุนัขลาบราดอร์สีเหลืองสามตัวกำลังวิ่งบนสนามหญ้า โดยมีตึกทันสมัยเป็นฉากหลัง

พลังขับเคลื่อนเบื้องหลัง Generative AI

เบื้องหลังการทำงานนั้น Generative AI ต้องพึ่งพาฮาร์ดแวร์ที่ทรงพลังและการประมวลผลขนาดใหญ่ หน่วยประมวลผลกราฟิก (GPU) และหน่วยประมวลผลเทนเซอร์ (TPU) จัดการกับการคำนวณมหาศาลที่จำเป็นในการฝึกและรันโมเดลเหล่านี้

กระบวนการนี้มีสองระยะหลักๆ ได้แก่

การฝึก

ในระหว่างการฝึก โมเดลจะเรียนรู้จากชุดข้อมูลขนาดใหญ่ของข้อความ รูปภาพ เสียง หรือวิดีโอ ขั้นตอนนี้ใช้พลังงานมากเนื่องจากต้องใช้การประมวลผลแบบกระจาย การประมวลผลแบบขนาน และเวลารันที่ยาวนานเพื่อจดจำรูปแบบและความสัมพันธ์

การอนุมาน

เมื่อผ่านการฝึกแล้ว โมเดลสามารถสร้างผลลัพธ์ตามต้องการ เช่น เขียนข้อความ สร้างภาพ หรือแปลเสียง โดยใช้พลังงานน้อยลงมาก การอนุมานยังสามารถเพิ่มประสิทธิภาพได้ด้วยเทคนิคต่างๆ เช่น การจัดกลุ่มและการใช้งานบนคลาวด์

Generative AI อาจใช้พลังงานมาก และบริษัทที่พัฒนาเครื่องมือเหล่านี้ตระหนักถึงต้นทุนด้านสิ่งแวดล้อมมากขึ้น มีความพยายามในการปรับปรุงประสิทธิภาพและลดคาร์บอนฟุตพริ้นท์ แต่ยังคงต้องมีการพัฒนาต่อไป
ภาพ Generative AI แสดงพลังงานที่เคลื่อนที่ผ่านยานอวกาศ

วิธีการฝึก Generative AI

การจะเข้าใจการทำงานของ Generative AI นั้น เราต้องดูว่าเกิดอะไรขึ้นก่อนที่คุณจะพิมพ์พรอมต์ กระบวนการฝึก AI รวมถึงการทำความสะอาดข้อมูลและการคัดเลือกอย่างระมัดระวังเพื่อปรับปรุงคุณภาพ การฝึกเบื้องต้นบนชุดข้อมูลขนาดใหญ่เพื่อสร้างฐานความรู้ และการปรับแต่งสำหรับงานหรือโดเมนเฉพาะ

ข้อเสนอแนะจากมนุษย์และการปรับแต่งความปลอดภัยก็มีความสำคัญ โดยจะช่วยปรับปรุงผลลัพธ์และลดอคติที่ไม่พึงประสงค์ ที่ Adobe การฝึกจะใช้ข้อมูลที่ได้รับสิทธิ์การใช้งานและผ่านการตรวจสอบลิขสิทธิ์แล้ว รวมถึงเนื้อหาจาก Adobe Stock เพื่อให้นักสร้างสรรค์มืออาชีพสามารถใช้เครื่องมือ Generative AI ได้อย่างมั่นใจ

วิธีการทำงานของโมเดล Generative AI ประเภทต่างๆ

โมเดล Generative AI มีหลายประเภท แต่ละประเภททำงานแตกต่างกันเล็กน้อย การทำความเข้าใจความแตกต่างระหว่าง Generative AI กับ AI ประเภทอื่นๆ จะช่วยให้คุณเลือกโมเดลที่เหมาะสมที่สุดสำหรับโปรเจกต์ของคุณได้

  1. โมเดลภาษาขนาดใหญ่ (LLM)
    ผ่านการฝึกด้วยชุดข้อมูลขนาดมหึมา LLM อย่าง ChatGPT หรือ Claude สร้างภาษาที่ฟังดูเป็นธรรมชาติด้วยการคาดเดาคำถัดไปในประโยค ทำให้มีประสิทธิภาพสูงในการเขียน ตอบคำถาม และสร้างบทสนทนาที่ฟังดูเหมือนมนุษย์
  2. โมเดลการแพร่กระจาย
    ใช้บ่อยในการสร้างภาพและวิดีโอ โมเดลนี้เริ่มต้นจากสัญญาณรบกวนสุ่มแล้วค่อยๆ ปรับแต่งให้เป็นผลลัพธ์ที่ชัดเจนตรงตามพรอมต์ นี่คือวิธีที่ขับเคลื่อนเครื่องมือสร้างภาพด้วย AI ของ Firefly
  3. Generative Adversarial Network (GAN)
    GAN ใช้เครือข่ายสองส่วน ได้แก่ ตัวสร้างที่ผลิตผลลัพธ์ และตัวแยกแยะที่ประเมินผลลัพธ์นั้น การแข่งขันกันทำให้ทั้งคู่พัฒนาขึ้นจนกระทั่งภาพที่สร้างขึ้นดูสมจริง GAN เป็นแรงขับเคลื่อนสำคัญในยุคแรกของงานศิลปะจาก AI และการสร้าง Deepfake
  4. ออโตเอนโคดเดอร์แบบแปรผัน (VAE)
    VAE บีบอัดข้อมูลให้เป็นตัวแทนที่เรียบง่ายขึ้นแล้วสร้างใหม่ ทำให้สามารถสร้างรูปแบบที่หลากหลายโดยยังคงรักษา "แก่นแท้" ของต้นฉบับ เหมาะอย่างยิ่งสำหรับการผสมผสานสไตล์หรือสร้างหลายเวอร์ชัน
  5. โมเดลที่ใช้ Transformer
    Transformer เป็นสถาปัตยกรรมพื้นฐานของระบบกำเนิดหลายระบบ รวมถึง LLM และโมเดลการแพร่กระจาย ใช้กลไก "ความสนใจ" เพื่อทำความเข้าใจความสัมพันธ์ระหว่างข้อมูล เช่น คำในประโยคหรือพิกเซลในภาพ ทำให้ผลลัพธ์มีความแม่นยำและสอดคล้องกับบริบท
โมเดลเหล่านี้ทำให้ Generative AI สามารถจัดการได้ทุกอย่างตั้งแต่ข้อความไปจนถึงวิดีโอ และพัฒนาต่อไปเป็นระบบที่มีความสามารถและสร้างสรรค์มากขึ้น
ภาพหญิงสวมชุดเกราะท่าทางท้าทาย พร้อมหุ่นยนต์และเครื่องจักรต่อสู้อยู่เบื้องหลัง สร้างขึ้นด้วยพรอมต์ Generative AI
ภาพประกอบเหนือจริงที่เต็มไปด้วยสีสันของชายคนหนึ่งยืนอยู่บนหน้าผามองดูดวงตาบนท้องฟ้า สร้างขึ้นด้วยพรอมต์สร้างภาพจากข้อความของ Generative AI
อาคารล้ำสมัยที่มีเส้นโค้งอันงดงาม สร้างสรรค์ด้วย AI จาก Firefly

เส้นทางการทำงานของ Generative AI จากพรอมต์สู่ผลลัพธ์

นี่คือวิธีการทำงานเบื้องหลังของ Generative AI เมื่อคุณป้อนพรอมต์โดยใช้ Adobe Firefly หรือเครื่องมือ Generative AI อื่นๆ แต่ละขั้นตอนผสมผสานแมชชีนเลิร์นนิงขั้นสูงเข้ากับการควบคุมที่ใช้งานง่าย เพื่อสร้างเนื้อหาใหม่จากข้อมูลที่คุณป้อน

1. การป้อนข้อมูลและการปรับแต่ง

เริ่มต้นด้วยการป้อนพรอมต์ข้อความหรืออัปโหลดรูปภาพอ้างอิง ระบบจะปรับแต่งตามข้อมูลที่ป้อน นั่นคือ ตีความสิ่งที่คุณต้องการและเตรียมพร้อมสร้างผลลัพธ์

2. การเข้ารหัส

ข้อมูลที่ป้อนเข้าจะถูกแปลงเป็นตัวเลขที่โมเดลสามารถเข้าใจได้ ตัวอย่างเช่น คำจะถูกแยกออกเป็นโทเค็น ส่วนรูปภาพจะถูกแปลงเป็นจุดข้อมูลที่อธิบายรูปทรง สี และลักษณะเฉพาะต่างๆ

3. การทำความเข้าใจบริบทและการจัดเรียง

โมเดล Generative AI จะประเมินข้อมูลที่คุณป้อนเข้าเทียบกับสิ่งที่ได้เรียนรู้จากข้อมูลฝึก โดยให้ความสำคัญกับความสัมพันธ์และบริบท การจัดเรียงนี้ช่วยให้มั่นใจว่าผลลัพธ์ที่ได้จะตรงกับความตั้งใจของคุณและสอดคล้องกับสิ่งที่คุณต้องการ

4. การสร้าง

โมเดลใช้การฝึกที่ได้รับเพื่อสร้างเนื้อหาใหม่ เช่น การคาดเดาคำถัดไปในประโยค การปรับปรุงสัญญาณรบกวนสุ่มให้กลายเป็นภาพ หรือการสร้างเสียงที่เหมาะสมกับคำอธิบาย

5. การชี้นำและควบคุม

การตั้งค่าของผู้ใช้ เช่น สไตล์ อัตราส่วนภาพ หรือชุดสีแบรนด์ จะเป็นตัวนำทางกระบวนการ การควบคุมเหล่านี้ช่วยกำหนดทิศทางของผลลัพธ์ให้มี Look เฉพาะ โทนเสียง หรือกรณีการใช้งานที่ต้องการ

6. การประมวลผลหลังการสร้างและการส่งออก

ระบบจะขัดเกลาผลลัพธ์ ปรับปรุงคุณภาพ และใส่การปรับแต่งขั้นสุดท้าย จากนั้นคุณสามารถดาวน์โหลด ส่งออก หรือปรับแต่งผลลัพธ์เพิ่มเติมด้วยเครื่องมือ Firefly หรือแอป Adobe ที่คุณชื่นชอบ

คำถามที่พบบ่อยเกี่ยวกับการทำงานของ AI กำเนิด

บทความเกี่ยวกับ Generative AI

งานศิลปะจาก AI คืออะไรและทำงานอย่างไร

Generative AI ได้กลายเป็นเครื่องมือที่ขาดไม่ได้สำหรับศิลปินอย่างรวดเร็ว อ่านต่อเพื่อศึกษาว่างานศิลปะจาก Generative AI คืออะไร มีวิธีสร้างสรรค์แบบใด และคุณจะนำมาใช้จริงได้อย่างไร

7 สไตล์ศิลปะสำหรับพรอมต์ AI

ดูวิธีการสร้างรูปภาพในรูปแบบเซอร์เรียลลิสม์ คิวบิสม์ อิมเพรสชันนิสม์ และรูปแบบศิลปะอื่นๆ ด้วย Generative AI

วิธีการเขียนพรอมต์ AI สำหรับงานสถาปัตยกรรม

หากใช้พรอมต์ข้อความได้ถูกต้องและได้เรียนรู้วิธีสักเล็กน้อย สถาปนิกก็สามารถใช้ Generative AI ในการสำรวจ หาไอเดีย และยกระดับวิสัยทัศน์ได้

พรอมต์ AI สำหรับนักออกแบบกราฟิก

เรียนรู้วิธีเขียนพรอมต์ที่มีประสิทธิภาพสำหรับ Generative AI เพื่อให้ได้ผลลัพธ์ที่น่าทึ่งสำหรับการออกแบบกราฟิก

Adobe Firefly

ใช้ภาษาที่ใช้ในชีวิตประจำวันเพื่อสร้างผลลัพธ์อันน่าทึ่งด้วย Generative AI

สำรวจ Adobe Firefly