ปี 2023 ที่ผ่านมาเราได้เห็นแล้วว่าเป็นปีแห่งการเปลี่ยนแปลงของเทคโนโลยี โดย Generative AI กลายเป็นกระแสหลัก เมื่อเราเริ่มต้นปี 2024 ภาพรวมของ Generative AI คาดว่าจะพัฒนาอย่างรวดเร็ว โดยนำเสนอเทรนด์มากมายที่แต่ละค่ายสัญญาว่าจะเปลี่ยนแปลงเทคโนโลยีและแอปพลิเคชันของมัน
แนวโน้มเหล่านี้ ตั้งแต่ความก้าวหน้าในโมเดล AI ต่อเนื่องหลายรูปแบบไปจนถึงการเพิ่มขึ้นของโมเดลภาษาเล็กๆ ไม่เพียงแต่จะกำหนดภูมิทัศน์ทางเทคโนโลยีเท่านั้น แต่ยังกำหนดนิยามใหม่ของปฏิสัมพันธ์ ความคิดสร้างสรรค์ และความเข้าใจในศักยภาพของ AI อีกด้วย
งั้นเรามาสำรวจเทรนด์ AI เชิงสร้างสรรค์อันดับต้นๆ กัน:
1. การเกิดขึ้นของโมเดล AI ต่อเนื่องหลายรูปแบบ
GPT4 ของ OpenAI, Llama 2 ของ Meta และ Mistral ล้วนทำหน้าที่เป็นตัวอย่างของความก้าวหน้าในแบบจำลองภาษาขนาดใหญ่ เทคโนโลยีนี้เป็นมากกว่าข้อความด้วยโมเดล AI หลากหลายรูปแบบ ช่วยให้ผู้ใช้สามารถผสมและจับคู่เนื้อหาตามข้อความ เสียง รูปภาพ และวิดีโอ เพื่อแจ้งและสร้างเนื้อหาใหม่ แนวทางนี้เกี่ยวข้องกับการรวมข้อมูล เช่น รูปภาพ ข้อความ และคำพูด เข้ากับอัลกอริธึมขั้นสูงเพื่อคาดการณ์และสร้างผลลัพธ์
ในปี 2024 AI หลายรูปแบบคาดว่าจะมีการพัฒนาอย่างมีนัยสำคัญ โดยจะนำมาซึ่งการเปลี่ยนแปลงในความสามารถด้าน AI เชิงสร้างสรรค์ โมเดลเหล่านี้มีความก้าวหน้าไปไกลกว่าฟังก์ชันโหมดเดี่ยวแบบเดิม โดยผสมผสานข้อมูลประเภทต่างๆ ที่หลากหลาย เช่น รูปภาพ ภาษา และเสียง ผลจากการเปลี่ยนไปใช้โมเดลหลายรูปแบบ AI จะกลายมาเป็นสัญชาตญาณและdynamic มากขึ้น
GPT4-V ได้รับความนิยมในหมู่สมาชิก ChatGPT Plus อยู่แล้วเนื่องจากความสามารถที่หลากหลาย ในปี 2024 เราคาดว่าจะมีโมเดลแบบเปิดเพิ่มมากขึ้น เช่น Large Language and Vision Assistant หรือ Llava
2. โมเดลภาษาขนาดเล็กที่มีความสามารถและทรงพลัง
หากปี 2023 เป็นปีแห่งโมเดลภาษาขนาดใหญ่ ปี 2024 นี้ก็จะได้เห็นพลังของโมเดลภาษาขนาดเล็ก LLM ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่ เช่น Common Crawl และ The Pile ข้อมูลจำนวนเทราไบต์ที่ประกอบด้วยชุดข้อมูลเหล่านี้ถูกดึงมาจากเว็บไซต์สาธารณะที่เข้าถึงได้นับพันล้านเว็บไซต์ แม้ว่าข้อมูลจะเป็นประโยชน์ในการสอน LLM ในการสร้างเนื้อหาที่มีความหมายและทำนายคำถัดไป แต่ลักษณะที่มีเสียงดังนั้นเกิดจากรากฐานของเนื้อหาบนอินเทอร์เน็ตทั่วไป
ในทางกลับกัน โมเดลภาษาขนาดเล็กได้รับการฝึกฝนบนชุดข้อมูลที่จำกัดมากขึ้น ซึ่งยังคงประกอบด้วยแหล่งข้อมูลคุณภาพสูง เช่น หนังสือเรียน วารสาร และเนื้อหาที่เชื่อถือได้ โมเดลเหล่านี้มีขนาดเล็กกว่าในแง่ของจำนวนพารามิเตอร์ รวมถึงข้อกำหนดด้านพื้นที่เก็บข้อมูลและหน่วยความจำ ทำให้สามารถทำงานบนฮาร์ดแวร์ที่มีประสิทธิภาพน้อยกว่าและราคาไม่แพง SLM ผลิตเนื้อหาที่มีคุณภาพเทียบเท่ากับบริษัทอื่นๆ ที่มีขนาดใหญ่กว่า แม้ว่าจะเป็นเพียงเศษเสี้ยวของขนาดของ LLM ก็ตาม
PHI-2 และ Mistral 7B ของ Microsoft เป็น SLM ที่มีแนวโน้มว่าจะขับเคลื่อนแอปพลิเคชัน AI รุ่นต่อไป
องค์กรต่างๆ จะสามารถปรับแต่ง SLM เพื่อให้สามารถปรับให้เข้ากับงานเฉพาะและฟังก์ชันเฉพาะโดเมนได้ สิ่งนี้จะเป็นไปตามข้อกำหนดทางกฎหมายและข้อบังคับ ซึ่งจะเร่งการนำโมเดลภาษาไปใช้
3. การเพิ่มขึ้นของตัวแทนอัตโนมัติ
ตัวแทนอัตโนมัติเป็นตัวแทนของกลยุทธ์ที่เป็นนวัตกรรมสำหรับการสร้างแบบจำลอง AI เชิงสร้างสรรค์ เอเจนต์เหล่านี้เป็นโปรแกรมซอฟต์แวร์อิสระที่ออกแบบมาเพื่อบรรลุวัตถุประสงค์เฉพาะ เมื่อพิจารณาถึง generative AI ความสามารถของตัวแทนอัตโนมัติในการผลิตเนื้อหาที่ปราศจากการแทรกแซงของมนุษย์นั้นเหนือกว่าข้อจำกัดที่เกี่ยวข้องกับวิศวกรรมที่รวดเร็วแบบเดิมๆ
อัลกอริธึมขั้นสูงและเทคนิคการเรียนรู้ของเครื่องถูกนำมาใช้ในการพัฒนาตัวแทนอัตโนมัติ เจ้าหน้าที่เหล่านี้ใช้ข้อมูลเพื่อเรียนรู้ ปรับให้เข้ากับสถานการณ์ใหม่ๆ และตัดสินใจโดยอาศัยการแทรกแซงของมนุษย์เพียงเล็กน้อย ตัวอย่างเช่น OpenAI ได้สร้างเครื่องมือ เช่น GPT แบบกำหนดเองที่ใช้ตัวแทนอัตโนมัติอย่างมีประสิทธิภาพ ซึ่งบ่งบอกถึงความก้าวหน้าที่สำคัญในด้านปัญญาประดิษฐ์
Multimodal AI ซึ่งผสมผสานเทคนิค AI ต่างๆ เช่น การประมวลผลภาษาธรรมชาติ คอมพิวเตอร์วิทัศน์ และการเรียนรู้ของเครื่อง มีความสำคัญอย่างยิ่งในการพัฒนาตัวแทนอัตโนมัติ สามารถคาดการณ์ ดำเนินการ และโต้ตอบได้อย่างเหมาะสมมากขึ้นโดยการวิเคราะห์ประเภทข้อมูลต่างๆ ในเวลาเดียวกัน และใช้บริบทปัจจุบัน
เฟรมเวิร์ก เช่น LangChain และ LlamaIndex คือเครื่องมือยอดนิยมบางส่วนที่ใช้ในการสร้างตัวแทนตาม LLM ในปี 2024 เราจะได้เห็นเฟรมเวิร์กใหม่ๆ ที่ใช้ประโยชน์จาก Multimodal AI
ผ่านการโต้ตอบที่ชาญฉลาดและตอบสนอง ตัวแทนอัตโนมัติจะมีประโยชน์อย่างมากในการปรับปรุงประสบการณ์ของลูกค้า ตัวแทนที่มีบริบทสูงเหล่านี้จะได้เปรียบในอุตสาหกรรมแนวตั้ง เช่น การเดินทาง การต้อนรับ การค้าปลีก และการศึกษา เนื่องจากตัวแทนเหล่านี้ลดต้นทุนโดยรวมโดยการลดการแทรกแซงของมนุษย์
4. โมเดลแบบเปิดจะสามารถเทียบเคียงได้กับโมเดลที่เป็นกรรมสิทธิ์
ในปี 2024 โมเดล AI แบบเปิดและสร้างสรรค์คาดว่าจะมีการพัฒนาอย่างมีนัยสำคัญ โดยมีการคาดการณ์บางอย่างที่ชี้ให้เห็นว่าโมเดลเหล่านี้จะเทียบได้กับโมเดลที่เป็นกรรมสิทธิ์ ในทางกลับกัน การเปรียบเทียบระหว่างโมเดลแบบเปิดและโมเดลที่เป็นกรรมสิทธิ์นั้นมีความซับซ้อนและขึ้นอยู่กับปัจจัยหลายประการ รวมถึงกรณีการใช้งานเฉพาะ ทรัพยากรในการพัฒนา และข้อมูลที่ใช้ในการฝึกโมเดล
Llama 2 70B, Falcon 180B และ Mixtral-8x7B ของ Meta’s ได้รับความนิยมอย่างมากในปี 2023 โดยมีประสิทธิภาพเทียบเท่ากับรุ่นที่เป็นกรรมสิทธิ์ เช่น GPT 3.5, Claude 2 และ Jurassic-2
ในอนาคต ช่องว่างระหว่างโมเดลแบบเปิดและโมเดลที่เป็นกรรมสิทธิ์จะลดลง ทำให้องค์กรต่างๆ มีตัวเลือกที่ยอดเยี่ยมสำหรับการโฮสต์โมเดล AI เชิงสร้างสรรค์ในสภาพแวดล้อมแบบไฮบริดหรือแบบภายในองค์กร
ในปี 2024 การทำซ้ำครั้งต่อไปของโมเดลจาก Meta, Mistral และอาจเปิดตัวใหม่เป็นทางเลือกที่เป็นไปได้สำหรับโมเดลที่เป็นกรรมสิทธิ์ซึ่งพร้อมใช้งานในรูปแบบ API
5. Cloud Native กลายเป็นกุญแจสำคัญของ GenAI ภายในองค์กร
Kubernetes เป็นสภาพแวดล้อมที่ต้องการสำหรับการโฮสต์โมเดล AI ทั่วไปอยู่แล้ว ผู้เล่นหลักเช่น Hugging Face, OpenAI และ Google คาดว่าจะใช้ประโยชน์จากโครงสร้างพื้นฐานคลาวด์เนทีฟที่ขับเคลื่อนโดย Kubernetes เพื่อส่งมอบแพลตฟอร์ม AI เชิงสร้างสรรค์
เครื่องมือต่างๆ เช่น Text Generation Inference จาก Hugging Face, Ray Serve จาก AnyScale และ vLLM รองรับการอนุมานโมเดลที่ทำงานอยู่ในคอนเทนเนอร์อยู่แล้ว ในปี 2024 เราจะเห็นความสมบูรณ์ของเฟรมเวิร์ก เครื่องมือ และแพลตฟอร์มที่ทำงานบน Kubernetes เพื่อจัดการวงจรการใช้งานทั้งหมดของโมเดลพื้นฐาน ผู้ใช้จะสามารถฝึกอบรมล่วงหน้า ปรับแต่ง ปรับใช้ และปรับขนาดโมเดลที่สร้างได้อย่างมีประสิทธิภาพ
ผู้เล่นในระบบนิเวศหลักบนคลาวด์จะให้สถาปัตยกรรมอ้างอิง แนวทางปฏิบัติที่ดีที่สุด และการเพิ่มประสิทธิภาพสำหรับการรัน AI แบบสร้างสรรค์บนโครงสร้างพื้นฐานแบบเนทีฟบนคลาวด์LLMOps จะได้รับการขยายเพื่อรองรับเวิร์กโฟลว์เนทีฟบนคลาวด์แบบรวม
ในปี 2024 generative AI จะยังคงพัฒนาอย่างรวดเร็ว โดยนำเสนอความสามารถใหม่ๆ ที่น่าแปลกใจ ซึ่งจะเป็นประโยชน์ต่อทั้งผู้บริโภคและองค์กร