OpenAI ปฏิวัติ ChatGPT ด้วยการเพิ่ม GPT-4o เพื่อสร้างภาพที่ดียิ่งขึ้น
OpenAI เปิดตัวคุณสมบัติการสร้างภาพใหม่ GPT-4o ใน ChatGPT แสดงผลลัพธ์ที่ ‘ดีกว่าแบบไม่น่าเชื่อ’
OpenAI ประกาศเปิดตัวคุณสมบัติการสร้างภาพใน ChatGPT โดยตรงซึ่งอนุญาตให้ผู้ใช้งานสามารถสร้างภาพได้โดยไม่ต้องออกจากอินเตอร์เฟซของการสนทนา เมื่อวันที่ 25 มีนาคม 2025 การพัฒนาครั้งนี้เป็นส่วนหนึ่งของเป้าหมายใหญ่ของ OpenAI ในการทำให้เครื่องมือต่างๆของ AI นั้นมีประโยชน์และเข้าถึงได้ง่ายมากขึ้น ขณะเดียวกันก็เพิ่มชื่อเสียงในแวดวงศิลปะ AI
คุณสมบัติใหม่นี้พัฒนาจาก DALL·E 3 ซึ่งเปิดตัวในเดือนกันยายน 2023 แต่แล้วตกอันดับในหมู่ผู้ใช้งาน AI ที่หันไปหารุ่นถัดไป มือเครื่องอื่นๆอย่าง Flux, MidJourney v6, SD 3.5, Recraft, และ Reve ก่อนหน้านี้ OpenAI เคยนำเสนอแบบจำลองสองรูปแบบแตกต่างกันคือ GPT สำหรับการสร้างข้อความ และ DALL·E 3 สำหรับการสร้างภาพ แต่ปัจจุบัน GPT-4o จะทำหน้าที่ทั้งสองนี้ด้วยตัวเอง และ DALL·E 3 จะถูกถอดออก
“GPT-4o image generation excels at accurately rendering text, precisely following prompts, and leveraging 4o’s inherent knowledge base and chat context—including transforming uploaded images or using them as visual inspiration,” OpenAI กล่าวในบล็อกโพสต์อย่างเป็นทางการ
การผนวก DALL·E 3 ยังคงเป็นส่วนหนึ่งของแผนการของบริษัทที่ต้องการให้ GPT-4o เป็นแบบจำลอง “omni” ที่ได้รับการฝึกฝนด้วยข้อมูลหลายมิติและสามารถจัดการทักษะต่างๆได้ ผลลัพธ์ที่ได้คือแบบจำลองที่มีความสามารถ มีความถูกต้อง และชาญฉลาดมากกว่ารุ่นก่อนๆ
Sam Altman CEO ของ OpenAI กล่าวในวิดีโอ “We know we've made you wait, but we think it's really worth it, and we think you're going to love it," ในวิดีโอนี้บริษัทได้แสดงความสามารถของระบบหลายตัวอย่าง รวมถึงการสร้างหน้ามังงะที่อธิบายทฤษฎีสัมพัทธภาพ ด้วยข้อมูลป้อนในภาษาอังกฤษและแมนดาริน, การ์ดการค้าตามภาพในชีวิตจริง, และเหรียญที่ระลึกที่ผสมผสานภาพหลายภาพเข้าด้วยกันอย่างมีความแม่นยำ
แม้ว่าการสร้างภาพจะใช้เวลานานแต่มีความแม่นยำสูง “Images are much slower than our previous image generation (model), but unbelievably better. We think it's super worth the wait,” Altman กล่าวระหว่างการสาธิตและชี้ให้เห็นการอัปเกรดคุณภาพที่สำคัญว่าโอเวอร์และสามารถเพิ่มความเร็วในอนาคตได้
บริษัทเน้นว่าเทคโนโลยีนี้มีการใช้งานมากกว่าการสร้างภาพที่หรูหรา “What’s really exciting about this release is that now these models can actually visualize what they know and externalize it in a visual way,” นักวิทยาศาสตร์วิจัยที่ OpenAI กล่าว
นอกจากนี้ OpenAI ยังได้สร้างมาตรการป้องกันไม่ให้สร้าง deepfakes หรือเนื้อหาที่ผิดกฎหมาย และยังรวมถึงการลบลายน้ำภาพ โดยภาพที่สร้างขึ้นจะไม่แสดงลายน้ำให้เห็น แต่จะมีข้อมูล C2PA metadata เพื่อบ่งบอกว่าเป็นการสร้างจาก AI และกำลังพัฒนาเครื่องมือเพื่อระบุที่มาของภาพ
ภายใต้ข้อกำหนดการใช้งานของ OpenAI ผู้ใช้งานจะยังคงมีสิทธิ์ครอบครองภาพที่พวกเขาสร้างขึ้น ทั้งนี้ขึ้นอยู่กับนโยบายการใช้งานของบริษัท
Tags
#AvareumNews #ChatGPT #OpenAI #AI #Technology #DALL·E #GPT4o #Innovation
Disclaimer: This newsletter is produced with assistance from OpenAI's ChatGPT-4. All analyses are reviewed and verified by our research team.