Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFutures‌EarnQuảng trườngThêm
OpenAI tiếp tục con đường "báo động đỏ" với mô hình tạo ảnh mới

OpenAI tiếp tục con đường "báo động đỏ" với mô hình tạo ảnh mới

TechCrunchTechCrunch2025/12/16 18:29
Hiển thị bản gốc
Theo:TechCrunch

OpenAI đang triển khai một phiên bản mới của ChatGPT Images, hứa hẹn khả năng tuân thủ hướng dẫn tốt hơn, chỉnh sửa chính xác hơn và tốc độ tạo hình ảnh nhanh hơn gấp 4 lần.

Mô hình mới, có tên GPT-Image-1.5, sẽ được cung cấp bắt đầu từ thứ Ba cho tất cả người dùng ChatGPT và thông qua API. Đây là động thái mới nhất trong cuộc cạnh tranh với Google Gemini sau khi CEO OpenAI, Sam Altman, tháng trước đã tuyên bố “báo động đỏ” trong một bản ghi nhớ nội bộ bị rò rỉ. Bản ghi nhớ này đã nêu chi tiết kế hoạch của OpenAI nhằm lấy lại vị thế dẫn đầu AI sau khi Google bắt đầu chiếm lĩnh thị phần với việc ra mắt Gemini 3, mô hình chủ lực mới nhất của họ, và Nano Banana Pro, phiên bản mới nhất của trình tạo hình ảnh lan truyền của Google – cả hai đều đứng đầu bảng xếp hạng LMArena ở nhiều tiêu chí khác nhau. 

Google vẫn duy trì vị trí dẫn đầu ngay cả sau khi OpenAI đáp trả thành công của họ vào tuần trước bằng việc ra mắt GPT-5.2, được quảng bá là mô hình tiên tiến nhất dành cho các nhà phát triển và sử dụng chuyên nghiệp hàng ngày. Theo báo cáo, OpenAI đã lên kế hoạch phát hành một trình tạo hình ảnh mới vào đầu tháng 1, và đã đẩy nhanh kế hoạch này với thông báo trong tuần này. Lần phát hành mô hình hình ảnh gần nhất của họ là GPT-Image-1 vào tháng 4. 

GPT-Image-1.5 ra mắt trong bối cảnh các trình tạo hình ảnh và video đang vượt ra khỏi giai đoạn nguyên mẫu và có nhiều khả năng sẵn sàng cho sản xuất hơn. Tương tự như Nano Banana Pro, ChatGPT Images cung cấp các tính năng hậu kỳ, mang lại khả năng kiểm soát chỉnh sửa chi tiết hơn để duy trì sự nhất quán về hình ảnh, như độ giống khuôn mặt, ánh sáng, bố cục và tông màu trên các lần chỉnh sửa. 

OpenAI tiếp tục con đường Cùng một hình ảnh ở trên với các chỉnh sửa khác nhau để minh họa khả năng tuân thủ hướng dẫn được cải thiện của GPT-Image-1.5. Image Credits:OpenAI

Hầu hết các công cụ tạo hình ảnh GenAI đều kém trong việc lặp lại, vì vậy đây sẽ là một bước tiến lớn. Khi được yêu cầu thay đổi cụ thể, như ‘điều chỉnh biểu cảm khuôn mặt’ hoặc ‘làm cho ánh sáng lạnh hơn’, các mô hình thường diễn giải lại toàn bộ hình ảnh, dẫn đến thiếu sự nhất quán. 

Bản cập nhật này không chỉ về các tính năng mới. ChatGPT Images giờ đây cũng sẽ có thể truy cập thông qua một điểm vào chuyên dụng trên thanh bên ChatGPT, hoạt động “giống như một studio sáng tạo hơn”, Fidji Simo, CEO ứng dụng của OpenAI, đã viết trong một bài đăng trên blog vào thứ Ba. 

“Các màn hình xem và chỉnh sửa hình ảnh mới giúp bạn dễ dàng tạo ra những hình ảnh phù hợp với ý tưởng của mình hoặc lấy cảm hứng từ các gợi ý thịnh hành và bộ lọc cài sẵn,” Simo viết.

Techcrunch event

Tham gia danh sách chờ Disrupt 2026

Thêm tên bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird. Các sự kiện Disrupt trước đây đã mang đến Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil và Vinod Khosla lên sân khấu — là một phần của hơn 250 nhà lãnh đạo ngành tổ chức hơn 200 phiên thảo luận nhằm thúc đẩy sự phát triển và nâng cao lợi thế cạnh tranh của bạn. Ngoài ra, bạn còn có cơ hội gặp gỡ hàng trăm startup đổi mới trên mọi lĩnh vực.

Tham gia danh sách chờ Disrupt 2026

Thêm tên bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird. Các sự kiện Disrupt trước đây đã mang đến Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil và Vinod Khosla lên sân khấu — là một phần của hơn 250 nhà lãnh đạo ngành tổ chức hơn 200 phiên thảo luận nhằm thúc đẩy sự phát triển và nâng cao lợi thế cạnh tranh của bạn. Ngoài ra, bạn còn có cơ hội gặp gỡ hàng trăm startup đổi mới trên mọi lĩnh vực.

San Francisco | 13-15 tháng 10, 2026

Bên cạnh trình tạo hình ảnh mới, OpenAI cũng giới thiệu các cách mới để cải thiện trải nghiệm ChatGPT với nhiều yếu tố trực quan hơn. Kế hoạch là làm cho các truy vấn tìm kiếm hiển thị nhiều hình ảnh hơn với nguồn rõ ràng, điều này có thể hữu ích cho các tác vụ như chuyển đổi đơn vị đo lường hoặc kiểm tra điểm số thể thao, theo Simo. 

“Khi bạn sáng tạo, bạn nên có thể nhìn thấy và định hình những gì mình đang làm. Khi hình ảnh kể câu chuyện tốt hơn lời nói, ChatGPT nên bao gồm chúng,” Simo viết. “Khi bạn cần một câu trả lời nhanh hoặc bước tiếp theo nằm ở một công cụ khác, nó nên xuất hiện ngay tại đó. Khi chúng tôi thực hiện điều này, chúng tôi có thể tiếp tục thu hẹp khoảng cách giữa những gì bạn nghĩ và khả năng biến nó thành hiện thực.”

0
0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!
© 2025 Bitget