OpenAI ra mắt công cụ AI tạo video từ văn bản

Lãnh đạo của OpenAI đã giới thiệu mô hình AI mới có tên Sora, tuyên bố có thể tạo ra các video dài 60 giây thực tế và giàu trí tưởng tượng từ văn bản.

Open AI cho biết, Sora có khả năng tạo video độ dài lên tới 60 giây từ văn bản, với khả năng cung cấp các cảnh có nhiều nhân vật, chuyển động cụ thể và chi tiết bối cảnh. Mô hình này không chỉ hiểu những gì người dùng yêu cầu mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới vật chất.


kRPKwxnB_2usth6uSMBhO-zc5k5-00qfbKm-FCllptV61F6aqu5QLEZL7KyoudhYJUIwSbD0F0yI_eGfEnqS0V1j-_yE9wPkrhzjwIwtmOAJsN1MOg2o73VsnbE49OPPamogVVr394JZM0PdRZfi0vs  

OpenAI dự định sẽ đào tạo các mô hình AI để có thể giúp mọi người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực. Đây là nỗ lực mới nhất của công ty đằng sau thành công của chatbot Chat GPT, tiếp tục thúc đẩy phong trào AI sáng tạo trong tương lai.

Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, chia sẻ mặc dù “các mô hình đa phương thức” không phải là mới và đã tồn tại các mô hình chuyển văn bản thành video nhưng điều làm nên sự khác biệt là độ dài và độ chính xác mà Sora có.

Sora của OpenAI được giới chuyên gia đánh giá là công cụ AI sáng tạo cho ra những thước phim chất lượng tốt nhất hiện nay. "Sora đánh dấu bước nhảy vọt trong lĩnh vực chuyển văn bản thành video", ABC News đánh giá.

Tuy nhiên, mô hình AI này vẫn tồn tại một số điểm yếu chưa được hoàn thiện. OpenAI thừa nhận: “Sora có thể gặp khó khăn khi mô phỏng chính xác tính chất vật lý của một cảnh phức tạp. Nó có thể không hiểu đúng về các mệnh đề mang tính nguyên nhân - kết quả".

Công ty ví dụ Sora có thể sáng tạo video một người cắn bánh quy nhưng sau đó chiếc bánh còn nguyên và không có vết cắn. Nó cũng có thể nhầm lẫn các chi tiết trái phải, trước sau, ví dụ hình ảnh người đàn ông chạy ngược trên máy tập.

5hpIacs1gRbHD7rrAbRcH1Bzo3bx7DsQ_1KNzew99_hwO1iq8OwxGYP_sN1DamT-z4bXAsr2eqCY6qttBenyqlDF3_Kdk9DZfLVMG-Y3tbATD70H00rCZ8mDvTQLQRZLzSHSmCzzMfnG20tvleBaM8M  

Hiện tại, thông điệp của OpenAI tập trung vào sự an toàn. Công ty có kế hoạch hợp tác với một nhóm chuyên gia để thử nghiệm mô hình mới nhất và xem xét kỹ lưỡng các khía cạnh khác nhau về nội dung ảo bao gồm thông tin giả mạo, nội dung thù địch. Đồng thời, họ cũng xây dựng các công cụ giúp phát hiện thông tin không chính xác.

Sora trước tiên được cung cấp cho các chuyên gia an ninh mạng nhằm đánh giá sản phẩm về tác hại, rủi ro. Công cụ AI này cũng cấp quyền truy cập cho một số nghệ sĩ hình ảnh, nhà thiết kế và nhà làm phim để thu thập phản hồi về cách các chuyên gia sáng tạo có thể sử dụng nó.

Những AI như Sora thậm chí sẽ thay đổi mô hình hoạt động của các nền tảng như Netflix khi người dùng có thể sửa đoạn kết câu chuyện hoặc tự tạo bộ phim theo ý mình chỉ với những dòng văn bản.