Google tung AI tạo video 1080p, cạnh tranh với Sora
Google đã ra mắt AI tạo video từ câu lệnh mang tên Veo tại sự kiện Google I/O vào rạng sáng ngày 15/5 (giờ Hà Nội). Demis Hassabis, CEO của Google DeepMind, đã giới thiệu công cụ này như một bước đột phá trong lĩnh vực tạo video tự động, với khả năng sản xuất video chất lượng cao, độ phân giải 1080p và thời lượng dài hơn 1 phút. Cùng theo dõi thông tin chi tiết hơn qua bài viết bên dưới nhé!
Veo - công cụ AI tạo video cạnh tranh với Sora
Ra mắt ba tháng sau khi Sora của OpenAI xuất hiện và gây tiếng vang trong cộng đồng, Veo của Google nổi bật với khả năng hiểu ngôn ngữ tự nhiên và bắt chước chính xác âm điệu của các lời nhắc từ người dùng. AI này có thể tạo ra các video phản ánh chặt chẽ tầm nhìn sáng tạo của người dùng, hiểu các thuật ngữ điện ảnh như "timelapse" hay "ảnh phong cảnh từ trên không", và tạo ra các cảnh quay nhất quán với các chủ thể như con người, động vật và đồ vật chuyển động chân thực.
Các video minh họa cho khả năng của Veo thường có thời lượng khoảng 8 giây. Tuy nhiên, Veo còn cho phép người dùng yêu cầu kéo dài thời lượng video lên đến 1 phút 10 giây. Điều này không chỉ đáp ứng tốt hơn nhu cầu của người dùng mà còn vượt qua giới hạn tối đa một phút mà OpenAI Sora đã công bố trước đó. Bên cạnh đó, Veo còn cho phép người dùng tinh chỉnh video bằng các lời nhắc bổ sung, giúp thay đổi và hoàn thiện kết quả cuối cùng theo ý muốn.
Theo Google, Veo được xây dựng trên nền tảng của năm mô hình tạo video chính: Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere. Những mô hình này được kết hợp cùng với nhiều kỹ thuật khác nhau để nâng cao chất lượng và độ phân giải đầu ra của video.
Google đã thực hiện các cải tiến về kỹ thuật, giúp các mô hình học cách hiểu nội dung video một cách sâu sắc hơn, hiển thị hình ảnh với độ phân giải cao, và mô phỏng chính xác tính chất vật lý của thế giới thực. Những tiến bộ này không chỉ thúc đẩy nghiên cứu AI của Google mà còn mở ra khả năng phát triển nhiều sản phẩm hữu ích hơn, giúp người dùng tương tác và giao tiếp theo những cách mới mẻ.
Tại sự kiện Google I/O, ngoài việc giới thiệu Veo, Google còn đề cập một công cụ AI tạo hình ảnh mới mang tên Imagen 3. Công cụ này được quảng bá với khả năng tạo ra những bức ảnh có "mức độ chi tiết đáng kinh ngạc", hình ảnh chân thực và sống động như thật. Đặc biệt, Imagen 3 giảm thiểu các chi tiết gây mất tập trung trong ảnh, mang lại chất lượng hình ảnh vượt trội so với các mô hình trước đây.
Google tin rằng những kiến thức và tiến bộ đạt được từ việc phát triển Veo và các mô hình liên quan sẽ đóng góp quan trọng vào sự phát triển của nghiên cứu AI và tạo điều kiện cho việc xây dựng nhiều sản phẩm sáng tạo và hiệu quả hơn trong tương lai.
Ảnh trên được tạo ra từ câu lệnh mô tả: "Ba người phụ nữ đứng cạnh nhau cười, với một người nằm ngoài khoảng nét một chút. Mặt trời đang lặn ở phía sau, tạo ra ánh sáng lóa của ống kính và làm nổi bật mái tóc, tạo hiệu ứng mờ ở hậu cảnh. Phong cách chụp chân thực, ghi lại khoảng khắc kết nối và hạnh phúc giữa những người bạn..."
Imagen 3 không chỉ hiểu rõ hơn về ngôn ngữ tự nhiên mà còn dự đoán chính xác mục đích của người dùng thông qua các lời nhắc, cho phép tạo ra ảnh với đa dạng phong cách.
Cả Veo và Imagen 3, tương tự như nhiều AI tạo video và ảnh khác, hiện vẫn chưa được phát hành rộng rãi. Google tiết lộ rằng sản phẩm mới này đã được cung cấp cho một số nhà sáng tạo nội dung để dùng thử. Những người quan tâm cần đăng ký vào danh sách chờ. Bên cạnh đó, Google cũng có kế hoạch tích hợp một số tính năng của Veo vào YouTube Shorts và các sản phẩm khác.
Bên cạnh việc cập nhật thêm nhiều thông tin công nghệ hữu ích, nếu muốn trải nghiệm hàng loạt ứng dụng trên iOS/Android, bạn có thể đến 24hStore và sắm ngay một chiếc điện thoại mới từ các thương hiệu nổi tiếng như Samsung, Apple, Xiaomi, Oppo,... Bạn cũng đừng ngần ngại liên hệ qua hotline 1900.0351, đội ngũ tư vấn luôn sẵn sàng cung cấp cho bạn mọi thông tin về sản phẩm thật nhanh chóng.