AI Sora dựng MV ca nhạc: Kinh phí và kết quả gây bất ngờ?

01/06/2024 232

Với sự bùng nổ và phát triển của trí tuệ nhân tạo ngày nay, AI Sora đã trở thành một trợ thủ đắc lực trong việc sản xuất ra nhiều MV nhạc. Vậy kinh phí đầu tư vào công? Hãy cùng 24hStore theo dõi bài viết dưới đây để biết thêm thông tin chi tiết nhé! 

Tìm hiểu về mô hình AI Sora

Sản xuất MV ca nhạc với AI Sora

Sora là một mô hình AI tiên tiến của Open AI, chuyên tạo video từ văn bản. Với Sora, bạn có thể biến những ý tưởng viết tay thành những video sống động, chân thực. Theo Open AI, các video do Sora tạo ra nổi bật với chi tiết tinh xảo, chuyển động với máy ảnh phức tạp và nhân vật biểu cảm sâu sắc. Sự đột phá của Sora là khả năng xử lý nhiều khung hình cùng lúc, đảm bảo sự nhất quán của đối tượng khi di chuyển, tạo nên những video mượt mà và sống động.

Paul Trillo và hành trình tạo ra MV âm nhạc bằng Sora

Paul Trillo- Nghệ sĩ tiên phong khám phá giới hạn của Sora

Sản xuất MV ca nhạc với AI Sora

Paul Trillo là một nghệ sĩ đa năng với những sáng tạo đầy ấn tượng trong lĩnh vực video và công nghệ. Anh nổi tiếng với việc kết hợp kỹ thuật truyền thống và công nghệ hiện đại để tạo ra những tác phẩm đột phá và sáng tạo. Từ video âm nhạc đến các dự án nghệ thuật số, Trillo luôn thách thức bản thân và khám phá những giới hạn mới trong nghệ thuật kể chuyện bằng hình ảnh. Gần đây, anh đã sử dụng mô hình AI Sora của OpenAI để tạo ra video âm nhạc "The Hardest Part", minh chứng cho tài năng và sự tiên phong trong việc ứng dụng công nghệ AI vào nghệ thuật của mình.

Quá trình ứng dụng công nghệ AI Sora vào trong MV âm nhạc “ The Hardest Part”

Sản xuất MV ca nhạc với AI Sora

Video âm nhạc “The Hardest Part” kể câu chuyện về sự trưởng thành của các nhân vật, từ những năm tháng học trung học thập niên 1980 cho đến khi kết hôn và có con. Trong MV chủ yếu sử dụng kỹ thuật phóng to và máy quay lướt qua nhiều khung cảnh khác nhau trong cuộc sống của cặp đôi và tất cả những điều đó đều được tạo ra từ Sora. Paul Trillo cho biết” The Hardest Part” được thực hiện thông qua tính năng chuyển tiếp hòa trộn đa phương thức của Sora, hiện chỉ dành riêng cho một số nghệ sĩ được Open AI lựa chọn. Trillo giải thích rằng: “ Các quá trình chuyển đổi trong video được điều khiển bằng các câu lệnh AI phức tạp và mô tả khung cảnh chi tiết, với một số phân đoạn chuyển cảnh được tinh chỉnh thêm bằng After Effects”.

Sản xuất MV ca nhạc với AI Sora

Để tạo ra video dài gần 4 phút này, Paul Trillo đã phải dành thời gian sản xuất khoảng 700 clip riêng biệt, mỗi clip dài khoảng 20 giây. Tổng cộng, anh đã tạo ra khoảng 230 phút video và chỉ sử dụng khoảng 55 clip trong số đó. Tất cả các clip ban đầu đều ở độ phân giải 720p và sau đó được nâng cấp lên 2K bằng phần mềm Topaz.

Sản xuất MV ca nhạc với AI Sora

Ngay cả việc tạo ra các câu lệnh cho Sora cũng đòi hỏi sự phức tạp và tỉ mỉ. Vì Sora là mô hình AI tạo sinh không được huấn luyện đặc biệt về thuật ngữ điện ảnh, các nhà làm phim phải diễn đạt ý tưởng của họ bằng ngôn ngữ thông dụng hơn. Thay vì sử dụng thuật ngữ kỹ thuật, họ dùng những cụm từ như "làm mờ chuyển động", "cảnh phim 35mm" hay "màu sắc thập niên 80 và cổ điển". Ví dụ, một trong những câu lệnh mà Paul sử dụng cho "The Hardest Part" là một đoạn văn dài hơn 1.000 từ, mô tả chi tiết từng góc quay, cảnh vật, tông màu, tâm trạng, họa tiết, và loại phim sử dụng.

Sự tỉ mỉ này cần thiết để hình dung và tạo ra các cảnh quay, sau đó ghép chúng lại thành một đoạn phim hoàn chỉnh. Quá trình này chắc chắn không dễ dàng đối với người không chuyên. Paul Trillo chia sẻ kinh nghiệm của mình: "Hãy thử nghiệm, đưa cho nó những thứ kỳ lạ, thất bại, thất bại và thử lại. Hãy sử dụng trí tưởng tượng của bạn để hình dung chính xác những gì bạn muốn thấy và cố gắng diễn đạt nó một cách đơn giản, như thể bạn đang nói chuyện với một đứa trẻ."

Dưới đây là một ví dụ về câu lệnh mà Paul đã sử dụng trong "The Hardest Part":

"continuous shot moving forward zooming through time, with a view of 1980s highschool hall corridor with checkered tiled floor, buzzing with students walking around. the scene is captured from a low angle front perspective, showing a door at the end of the corridor getting bigger and closer. the scene is blurred, indicating a high speed movement. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through a time and through the doorway, with a view of a open classroom of students dressed in 80s attire. we zoom through students looking to the front of the class room rushing in front of the lens. the classroom has a distinct 80s feel. the scene is captured from a front perspective, showing the students getting bigger and bigger we see two students, a male student with dark hair and jean jacket making eye contact with a female student also in a jean jacket. the female student is chewing bubblegum and make a bubble from pink bubble gum. the scene is blurred, indicating a high speed movement. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through the classroom, with a 18 year old boy with dark hair and jean jacket making eye contact with a female student also in a jean jacket. the female makes a bubble with pink bubblegum in front of the lens. we zoom through the bubble it pops and we zoom through the bubblegum and enter an open football field. the scene is moving rapidly, showing a front perspective, showing the students getting bigger and faster. the scene is blurred, indicating a high speed movement. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through an open football field overcast, from the 1980s, with the bleachers in the background distance. in the center of the shot is the same guy and girl in jean jackets with their back to camera walking in the field. we see they are holding hands the camera narrows in zooming in toward their hands clutching. the scene is moving rapidly, showing a front perspective of their hands getting bigger and closer. we zoom toward the bleachers in the background, the scene is blurred, indicating a high speed movement. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through the couple's hands holding, we zoom through the bleachers in background of the football field and through a moody forest of trees at night with the neon glow of the city in the background is out of focus with bokeh. the city is out of focus behind the trees at night. the scene is captured by the camera in a fast and smooth movement. the scene is blurred, indicating a high speed movement. the trees have an opening a tunnel at the center that we enter. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through the opening between the dark moody forest trees and we enter to a look out point at the top of a hill with a view of the out of focus city lights shimmering in the background. we zoom in toward an 80s car parked a the top of the hill with it's red taillights illuminated the grassy hill, the the lookout point and car scene is quaint and peaceful. the scene is moving rapidly, showing a front perspective of the town getting smaller and further at night. the scene is blurred, indicating a high speed movement. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPVcontinuous shot moving forward zooming through the nightime lookout point zooming through the back window of an 80s car and into the interior of the 80s car where the young couple are seating in the front seat and are leaning in toward each other, with a view of a out of focus city in the background through the car windshield, the scene is moving rapidly, showing a top view of the city. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV, continuous shot moving forward zooming through the interior of the 80s backsetat car where the couple are seating in the front seat and lean in to each other, with a view of a out of focus city in the background through the car windshield. the scene is moving rapidly, showing a straight view of the out of focus city outside the car windshield. we zoom between the faces of the young couple as they lean in toward each other. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. • One point perspective FPV,continuous shot moving forward zooming through the front seat of the car toward the young couple leaning in toward each other and we zoom out the windshield into the city at night repeating new york library with large aisles, with a counter, shelves, and products. the library is large and crowded, is in a new york city we zoom into a woman reading a book looking over their shoulder she is holiding a book up, the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. •One point perspective FPV, continuous shot moving forward zooming through infinitely through the windshield into the out of focus city at night, we zoom in and drop down to the city at night zooming through the street, through the street lamps, we zoom into the young couple walking down the middle of the street at night, the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. •One point perspective FPV, continuous shot moving forward zooming through an infinitely down the street at night and we see the couple again laughing and running under the lights at night in a suburban street, looking over their shoulder we land in a close up shot of the book. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is moody and cinematic, with a slight vignette and a warm, vintage tone. the shot is captured on 35mm film, fuji film stock from the 90s with an anamorphic 24mm lens. motion blur as we zoom continuous shot, analog film. One point perspective FPV"

Mất bao nhiêu chi phí để sử dụng Sora?

Sản xuất MV ca nhạc với AI Sora

Dự của Paul Trillo là dự án cá nhân nên mọi thông tin về chi phí đều được giữ bí mật. Nhưng trang fxguide đã đưa ra ước tính về kinh phí cho một video dài khoảng 5 phút tương tự. Việc huấn luyện một mô hình AI như Sora có thể đòi hỏi chi phí đáng kể, nhưng sử dụng nó lại có thể tiết kiệm được nhiều. Fxguide ước tính rằng để tạo ra một video dài gần 4 phút, có thể cần tới 46 giờ sử dụng GPU NVIDIA H100, với chi phí ước tính là khoảng 644 USD.

Tuy nhiên, chi phí này chỉ là phần điện toán và chưa tính các chi phí khác như lưu trữ dữ liệu, upload và download. Ngoài ra, cũng cần xem xét các chi phí liên quan đến công việc của con người như chỉ đạo, chỉnh sửa, màu sắc và hậu kỳ.

Mặc chi phí này có thể cao đối với người không chuyên, nhưng mức phí này lại vô cùng hợp lý đối với các nghệ sĩ chuyên nghiệp mong muốn tạo ra các video âm nhạc với kỹ xảo hình ảnh đặc sắc như trong dự án của Paul Trillo.

Ngoài việc cập nhật nhiều thông tin hữu ích, để trải nghiệm hàng loạt các ứng dụng trên iOS/Android, bạn hãy sắm ngay một chiếc điện thoại mới nhất từ các thương hiệu uy tín như Apple, Samsung, Xiaomi, Oppo trực tiếp tại 24hStore. Bên cạnh đó, bạn có thể liên hệ trực tiếp qua hotline 1900.0351, đội ngũ tư vấn luôn sẵn sàng hỗ trợ trao đổi mọi thông tin về sản phẩm với bạn một cách nhanh chóng nhất.

Hotline
1900 0351 (8h - 22h)
Support Zalo
Chat Zalo (8h - 22h)