Khi Công Cụ Bắt Đầu Mơ: Suy Ngẫm Về Midjourney Video và Bản Chất Sáng Tạo

Cha tôi giữ trên bàn làm việc một bức tranh ghép ô chữ còn dang dở, được đóng khung cẩn thận. Đó là kỷ vật từ một buổi chiều nắng đẹp năm 1987, khi ông quyết định thay vì tiếp tục giải đố, ông thà đi cắt cỏ. Nó như một đài tưởng niệm cho một lựa chọn mà tôi hiểu rất rõ: quyết định làm bất cứ điều gì khác thay vì việc bạn “phải” làm. Điều này khiến tôi suy nghĩ về những khoảnh khắc trong đời, khi ta muốn kiến tạo một điều gì đó, thực sự hiện thực hóa một hình ảnh hay một câu chuyện, nhưng nỗ lực to lớn, bức tường thực tế dường như không thể vượt qua, lại khiến ta chọn con đường ít chông gai nhất. Tôi nhớ lại những nỗ lực làm phim thời niên thiếu của mình với chiếc máy quay cồng kềnh; những hình dung điện ảnh hoành tráng trong đầu tôi đã tan biến thành những thước phim nhòe nhoẹt, rung lắc trên màn hình, để lại một vực sâu thăm thẳm giữa trí tưởng tượng vô bờ và hiện thực khắc nghiệt.

Và giờ đây, với làn sóng mới này, sự trỗi dậy của trí tuệ nhân tạo len lỏi vào tận nền tảng của sáng tạo thị giác, người ta không khỏi băn khoăn: điều gì sẽ xảy ra khi chính những công cụ bắt đầu biết mơ? Điều gì sẽ đến khi người tạc mây bất chợt được trao một cỗ máy có thể, theo nghĩa đen, ngưng tụ hơi nước thành những hình thù chuyển động đáng kinh ngạc?

Tôi đã đắm mình trong những tin tức mới nhất từ biên giới kỹ thuật số, đặc biệt là những bàn tán xoay quanh bước nhảy vọt táo bạo của Midjourney vào lĩnh vực tạo video. Nó giống như việc chứng kiến một trí tuệ non trẻ chập chững những bước đi đầu tiên, dù còn lung lay nhưng vô cùng nhất quán. Có một loại phép thuật đặc biệt trong đó, một khả năng đáng kinh ngạc trong việc nắm giữ một ý tưởng hình ảnh—một vật thể cụ thể, một cú lia máy chính xác, thậm chí là vũ điệu tinh tế của ánh sáng và bóng tối—một cách chắc chắn trong phạm vi điều khiển tổng hợp của nó, từng khung hình một. Điều đó, một cách kỳ lạ, gợi cho tôi nhớ về một họa sĩ bậc thầy có thể tái tạo chính xác sắc thái hoàng hôn qua một loạt các bức tranh, không hề sai sót. Cách nó theo dõi tiêu điểm, làm sắc nét và làm mờ hậu cảnh với sự thấu hiểu gần như con người về chiều sâu điện ảnh, cho thấy một sự nắm vững ngữ pháp thị giác một cách tinh vi. Và rồi có tính năng “tham chiếu phong cách” này, nó không giống một mẹo kỹ thuật mà giống một đột phá trong bộ nhớ thẩm mỹ hơn, cho phép một sự liên tục của ngôn ngữ thị giác giữa các clip khác nhau, gần như thể cỗ máy đang hấp thụ một tâm trạng, một cảm xúc, và sau đó chuyển hóa nó thành một nhịp điệu thị giác nhất quán. Đối với bất cứ ai từng vật lộn với cơn ác mộng hậu cần của làm phim truyền thống—ánh sáng, ống kính, cuộc truy tìm sự liên tục không ngừng—đây quả thực là một điều ngoạn mục. Nó giống như tìm thấy cả một dàn nhạc sống trong chiếc laptop của bạn, sẵn sàng trình diễn bất kỳ bản giao hưởng nào bạn có thể hình dung.

Nhưng, như với bất kỳ phát minh vĩ đại nào, quỷ dữ, hay có lẽ là con yêu tinh tinh nghịch, ẩn trong từng chi tiết. Dù Midjourney có thể tạo ra những hình ảnh đáng kinh ngạc, nó vẫn vấp váp với những quy tắc cơ bản của thế giới vật lý của chúng ta. Hãy tưởng tượng yêu cầu nó rót nước vào một cái cốc: cốc chắc chắn sẽ đầy, nhưng nước thường hành xử với một độ nhớt kỳ lạ, gần như dầu, như một chất lỏng từ chiều không gian khác, không tạo ra tiếng văng và gợn sóng quen thuộc của H2O. Hoặc hãy xem xét chiếc đèn lava khiêm tốn: cỗ máy hiểu hình dạng, chuyển động, nhưng sau đó, một cách khó hiểu, chất lỏng có thể tràn ra ngoài giới hạn của đèn, một khoảnh khắc chệch choạc trong sự thấu hiểu về sự chứa đựng, như thể nó vẫn đang học các định luật vật lý cơ bản từ đầu. Và đừng nhắc đến những phức tạp tinh tế khi một bàn tay đi qua một khe hẹp, chẳng hạn như quai tách trà; AI, trong phiên bản hiện tại, ưa thích lách qua chướng ngại vật, một sự từ chối lịch sự nhưng kiên quyết không vi phạm tính toàn vẹn của vật thể. Dường như nó hiểu *ý niệm* về tương tác nhưng không nắm bắt được cơ chế chi tiết, cụ thể của nó. Cũng có một sự cứng đầu kỳ lạ khi bạn yêu cầu các chuyển động không đồng bộ—chẳng hạn một đàn sứa, mỗi con lay động theo nhịp điệu nội tại riêng; AI, với trái tim nhất quán của nó, thường sẽ khiến tất cả chúng đập nhịp đồng bộ, như một dàn đồng ca kỹ thuật số. Điều đó khiến người ta ngẫm nghĩ về bản chất của sự ngẫu nhiên, hay có lẽ, sự ưu tiên sâu sắc của AI đối với trật tự.

Sự pha trộn kỳ lạ giữa khả năng kinh ngạc và sự ngây thơ khó hiểu này cộng hưởng sâu sắc với những nỗ lực sáng tạo vụng về của chính tôi, hay thậm chí chỉ là việc cố gắng thấu hiểu thế giới. Đã bao nhiêu lần tôi tiếp cận một vấn đề phức tạp với một giải pháp thanh lịch, toàn diện chỉ để rồi vấp phải một chi tiết nhỏ, không ngờ tới? Điều đó gợi cho tôi nhớ về những ngày tôi tỉ mỉ lên kế hoạch cho một khu vườn, vẽ ra từng bụi hồng, từng luống oải hương, chỉ để rồi phát hiện ra đất ở một góc nào đó cứng đầu không hợp tác, hoặc bóng râm ngả xuống khác với những gì tôi tưởng tượng. Có một sự khiêm nhường khi chứng kiến những mô hình AI khổng lồ này vấp váp ở một điều đơn giản như việc rót nước, một tấm gương phản chiếu những giới hạn của chính con người chúng ta khi đối mặt với vô vàn phức tạp của thực tại. Chúng ta xây dựng những cỗ máy đáng kinh ngạc này để mở rộng tầm với của mình, chỉ để rồi nhận ra chúng vẫn chưa thực sự thành thạo nghệ thuật cầm một chiếc tách trà đơn giản.

Vậy, khả năng tạo hình ảnh mới mẻ này, video của Midjourney, thực sự đang nói với chúng ta điều gì? Tôi nghĩ, nó không chỉ là một cách làm phim rẻ hơn, mặc dù ý nghĩ tạo ra những cảnh quay điện ảnh vô tận chỉ với chi phí vài cốc cà phê chắc chắn rất hấp dẫn. Không, nó là điều gì đó sâu sắc hơn. Đó là một công nghệ vừa giải phóng vừa đồng thời giới hạn, mở rộng chân trời của những gì có thể sáng tạo trong khi buộc chúng ta đối mặt với những lỗ hổng dai dẳng, đôi khi hài hước, trong sự hiểu biết của nó về thế giới vật lý của chúng ta. Câu hỏi thực sự, vậy thì, không chỉ là nó có thể làm gì, mà là chúng ta sẽ làm gì với nó. Liệu chúng ta có chỉ đơn thuần đòi hỏi sự bắt chước hoàn hảo, hay chúng ta sẽ học cách cộng tác với những cỗ máy thông minh này, đón nhận những kỳ quặc, những “thất bại” bất ngờ của chúng như những con đường mới cho biểu hiện nghệ thuật? Có lẽ tương lai của làm phim, và thực tế là của mọi nỗ lực sáng tạo, không nằm ở sự kiểm soát hoàn hảo, mà ở nghệ thuật thỏa hiệp tinh tế, một vũ điệu giữa trí tưởng tượng con người và giấc mơ bất ngờ, đôi khi khó hiểu, của cỗ máy.