Sự dịch chuyển sâu sắc của phần mềm khi những Mô hình Ngôn ngữ Lớn (LLMs) xuất hiện

Andrej Karpathy, một người tôi vẫn hay dõi theo, đã có một buổi nói chuyện về sự dịch chuyển sâu sắc của phần mềm khi những Mô hình Ngôn ngữ Lớn (LLMs) xuất hiện. Dù không biết chính xác thời điểm ông ấy chia sẻ, nhưng qua những gì tôi đọc được, có lẽ là rất gần đây thôi.

Ông ấy đã kể một câu chuyện rất giản dị mà lại chứa đựng nhiều suy tư. Phần mềm, thứ mà chúng ta vẫn nghĩ là những dòng code khô khan, giờ đang bước vào một kỷ nguyên mới, nhanh chóng và chưa từng có. Từ cái thời Software 1.0 khi mình tỉ mẩn viết từng dòng lệnh tường minh, rồi đến Software 2.0 với những mạng lưới thần kinh tự học, tự điều chỉnh trọng số, và giờ đây, lạ lẫm làm sao, là Software 3.0 – mình có thể lập trình chúng bằng ngôn ngữ tự nhiên, bằng những câu chữ rất đời thường. Điều này đòi hỏi chúng ta phải có những cách nghĩ mới, một kiểu “tự chủ một phần” và xem các tác nhân AI như những người bạn đồng hành kỹ thuật số mới mẻ.

Khi tôi nghe ông ấy ví von LLMs, tôi cứ thấy thú vị làm sao. Người ta bảo, chúng như dòng điện mới, với những chi phí đầu tư khổng lồ để “xây lưới” và chi phí vận hành mỗi khi mình “dùng điện”. Hoặc lại giống như những nhà máy sản xuất bán dẫn (fabs), nơi công nghệ được tích lũy sâu sắc. Nhưng tôi thấy cái ví von về hệ điều hành của những năm 1960 là thấm thía nhất. LLMs cứ như một hệ điều hành phức tạp, câu lệnh của mình là những “chương trình”, còn cửa sổ ngữ cảnh là “bộ nhớ” của chúng. Lúc LLMs gặp trục trặc, thế giới bỗng nhiên như “đần đi một chút”, giống như một sự cố mất điện vậy.

Có lẽ điều khiến tôi suy nghĩ nhiều nhất là cái “tâm lý” của chúng. LLMs được ví như “những mô phỏng ngẫu nhiên của con người”, mang trong mình một “tâm lý học nổi bật” rất giống chúng ta. Chúng có những siêu năng lực: kiến thức bách khoa, nhớ được những điều phi thường, như Dustin Hoffman trong phim Rainman vậy. Nhưng rồi, chúng cũng có những khiếm khuyết rất con người. Chúng có thể “ảo giác”, nói những điều không đúng, hoặc mắc chứng “trí tuệ lởm chởm” – siêu phàm ở khía cạnh này nhưng lại mắc lỗi ngô nghê ở khía cạnh khác. Đặc biệt là cái chứng “quên ngược dòng”, cứ như nhân vật trong phim Memento hay 50 First Dates, chúng không tự học hay củng cố kiến thức theo thời gian, chỉ nhớ được trong “bộ nhớ làm việc” tức thời thôi. Rồi chúng cũng rất “nhẹ dạ cả tin”, dễ bị tiêm nhiễm.

Thế nên, vấn đề là mình phải học cách làm việc cùng chúng, tìm kiếm những cơ hội mới để xây dựng các “ứng dụng tự chủ một phần”. Không phải để chúng làm hết mọi thứ, mà là để chúng trở thành “người đồng nghiệp” tí hon. Chúng tạo ra, mình kiểm tra lại. Một “vòng lặp tạo ra-xác minh” thật nhanh chóng, nơi con người giám sát những gì AI tạo ra. Những ứng dụng tốt sẽ cần quản lý ngữ cảnh tinh vi, điều phối nhiều LLM cùng lúc, và đặc biệt là giao diện người dùng (GUI) chuyên biệt để mình có thể kiểm tra thật nhanh. Một cái “thanh trượt tự chủ” bé nhỏ, để mình cảm thấy an tâm hơn khi điều khiển mức độ can thiệp của AI.

Hay cái ý “ai cũng có thể làm lập trình viên” cũng làm tôi thấy ấm lòng. Cái việc có thể lập trình LLMs bằng ngôn ngữ tự nhiên như tiếng Anh, thật sự là một điều đáng kinh ngạc. Nó dẫn đến khái niệm “vibe coding” mà ông Karpathy nói đến, nơi mình có thể tạo ra phần mềm một cách rất ngẫu hứng, theo cảm hứng. Tôi nghĩ, đây sẽ là một cánh cửa dịu dàng cho những tâm hồn chưa từng biết đến lập trình.

Rồi đến lúc mình phải nghĩ xa hơn, về việc “xây dựng cho các tác nhân AI”. Những tác nhân này là những thực thể kỹ thuật số mới, nhưng lại mang trong mình “linh hồn người”. Chúng cần tương tác với hạ tầng phần mềm. Vậy nên, tài liệu phải dễ hiểu cho chúng, như việc dùng Markdown thay vì HTML. Những cú “click” chuột xưa kia trong hướng dẫn giờ phải là những lệnh API rõ ràng để một tác nhân AI có thể thực thi. Cứ như mình đang chuẩn bị một ngôi nhà mới cho những vị khách đặc biệt vậy.

Thế thôi. Cứ mỗi lần nghĩ về những điều này, tôi lại thấy một chút háo hức, một chút bâng khuâng. Ông Karpathy ví von hành trình này giống như sự phát triển của xe tự lái vậy, phải mất cả thập kỷ chứ không phải một năm là có thể tự chủ hoàn toàn. Tôi tin, rồi mình sẽ đi đến đích, từng bước một, cùng nhau. Một thập kỷ của những tác nhân AI đang mở ra, nơi con người và AI cùng nhau kiến tạo. Nó thật sự là một thời khắc thú vị để sống và làm việc.