Trong tác phẩm The Ciceronian (1528), học giả thời Phục Hưng Erasmus of Rotterdam phác họa một nhân vật ám ảnh với sự hoàn hảo của câu chữ đến mức không thể viết nổi một lá thư đơn giản. Quan sát cách người xưa học và viết, ta thấy rằng ý niệm về “viết tự động” – vốn đang gây chú ý thời trí tuệ nhân tạo – thực ra đã được manh nha từ lâu. Bài viết này tìm hiểu sự liên hệ giữa phương pháp giáo dục kiểu “Erasmian” và các mô hình ngôn ngữ lớn (LLMs), thông qua góc nhìn châm biếm của François Rabelais về việc “tự động hóa” câu chữ, và tác động của nó tới khả năng giao tiếp, xây dựng đối thoại, cũng như ý nghĩa xã hội của ngôn từ.
Sự ám ảnh với ngôn từ
Trong The Ciceronian, Erasmus dựng nên cuộc đối thoại giữa ba nhân vật: Nosoponus – kẻ tôn sùng lối hành văn kiểu Cicero tới mức ám ảnh; cùng Bulephorus và Hypologus – hai người cố “chữa” cho Nosoponus khỏi bệnh bám víu quá mức vào sự hoàn hảo.
Nhân vật Nosoponus mất hàng tuần lễ chỉ để soạn một lá thư nhắc bạn trả sách mượn, vì lúc nào cũng “viết rồi xóa,” chú ý từng chữ một, sợ sai sót. Ông chỉ viết vào đêm khuya – khi không bị quấy rầy – nhưng lại tự làm khổ mình bằng cơn khát hoàn mỹ: một câu văn có thể ngốn cả đêm. Cuối cùng, Nosoponus chán nản đến mức buông bút, không hoàn thành được.
Tình huống này nghe quen thuộc trong thời đại số. Ta đôi khi dành quá nhiều thời gian “cân não” cho một email đơn giản – và rồi, giờ đây, trí tuệ nhân tạo (AI) dưới dạng mô hình ngôn ngữ lớn (LLM) như GPT-4 có thể soạn thảo thay ta chỉ trong chớp mắt. Ví dụ, nếu Nosoponus chỉ cần vài lời nhắc bạn trả sách, GPT-4 tức thì viết:
“Chào [Tên Bạn],
Hy vọng bạn khỏe! Mình chợt nhớ là vẫn chưa nhận lại mấy quyển sách đã cho bạn mượn. Không vội lắm, nhưng khi tiện thì cho mình xin lại nhé. Cảm ơn nhiều!
Nosoponus”
Ý tưởng về “viết tự động” thực ra không phải mới. Ngay thế kỷ 16, ngoài “cách sửa chữa” là thuê người hoặc trao đổi qua miệng, mô hình giáo dục nhân văn (humanist) kiểu Erasmian cũng được xem như “cỗ máy” giúp tạo lập câu chữ mau lẹ, trôi chảy, không cần vắt óc quá nhiều.
Lập trình “tự động” theo phong cách Erasmian
Erasmus chủ trương rèn học sinh trở nên thành thạo tiếng Latin (ngôn ngữ khoa học và hành chính chủ đạo lúc bấy giờ) bằng cách bắt chước những bậc thầy văn chương cổ điển. Chính ông gợi ý sinh viên đọc đi đọc lại Cicero, Virgil, Sallust… để “hấp thụ” cú pháp, từ vựng, lối diễn đạt. Bên cạnh đó, Erasmian còn dùng một công cụ gọi là “commonplace book,” trong đó học viên chép lại các câu hay, ẩn dụ, cụm từ thú vị, xếp theo chủ đề, để khi viết thì rút ra dùng.
Với Erasmus, mục đích lớn nhất là “tự động hóa” quá trình viết ở mức độ nhất định: khi gặp đề tài cần nghị luận, hoặc đơn giản là viết thư tình, người học có thể rút sẵn những cụm ngữ pháp, những câu văn mẫu, rồi ghép nối, biến tấu. Điều này gợi liên tưởng đến LLMs thời nay, vốn “được huấn luyện trên kho dữ liệu khổng lồ (corpus) và khi được yêu cầu (prompt), sẽ “kéo” ra chuỗi từ sao cho phù hợp ngữ cảnh nhất.
Tuy nhiên, thời Phục Hưng, có hai khuynh hướng:
- Ciceronian (trường phái mô phỏng độc tôn Cicero): chỉ lấy trích dẫn và từ ngữ từ riêng Cicero.
- Eclectic (trường phái phóng khoáng hơn): kết hợp Cicero với nhiều tác giả khác, tạo lối viết “pha trộn” linh hoạt.
Trong The Ciceronian, Erasmus (đóng vai Bulephorus) thuyết phục Nosoponus (kẻ sùng bái Cicero) rằng chính Cicero, nếu sống thời nay, hẳn cũng cập nhật thêm ngôn từ và lối viết mới mẻ, thay vì bám cứng di sản cũ.
Điều thú vị:
- Với eclectic, “commonplace book” là vùng hỗ trợ. Khi người viết bí ý, chỉ việc tra sổ, lấy câu hay, từ hay.
- Với Ciceronian, “commonplace book” lại là công cụ kiểm tra gắt gao, phải “xem Cicero có từng dùng dạng này chưa” thì mới dám viết. Điều này làm Nosoponus tốn vô số thời gian, tra xét từng cách chia động từ, dẫn tới đình trệ và không bao giờ thấy văn bản “hoàn hảo”.
Erasmus hy vọng học trò sẽ nhuần nhuyễn và thành thạo “tự động” mà không rơi vào bế tắc như Nosoponus. Vì thế, trong giáo dục Erasmian, việc mô phỏng “tình huống giả” được áp dụng triệt để: học sinh đóng vai một nhân vật lịch sử, giả lập bối cảnh, rồi soạn diễn văn (công kích, hòa đàm, sám hối, cầu hôn…).
Rabelais và bi kịch “ngôn từ chỉ để trưng bày”
Đồng thời với Erasmus, nhà văn François Rabelais (tác giả loạt truyện về gia đình khổng lồ Gargantua và Pantagruel) nhìn thấy mặt trái của sự “tự động hóa” ngôn ngữ này. Trong tiểu thuyết Gargantua (1534), Rabelais miêu tả việc những nhân vật có học thức “nhân văn” phát ngôn, nhưng lời họ nói ra dường như chỉ thể hiện học vấn, chứ không thực sự truyền tải hay lắng nghe đối phương.
Đoạn nổi bật là khi Giant Grandgousier – một nhân vật chính, được rèn luyện theo lối nhân văn – cần viết thư ngăn xung đột với láng giềng Picrochole. Thay vì giải quyết tình huống thực tế, bức thư lại… lê thê, dài dòng, hùng hồn nhưng nhạt nhẽo. Tương tự, bài diễn văn của sứ giả Ulrich Gallet đọc trước Picrochole cũng mang đậm phong thái bài tập văn trường lớp, trích dẫn đạo lý, lên án chiến tranh. Cả hai được soạn cực “chính xác” về ngữ pháp, trau chuốt về tu từ, nhưng cuối cùng thất bại. Cả bức thư lẫn bài diễn văn không ngăn được chiến tranh, mà còn kích động Picrochole hơn.
Nguyên nhân:
- Họ dùng một lối diễn đạt “rập khuôn” học được từ kho tài liệu cũ (hoặc các mô hình Erasmian).
- Họ nghĩ rằng chỉ cần áp “công thức” đạo đức, hô hào hòa bình là sẽ thuyết phục được đối phương.
- Họ tỏ ra kẻ cả, không thực sự lắng nghe xem Picrochole muốn gì.
Kết quả:
- Thư của Grandgousier tuy “có vẻ” nhã nhặn, nhưng lại chứa sai sự thật (bịa ra chuyện đã gửi sứ đi “nhiều lần,” trong khi mới gửi một lần).
- Diễn văn của Gallet hoàn toàn khiêu khích, mắng mỏ Picrochole mất lý trí, rũ bỏ đức tin, “không còn sợ Chúa,”… Chính giọng điệu này càng thổi bùng xung đột.
Những “lời hay ý đẹp” hóa thành những cú “tự bắn vào chân,” bởi chúng không phải là đối thoại đích thực, mà chỉ là ngôn từ “tự động” xoay quanh khuôn mẫu “chống chiến tranh.”
Liên hệ với LLM và “hallucination” của máy
Khi phân tích trường hợp “Grandgousier viết sai sự thật” (nói dối đã cử sứ nhiều lần), ta có thể xem đó là một dạng “hallucination” như của LLM. Mô hình ngôn ngữ lớn thường tạo ra câu trả lời dựa trên xác suất từ ngữ phù hợp với “ngữ cảnh” người dùng mong đợi. Nó không có “nhận thức thực tại” để biết đâu là có thật, đâu là không.
Ví dụ, GPT-4 có thể “bịa” một phán quyết pháp lý nếu thông tin ấy trông “hợp logic” theo thống kê. Hoặc nó có thể “ghép sai” cầu thủ NBA vào một đội bóng nếu những cái tên hiện lên theo tần suất dữ liệu, thay vì phản ánh “sự thật.”
Tương tự, Grandgousier đang đóng vai “vị vua nhân từ” – một “prompt” gói trọn hình tượng thiện lành, ham hòa bình (dựa trên những gì ông và người đọc kỳ vọng từ một quân vương mẫu mực theo tinh thần nhân văn và Ki-tô giáo). Trong lúc soạn lá thư, Grandgousier “phun” ra câu từ phù hợp “vai diễn” ấy, có thể lẫn những chi tiết không chính xác, nhưng vẫn “có vẻ đúng” theo phong cách văn chương đạo đức.
Ở cả hai ví dụ (LLM và Grandgousier), người nói viết “như đúng rồi,” mà thực ra chưa chắc bám sát thực tế. Đây không hẳn là cố tình lừa gạt; mà có thể vì họ chỉ đang “lấy từ kho mẫu” để biểu đạt.
Huấn luyện “tự động” luôn dựa trên tư liệu sẵn có
Erasmus chê Nosoponus gò bó vì hắn chỉ dùng mỗi Cicero làm chuẩn, nhưng chính Erasmus cũng khuyến khích học trò “bắt chước” nhiều tác giả khác. Cuối cùng, vẫn là mô hình “lấy cái cũ để ứng dụng vào cái mới”.
- Nhóm Ciceronian: “văn mẫu” ít ỏi, nhưng nhất quán với Cicero.
- Nhóm Eclectic: “văn mẫu” đa dạng, dễ xoay trở.
LLMs còn đi xa hơn, nhờ “nuốt” hàng trăm tỷ từ. Nhờ thế, kết quả chúng tạo ra ngày càng khó phân biệt với văn người. Nhưng logic nền tảng vẫn là “phân mảnh” tình huống mới thành cụm nội dung cũ, ghép thành chuỗi từ trơn tru.
Rabelais nhận ra rằng dù “kho” có lớn đến đâu, hình thức viết “tự động” vẫn có giới hạn: nó thường sinh ra văn bản “một chiều”, hay “độc thoại,” khi người viết (hoặc mô hình) quá chú trọng đến xâu chuỗi câu từ thay vì chủ động lắng nghe người đối thoại.
Mất đi “lực” giao tiếp
J L Austin (thập niên 1950) phân biệt ba khía cạnh của phát ngôn:
- Locutionary – nội dung câu chữ (ý nghĩa ngôn ngữ).
- Illocutionary – hành động hay hiệu lực xã hội của câu nói (ví dụ, “Tôi đồng ý” trong lễ cưới chính là hành động kết hôn).
- Perlocutionary – hiệu ứng thực tế với người nghe (ví dụ, người nghe cảm thấy bị thuyết phục hoặc bị xúc phạm).
Với LLM, không có một chủ thể xã hội đứng sau. Mô hình chẳng thể tự kết hôn, đặt cược, hoặc bổ nhiệm ai. Ngay cả khi con người dùng LLM để viết, ta cũng đánh mất phần nào “quyền sở hữu” xã hội đối với câu chữ, bởi đó không phải văn phát sinh từ suy nghĩ trực tiếp và độc lập của ta, mà là sản phẩm “là là” giữa ta với một kho dữ liệu vô danh.
Chuyện Grandgousier và Gallet là minh họa rõ. Lời họ nói (phản đối chiến tranh) và “thái độ” (lên giọng đạo đức, không thèm lắng nghe) đối nghịch nhau. Kết quả, Picrochole cảm thấy bị sỉ nhục, tiến hành giao tranh dữ dội hơn. Đây là thất bại về illocutionary force: Bề ngoài câu chữ nói “Ta muốn hòa,” nhưng cách nói lại bộc lộ ý đồ hiếu thắng (hoặc ít ra, trịch thượng).
Hiệu lực xã hội (illocutionary) của ngôn từ chỉ khả thi khi ngôn từ được kiểm soát có ý thức bởi người phát ra, tính đến cảm nhận của người nghe. Nếu xem phát ngôn là “bài tập” hay “chuỗi câu trích từ kho Erasmian,” thì chúng không khác gì máy phát câu. Người nghe cũng chẳng thấy thiện chí thực sự.
Bài học về “đối thoại thực sự”
Trong Gargantua, Rabelais xây dựng xung đột leo thang chủ yếu do “nhân vật có học” (Grandgousier, Gallet) tỏ ra chuẩn mực ngôn từ, nhưng không thực tâm đối thoại. Họ thao thao bất tuyệt mà không hỏi Picrochole “Anh muốn gì?”.
Ngược lại, Picrochole (dù bị vẽ là kẻ hiếu chiến) lại mở đầu bằng câu: “Ngươi có gì muốn nói?” – một thái độ sẵn sàng lắng nghe. Đây là điều Rabelais nhấn mạnh: chân đối thoại bắt đầu từ câu hỏi.
Ở khía cạnh đạo đức, Rabelais chỉ ra “lỗi” của giáo dục Erasmian: nó dạy người ta biết viết hay, viết nhanh, nhưng không dạy cách tương tác thật sự, cách nghe phản hồi, cách đặt câu hỏi. Nó thúc đẩy “độc thoại” nhiều hơn “đối thoại,” tạo ra những diễn văn hoa mỹ nhưng vô hiệu.
So sánh với thực trạng “viết hộ” của AI
Ngày nay, khi người dùng để GPT-4 hay Bard soạn email, bài phát biểu… ta cũng thấy rủi ro tương tự. Mô hình chỉ lắp ghép câu chữ sao cho “nội dung” trôi chảy, “giọng điệu” hợp hoàn cảnh, nhưng không thực sự phản ánh suy nghĩ cá nhân, càng không biết ta hay người nhận muốn gì (nếu ta không nhắc kỹ).
- LLM không thể “giận” hay “vui,” tự nó không có “tâm” để ra quyết định.
- Chính người dùng phải “biến” văn bản thành trách nhiệm của mình, phải trau chuốt xem câu này sẽ gây hiểu lầm không, sẽ xúc phạm người kia không…
Nếu ta hoàn toàn “phó mặc” cho LLM, kết quả có thể gây hiệu ứng trái ngược. Giống như cách Gallet thuyết pháp về hòa bình nhưng chọc giận Picrochole.
“Ngôn từ tự động” và hiểm họa mất “tính người” trong truyền thông
“Ngôn từ tự động” (dù ở thời Phục Hưng hay thời AI) có sức mạnh giúp chúng ta tiết kiệm thời gian, “triển khai ý” nhanh chóng. Nhưng Rabelais đã cảnh báo nó có thể “làm hỏng” ngôn ngữ như một công cụ đạo đức và chính trị. Khi câu chữ trở thành món hàng được “rút ra” từ kho, thiếu chủ ý sâu sắc, thì thông điệp mất đi tính chân thành lẫn khả năng kết nối con người.
Điều Rabelais phê phán không phải là việc học hành hay thành tựu của nhân văn, mà là não trạng “tự kỷ độc thoại” – người viết mê mải thể hiện bản thân, không chừa chỗ cho người khác bày tỏ. Cái họ soạn ra mang tính trình diễn hơn là giao tiếp hai chiều.
Thời nay, AI cũng dẫn đến lo ngại tương tự: Liệu email, bài viết, diễn văn “do AI soạn” sẽ giảm dần các yếu tố cá nhân, biến cuộc đối thoại thành một loạt “trả lời mẫu”? Liệu con người có “tắt” khả năng chủ động suy nghĩ, chỉ duy trì chút vai trò “chọn prompt” và “ấn nút gửi”?
Nếu vậy, chẳng phải chúng ta đang “hợp thức hóa” một kiểu viết giống “bài tập Erasmian” – rập khuôn từ vô số văn bản cũ, với ít nhiều “sáng tạo” trong cách hoán vị câu chữ, nhưng không thật sự đặt câu hỏi và “nghe” người khác sao?
Rút ra gì cho thời đại số?
Bài học từ Rabelais cho thấy: Sự “tự động” trong sáng tạo ngôn ngữ không phải xấu. Nó giúp tăng tốc quy trình, giảm gánh nặng chi tiết. Nhưng đồng thời, nó làm ngôn từ dễ trở nên chiếu lệ, thiếu trao đổi chân thành.
Tương tự, AI là công cụ trợ giúp đắc lực, nhưng nếu ta hoàn toàn để nó “nói thay,” ta có thể rơi vào trạng thái “độc thoại tập thể” – mọi người trao đổi qua các mẫu câu soạn sẵn, khiến chất “người” trong giao tiếp suy giảm.
Một số điểm then chốt:
- Thấu hiểu “illocutionary force”: Câu chữ không chỉ có nội dung (mang ý nghĩa ngôn ngữ), mà còn có tác động xã hội. Muốn giao tiếp hiệu quả, ta phải chịu trách nhiệm với lời nói, để lời nói thật sự phát huy tác động mong muốn.
- Tránh “hallucination”: Cần tự kiểm chứng thông tin, không phụ thuộc hoàn toàn vào mô hình. Không để rơi vào tình huống “bịa có vẻ thật” rồi tạo hậu quả.
- Đặt câu hỏi, lắng nghe: Thay vì chỉ hùng biện, chúng ta nên học cách tương tác. Đây là “chiếc chìa khóa” mà Gallet đã bỏ qua khi thuyết phục Picrochole.
- Phân biệt giữa “tập mẫu” và “tương tác thực”: Tạo văn bản dựa trên thói quen, từ vựng cũ là tốt, nhưng không thể thay thế việc suy nghĩ cho bối cảnh mới, con người mới.
Tóm lại
Qua câu chuyện về Nosoponus thời Erasmus và bi kịch giao tiếp trong Gargantua của Rabelais, ta thấy viết tự động có lịch sử lâu đời, không riêng gì thời trí tuệ nhân tạo. Cốt lõi vẫn là: ngôn từ chỉ trở nên hữu ích và có sức thuyết phục khi được phát ra trong đối thoại chân thành, biết lắng nghe và chia sẻ. Trong kỷ nguyên AI, đây vẫn là bài học quý giá để gìn giữ giá trị của giao tiếp người – người.