Blog Lịch Sử

Internet sẽ thế nào khi AI dần thay thế các liên kết (links)

Khi AI chatbot trở nên phổ biến, cách tiếp cận “tổng hợp không nguồn” đặt ra thách thức: liệu toàn bộ “tấm thảm liên kết” có thể phai tàn?

Nguồn: Tạp chí Aeon

Trong những năm cuối thập niên 1990, Google vươn lên chiếm ưu thế vượt trội so với các công cụ tìm kiếm khác nhờ một phát kiến phi thường: thuật toán PageRank do Sergey Brin và Larry Page phát triển. Ý tưởng này cho thấy tầm quan trọng của các liên kết (links) trong việc xếp hạng kết quả, thay vì chỉ đếm tần suất từ khóa xuất hiện trên trang. Giờ đây, trước sự phát triển của các chatbot trí tuệ nhân tạo (AI), mô hình dựa trên liên kết đang đứng trước nguy cơ bị thay thế bởi những “tổng hợp không nguồn” (source-less summaries).

Câu hỏi đặt ra: liên kết đã hình thành và gắn liền với lịch sử tri thức như thế nào, và điều gì sẽ xảy ra khi liên kết dần bị AI thay thế?

PageRank: Khi liên kết là thước đo uy tín

Thuật toán PageRank đánh dấu một cột mốc: “Một trang web trở nên quan trọng nếu nó được các trang quan trọng khác trỏ liên kết đến.” Trước đây, các công cụ tìm kiếm như AltaVista, Yahoo hay Ask Jeeves (vốn chủ yếu đối sánh tần suất từ khóa) không thể phân biệt chất lượng, uy tín của nội dung. Google thay đổi điều đó khi nhận ra mạng lưới web là một môi trường “xã hội”, nơi những liên kết phản ánh uy tín của trang.

Hóa ra, tư tưởng “một người có uy tín nếu được những người uy tín ủng hộ” không mới. Năm 1949, nhà xã hội học John R Seeley đã nói như vậy về uy tín cá nhân. Năm 1976, Gabriel Pinski và Francis Narin áp dụng ý tưởng tương tự vào ngành thư mục (bibliometrics) với câu nói nổi tiếng: “Một tạp chí có ảnh hưởng nếu nó được những tạp chí có ảnh hưởng khác trích dẫn.” Điều mới của PageRank là đưa logic này lên toàn bộ không gian web.

Tại sao các liên kết (hyperlinks) lại phản ánh mối gắn kết “xã hội”? Bởi lẽ, ban đầu chúng được tạo ra để hiển thị cách các nhà nghiên cứu kết nối ý tưởng từ các nguồn khác nhau. Tim Berners-Lee, cha đẻ của World Wide Web, từng trình bày giao thức hypertext như công cụ mô phỏng việc con người di chuyển từ ý tưởng này sang ý tưởng khác. Câu slogan “Stand on the shoulders of giants” (Hãy đứng trên vai những người khổng lồ) của Google Scholar cũng ngụ ý rằng sáng tạo đến từ tái kết nối, tái sử dụng những gì người đi trước để lại.

Tuy nhiên, hiện nay Google và nhiều trang khác đang có xu hướng rời xa các liên kết và chuyển sang các chatbot AI – vốn tạo ra câu trả lời tóm lược mà không chỉ về nguồn cụ thể. Chúng ta đang sống trong thời điểm mà “liên kết” – cốt lõi tạo nên tấm thảm ý tưởng khổng lồ trên web – có nguy cơ dần biến mất.

Từ thế kỷ 17 đến kỷ nguyên Hypertext

Để hiểu vì sao liên kết trở thành công cụ biểu đạt thông tin, ta cần quay lại thế kỷ 17, thời Thomas Hobbes và John Locke tranh luận về cách ý tưởng nối tiếp nhau trong tâm trí. Locke và Hume tin rằng mọi tri thức đều đến từ trải nghiệm; tâm trí nhận dữ liệu từ thế giới, rồi dùng lý trí và tưởng tượng để sắp xếp. David Hume mô tả ba dạng liên kết ý tưởng: giống nhau (resemblance), gần kề (contiguity), và nhân quả (cause and effect).

Họ thường so sánh tâm trí với các phương tiện truyền thông đương thời, như Locke gọi tâm trí là “tấm bảng trắng” (blank tablet), “buồng tủ” (cabinet) hay “camera obscura”, còn Hume thì mượn hình ảnh ngành in ấn để nói về “ấn tượng” (impression) và “ý tưởng” (idea). Đồng thời, những nhà tư tưởng này cũng để ý cách vật liệu in ấn xung quanh họ thể hiện các mối liên hệ. John Locke trong cuốn A New Method of Making Common-Place-Books (1706) gợi ý thêm mục lục theo chủ đề (index) để người đọc có thể “nhảy” nhanh giữa các ý tưởng liên quan.

Khi in ấn bùng nổ vào thế kỷ 18, những mô hình văn bản phi tuyến tính (nonlinear) cũng phát triển, chẳng hạn như hệ thống chú giải phức tạp, mục lục chéo, và đặc biệt là các chú thích dưới trang (footnotes). Một ví dụ tiêu biểu là trường hợp của Alexander Pope với tác phẩm châm biếm The Dunciad (1728). Pope viết một bài thơ, nhưng liên tục thêm các chú thích, sửa lại bản in, khiến trang in có khi chỉ còn vài dòng thơ, còn phía dưới là biển ghi chú và đối đáp với người phê bình. Kết quả là một “hình thức siêu văn bản” (hypertextual) theo kiểu thủ công: người đọc phải nhảy qua nhảy lại giữa những dòng thơ và phần giải thích, chú giải.

Khi in ấn dẫn tới “mê cung” chú thích

Pope phát hiện ra một vấn đề cơ bản: in ấn cho phép truyền thông tin xa hơn, nhưng cũng khiến ẩn ý trở nên khó hiểu với người ở cách xa trung tâm (London). Nhà văn Jonathan Swift từng nói với Pope: “Đi ra khỏi London tầm 20 dặm, không ai hiểu các ám hiệu, ký tự viết tắt hay sự kiện của thành phố nữa.” In ấn buộc người viết phải liên tục giải thích rõ ràng hơn, dẫn đến vô số chú thích và chỉ dẫn.

Trong The Dunciad, Pope chế nhạo việc thông tin bị “sao chép” và “tái bản” không ngừng, làm biến dạng nội dung gốc. Ông dùng hình ảnh các dòng sông quanh co, tiếng vọng, vòng xoáy nước để tượng trưng cho cách ý tưởng cũ bị tái bản, trích dẫn sai, trở nên “mờ nhạt” dần so với nguyên tác.

Những nỗ lực tương tự cũng xuất hiện ở các công trình lớn khác, chẳng hạn bộ Encyclopédie (1751-72) của Pháp với các tham chiếu chéo (cross-references) và sơ đồ khắc minh họa, kế thừa từ Cyclopaedia (1728) của Ephraim Chambers. Ý đồ chung: sắp xếp tri thức thành mạng lưới liên kết để người đọc có thể đi theo bất cứ hướng nào mà họ thấy hợp lý.

ý tưởng “liên kết” trong tâm trí

Sang thế kỷ 19, James Mill và John Stuart Mill mở rộng lý thuyết liên tưởng, để rồi Sigmund Freud vận dụng khái niệm “liên tưởng tự do” (free association) trong phân tâm học. Freud ví nhà phân tích như chiếc điện thoại, giải mã những rung động (dòng ý thức) của bệnh nhân. Ý tưởng này nối tiếp quan điểm trước đó: tâm trí hoạt động bằng cách liên kết ý tưởng, và nếu ghi lại được mọi đường liên kết ấy, ta sẽ hiểu sâu cách suy nghĩ con người.

Vào giữa thế kỷ 20, khi máy tính dần xuất hiện, Vannevar Bush – một nhà khoa học tại MIT – đề xuất mô hình “memex” (memory extender) vào năm 1945. Ông tưởng tượng một thiết bị microfilm có thể tạo “đường mòn liên tưởng” (associative trails) giữa những đoạn văn, hình ảnh. Người dùng gắn mã vào các đoạn để “nhảy” qua lại, giống như ý tưởng “đọc” dòng suy nghĩ. Ted Nelson, năm 1965, lấy cảm hứng từ Bush để tạo khái niệm “hypertext” – một dạng văn bản phi tuyến tính, liên kết đa chiều mà giấy in không thể thể hiện.

Nelson tin rằng các liên kết (links) chính là cách để biểu đạt sự kết nối của trí tuệ: từ một ý, ta có thể rẽ ra năm, sáu ý khác. Ông muốn xây dựng “dự án Xanadu”, một trình duyệt cho phép người đọc xem đồng thời văn bản trích dẫn và nguyên bản. Dù dự án đó không thành công, tầm nhìn “siêu văn bản” (hypertext) của Nelson góp phần quan trọng định hình Web trong thập niên 1990.

Web như một mạng lưới liên kết khổng lồ

Đáng chú ý, hypertext không bắt đầu từ Web. Những năm 1980, phần mềm HyperCard của Apple hay Storyspace của Eastgate cho phép người dùng tạo câu chuyện phi tuyến tính (“chọn lối đi”), gắn kết các đoạn văn theo nhánh tùy ý. Michael Joyce với tác phẩm afternoon, a story (1987) được xem là tiểu thuyết hypertext đầu tiên. Chúng nổi tiếng vào cuối thập niên 1990 nhưng không phổ biến lâu dài.

Tuy vậy, các ý tưởng và công cụ hypertext đã chuẩn bị nền móng cho World Wide Web, giúp chúng ta liên kết giữa các trang trên toàn cầu. Gần đây, nhiều ứng dụng ghi chú cũng tích hợp hypertext. Tinderbox của Eastgate, ban đầu phục vụ cho sáng tác hypertext, giờ trở thành công cụ sắp xếp ý tưởng. Ở tầm rộng hơn, Internet và Web đã kích thích con người “xây” vô số liên kết, tạo nên mạng lưới ngày càng phức tạp.

Nhưng chính công việc “xây liên kết” ấy giờ đang đối mặt sự cạnh tranh từ AI chatbot. AI tổng hợp, tóm tắt, “tiêu hóa” nội dung từ rất nhiều trang, rồi đưa ra câu trả lời đơn nhất. Thay vì dò theo các liên kết, người dùng giờ hỏi AI và nhận câu trả lời gói gọn.

Chatbot AI: Khi các liên kết bị “làm phẳng”

Trong giới phê bình văn học, Cleanth Brooks từng phê phán “thói dị giáo của việc tóm lược” (the heresy of paraphrase). Ông nói, thơ ca không thể được diễn đạt bằng “nội dung” giản lược, vì giá trị của thơ nằm ở sự hài hòa, căng thẳng, tương phản giữa ngôn từ. Tương tự, các nhà lý thuyết hypertext như Ted Nelson hay Vannevar Bush muốn bảo tồn “mạch” liên tưởng tự nhiên, nơi những liên kết phức tạp thể hiện cách con người ghép các ý tưởng với nhau.

Nếu ví Pope và The Dunciad như một ví dụ, ta thấy ông đẩy ngôn từ đi khắp nơi: thơ, ghi chú, chú thích chú thích… khiến người đọc trôi dạt giữa các “đường dẫn”. Mô hình hypertext ngày nay cũng vậy: để nghiên cứu một đề tài trên Web, ta gõ từ khóa, duyệt danh sách trang, mở thêm liên kết liên quan, rồi phải giải quyết mâu thuẫn, xác thực nguồn. Quá trình này chính là “lần theo” chuỗi liên tưởng có sẵn của tác giả (hoặc nhiều tác giả).

Vannevar Bush từng ví dụ về người quan tâm đến cây cung Thổ Nhĩ Kỳ so với cung Anh trong thời Thập Tự Chinh. Ông tìm các sách, bài báo liên quan trên memex, gắn chú thích, liên kết những đoạn có giá trị. Mạng lưới web ra đời đã biến ý tưởng này thành hiện thực: ta tự xây “đường mòn” tri thức qua các liên kết.

Nhưng chatbot AI thì khác. Nó lấy nội dung từ muôn nơi, “nấu chảy” thành câu trả lời tổng quát, thường không dẫn rõ nguồn. Một số nền tảng AI (như Perplexity, Arc Search) cố gắng ghi chú nguồn, nhưng đó là giải pháp nửa vời, vì cốt lõi AI vẫn là tóm lược, trộn lẫn thông tin.

Để “hấp thụ” khối nội dung khổng lồ, AI phải dựa vào văn bản do con người tạo ra. Tuy nhiên, nếu người dùng chỉ đọc câu trả lời của AI, ai sẽ còn truy cập trang gốc? Ngay cả Google cũng đang tiến về giao diện “AI Overviews” – kết quả là một đoạn văn tóm tắt thay vì danh sách liên kết. Giả sử AI quét dữ liệu từ web, nhưng rồi lại ngăn người dùng click vào trang nguồn, chúng ta sẽ ở tình thế tiến thoái lưỡng nan: AI cần dữ liệu để hoạt động, nhưng việc “tổng hợp không liên kết” lại làm mai một hệ sinh thái web.

Đọc thêm:

Khi Web “mơ” về tương lai không còn liên kết?

Đạo diễn Werner Herzog, trong phim tài liệu Lo and Behold (2016), phỏng vấn Ted Nelson cùng nhiều chuyên gia để hỏi: “Internet có mơ về chính nó không?” Câu hỏi gợi ý rằng một mạng lưới có thể tự vận động, vượt ngoài ý muốn ban đầu. Như với Pope, công nghệ in ấn tạo ra bùng nổ sách rẻ tiền, gây “nhiễu loạn” thông tin. Internet cũng tạo ra luồng liên kết khổng lồ. Giờ, AI xuất hiện có thể làm thay đổi bản chất ấy.

PageRank của Google từng tạo nên bước ngoặt vì xem trọng liên kết. Nhưng tại hội nghị Google I/O ngày 14/5/2024, CEO Sundar Pichai thông báo sẽ dần chuyển sang chế độ AI tóm tắt (AI Overviews). Trong đó, Liz Reid (Trưởng bộ phận Tìm kiếm) tuyên bố Google sẽ “làm công việc Google thay bạn” – nghĩa là người dùng không cần truy cập hàng loạt trang nữa. Nghịch lý thay, GPT hay Gemini vẫn cần dữ liệu từ web để huấn luyện, nhưng tương lai chatbot có thể khiến người dùng không ghé trang nguồn, dần làm cạn kiệt hệ sinh thái dữ liệu.

Vannevar Bush xây dựng memex không chỉ để ghi nhớ, mà còn để người dùng sau quan sát chuỗi liên tưởng của người đi trước. Web ngày nay là kho bộ nhớ tập thể lớn nhất mà loài người từng có, cả ở nội dung trang lẫn các liên kết. Song nếu người dùng chỉ “ở yên” trong giao diện chatbot, ai sẽ cập nhật, mở rộng, hay xây liên kết mới?

Câu chuyện của Pope gợi một bài học: in ấn có vẻ tạo sự đồng nhất, nhưng ông vẫn xoay xở để thể hiện đủ mọi góc nhìn, lời bình, nhạo báng ngay trong cùng một cuốn sách. Qua đó, Pope tái hiện “cơn ồn ào” của London thế kỷ 18. Internet, và nhất là web, cũng có thể đổi thay, thích ứng, biến tấu theo hướng ta chưa ngờ.

Tóm lại

Liên kết (links) đóng vai trò cốt lõi trong việc xây dựng mạng tri thức tập thể trên web. Khi AI chatbot trở nên phổ biến, cách tiếp cận “tổng hợp không nguồn” đặt ra thách thức: liệu toàn bộ “tấm thảm liên kết” có thể phai tàn? Thế nhưng, như lịch sử in ấn và thơ trào phúng của Pope cho thấy, sự thay đổi công nghệ thường dẫn đến những hình thức thể hiện mới mẻ. Có lẽ web sẽ tìm cách tồn tại, chuyển hóa, và chúng ta – những người dùng, người sáng tạo – sẽ định hình tương lai đó bằng chính mong muốn tương tác, tìm hiểu và kết nối không ngừng nghỉ.

5/5 - (1 vote)

Chúng tôi không có quảng cáo gây phiền nhiễu. Không bán dữ liệu. Không giật tít.
Thay vào đó, chúng tôi có:

  • Những bài viết chuyên sâu, dễ đọc
  • Tài liệu chọn lọc, minh bạch nguồn gốc
  • Niềm đam mê bất tận với sự thật lịch sử
DONATE

Toàn bộ tiền donate sẽ được dùng để:

  • Nghiên cứu – Mua tài liệu, thuê dịch giả, kỹ thuật viên.
  • Duy trì máy chủ và bảo mật website
  • Mở rộng nội dung – Thêm nhiều chủ đề, bản đồ, minh họa

THEO DÕI BLOG LỊCH SỬ

ĐỌC THÊM