VÒNG LẶP PHẢN THÂN MỚI CỦA THỜI ĐẠI

Hello ae,

Tuần trước tôi viết bài "AI có thực sự biết?".
Bài đó nói về 2 chiều của kiến thức, chỉ ra rằng AI hiện tại chỉ có chiều "ý nghĩa", không có chiều "đối tượng". Nên nó chưa thể tạo ra được cái "biết" chứa skin in the game như con người.
Nhưng câu chuyện thực sự không dừng ở đó, mọi thứ còn nguy hiểm hơn nhiều. Nên hôm nay, tôi muốn nối tiếp cái suy nghĩ mà tuần trước tôi cố tình cắt chưa nói. 

Vì nó không phải về AI. 
Nó là về cái thực tế đã/đang/sẽ xảy ra giữa AI và loài người, ở quy mô mà chính những người làm ra AI cũng không kiểm soát được. 
Bài này sẽ hơi bay, nên ae nào thích cho não phiêu lưu thì xin mời đi tiếp nhé.

Ae nào đọc blog tôi lâu chắc đều cảm được một cơ chế mà George Soros gọi là "phản thân" (reflexivity), đúng không?
Đại khái cơ chế đó là trong thị trường, niềm tin của người tham gia không chỉ phản ánh thực tại. Nó tạo ra thực tại.

Nếu có đủ người tin giá tăng => họ sẽ mua => khiến giá tăng thật => niềm tin được xác nhận => kéo thêm người vào=> giá tăng tiếp...
Đến lúc bong bóng vỡ thì ngược lại, niềm tin sụp => dòng tiền rút => giá rơi => niềm tin sụp tiếp => dòng tiền rút tiếp...

Đây không phải là lỗi của thị trường mà là một cấu trúc cơ bản. Bất cứ hệ nào mà người tham gia "quan sát chính hệ đó để ra quyết định" thì hệ đó sẽ có phản thân.

Ngôn ngữ cũng là một hệ như vậy.
Ngôn ngữ không chỉ là một bản đồ mô tả cách con người suy nghĩ. Nó cũng trực tiếp định hình cách con người nghĩ.
Framework nào ae được nghe nhiều, ae sẽ bắt đầu suy nghĩ thông qua frame đó.
Giống như tôi, frame của tôi được định hình bởi Taleb, thông qua Thiên Nga Đen, nên mọi quá trình tư duy của tôi đều đi về "đuôi phân phối", nơi những sự kiện cực đoan hiếm gặp ở ngoài mô hình nằm.

Quảng cáo, chính trị, marketing,... toàn bộ ngành công nghiệp gây ảnh hưởng đều sống nhờ nguyên lý này.

-Khi một chính sách thuế được gọi là "giảm nhẹ thuế" thay vì "cắt giảm thuế", phản ứng của người dân sẽ khác đi, vì 2 từ ngữ này kích hoạt những cảm xúc khác nhau.

-Khi các công ty bắt đầu gọi nhân viên là "nguồn lực", thì cái tên đó mang theo một cách nhìn, rằng nguồn lực là thứ được tối ưu hóa, phân bổ, thay thế. 
Vài thập kỷ sau, cách lãnh đạo ra quyết định về con người trong tổ chức đã hoàn toàn khác so với trước, vì câu đó đã thẩm thấu vào tư duy, và tư duy sẽ quyết định hành động.

Đây chính là quá trình phản thân của ngôn ngữ. 
Cái ae gọi tên định hình cái ae thấy => Cái ae thấy định hình cái ae làm => Cái ae làm quay lại định hình cái ae gọi tên.

Vòng lặp này đã có từ khi loài người biết nói. Chậm. Phân tán. Không ai kiểm soát được toàn bộ. 
Cho đến gần đây khi LLM xuất hiện, nó đã được đẩy nhanh với tốc độ chưa từng có.
Và đây mới chính là cái nguy hiểm chứ không phải câu chuyện "AI thống trị loài người."

Điều này chắc nhiều ae cũng đã nghĩ tới rồi.
Chúng ta đều biết hôm nay đang có hàng tỉ người dùng AI mỗi ngày. 
Một câu hỏi đi qua nó, tạo ra một câu trả lời đi ra. Câu trả lời đó đi vào email, vào báo cáo, vào status, vào blog, vào internet. 
Sau đó nó được search, được cào về, được dùng làm dữ liệu huấn luyện cho thế hệ LLM tiếp theo.

LLM đang định hình ngôn ngữ => ngôn ngữ định hình cách con người nghĩ => con người viết ra câu chữ chứa cách nghĩ đó => câu chữ lại được dùng huấn luyện LLM => LLM thế hệ sau định hình ngôn ngữ thêm một bước nữa.

Năm 2024, một nhóm nghiên cứu ở Oxford công bố nghiên cứu về "model collapse", tức là hiện tượng LLM huấn luyện trên output của chính nó sẽ bị suy giảm qua các thế hệ. 
Đến thế hệ thứ 5-6, model bắt đầu sinh ra những câu vô nghĩa, lặp đi lặp lại.
Đây chính là thứ rất nguy hiểm, vì khi chúng ta lấy mẫu từ chính phân phối của chúng ta để tạo dữ liệu, thì trung bình sẽ càng ngày càng dày lên => đa dạng và outlier chết => làm mất đi đuôi của phân phối. 

Kịch bản này đã được cảnh báo. Nhưng nó sẽ không ngăn được cấu trúc này chạy. 
Vì internet càng ngày sẽ càng tràn ngập output của AI. 
Để gán được nhãn sạch "đây là người viết, đây là AI viết" cho thế hệ training tiếp theo sẽ càng ngày càng trở nên khó khăn.

Bài trước tôi cũng đã nói về cơ chế học hiện tại của LLM, nó sử dụng chính phản hồi của người dùng để cải thiện câu trả lời (RLHF).
Khi đi qua cơ chế này đủ nhiều, đầu ra của LLM sẽ bị kéo về hướng trung bình của loài người.
Khi ae đọc câu trả lời đó, ae sẽ dùng nó để ra quyết định.
Và quyết định đó sẽ kéo ae về trung bình.
Đến một lúc nào đó, một phần thực tại của hàng nghìn người sẽ được định hình bởi một câu trả lời trung bình, kéo tất cả dậm chân tại chỗ mà không ai trong số họ nhìn thấy.

Năm 2035, khi đứa trẻ lớp 5 hỏi LLM "tại sao trời xanh", câu trả lời nó nhận được sẽ là một câu đã đi qua bộ lọc trung bình của hôm nay. 
Đứa nhỏ tin nó, dùng cái hiểu đó để học tiếp => Cái hiểu đó định hình cách nó nhìn thế giới. 
=> Khi nó lớn lên, nó viết ra cái nó nghĩ =>Cái nó viết lại được dùng huấn luyện LLM tiếp theo. 
Cứ thế....

Có một ý cũ trong triết học tôi từng đọc được thế này: 
"Ngôn ngữ là thấu kính tích cực bẻ cong cách thực tại được nhìn thấy." 
Đúng. 
Đó là thấu kính thứ nhất, mà loài người đã luôn mang theo kể từ khi biết nói.
Giờ đây xuất hiện thấu kính thứ hai (LLM) đè lên thấu kính cũ, làm thực tại càng xa rời.

Mà điều tệ nhất ở đây là hai lớp kính này còn đang phản chiếu nhau.
Ae hình dung hai tấm gương đặt đối diện. 
Bỏ một vật nhỏ ở giữa, mỗi gương phản chiếu vật đó vào gương kia, gương kia phản chiếu lại, vô tận. 
=> Vật ban đầu mờ dần đi sau những lớp phản chiếu. Cuối cùng cái ae thấy không còn là vật, mà là phản chiếu của phản chiếu của phản chiếu của phản chiếu...

Đó là lý do gần đây tôi hay nhấn mạnh về skin in the game và "cái biết". 
Bởi "cái biết" là điều duy nhất kết nối được chúng ta với "vật gốc", không qua các tấm gương, trong thời đại mà AI đang lên ngôi.
Khi ae có chân tay, có mặt, có skin in the game, thì ae chịu hậu quả, và chạm được trực tiếp vào vật thật. Thì lúc đó ngôn ngữ mới làm đúng việc của nó là đặt tên cho cái ae đã thực sự thấy, không phải cho cái ae nghe người khác kể.

Mỗi lần ae chạm tay vào thực tại thông qua thực hành, ae đang gửi một mẩu thông tin gốc vào hệ, một mẩu chưa đi qua tấm gương nào. Đó là mẩu thông tin mà vòng lặp AI-ngôn ngữ không tạo ra được.

Và tôi nghĩ, nó cũng là cách tốt nhất, để ae có thể trở nên khác biệt giữa vòng xoáy phản thân mới này.

Turtle Trading

Search This Blog

VÒNG LẶP PHẢN THÂN MỚI CỦA THỜI ĐẠI

Comments

Post a Comment