PHÂN PHỐI XÁC SUẤT, EXTREMISTAN VÀ TREND-FOLLOWING

Hêlô ae,
Lâu rồi không viết về Quant, nên hôm nay chúng ta quay lại chút cho đỡ lụt nghề nhỉ.
Chủ đề này thì cũng xoắn não như triết học thôi,
nhưng được cái liên quan trực tiếp đến miếng ăn, nên chắc nhiều ae chịu khó đọc hơn, hehe....
Bài này tôi viết dành cho những ae suốt ngày hỏi:
“Anh Tiến ơi sao e thấy trend following lúc chạy rõ ngon như máy in tiền, lúc thì phế vật vậy?”
“Backtest em ngon lắm mà live thì sml a ạ?”
Những câu hỏi này mà ae trả lời được đúng bản chất thì chắc chắn lên level.
Vì nó đụng đến một chân lý mà đa số trader (kể cả nhiều quant trader) không hiểu:
"Thị trường có nhiều loại ngẫu nhiên khác nhau.
Và xu hướng chỉ xuất hiện trong một loại ngẫu nhiên đặc biệt."
Muốn trade ra tiền, ae phải hiểu về mấy loại ngẫu nhiên đó.
Nhiều ae trade được một thời gian (lỗ nhiều quá nên nản, chuẩn bị bỏ trade) thường sẽ nghĩ:
“Thị trường là random nên không thể làm gì được.”
Vế thứ nhất của câu này đúng, nhưng vế thứ hai thì sai.
Thị trường đúng là ngẫu nhiên,
nhưng không phải ngẫu nhiên kiểu thuần túy như tung xúc xắc,
mà là ngẫu nhiên giống kiểu…
người yêu/vợ của ae:
-đang vui tự nhiên xị mặt
-hôm qua hờn, nay lại dễ thương
-lúc nhẹ nhàng, lúc cà khịa không lý do
Tức là, “ngẫu nhiên” nhưng có “trạng thái”, và các trạng thái đó thay đổi liên tục.
Ví dụ:
-lúc thì nó random kiểu đi ngang chán đời
-lúc thì nó random kiểu chuẩn Gaussian tử tế
-lúc thì nó random kiểu FOMO tập thể
-lúc thì nó random kiểu bóp thanh khoản
=>Mỗi loại random này sẽ cho ae một loại phân phối xác suất khác nhau.
Tôi từng viết trong Giao dịch sự bất định, và nhiều bài viết trước đây rằng:
"Phân phối tổng thể của thị trường là đuôi béo."
Điều đó đúng 100%.
Và đó là "phân phối tổng thể không điều kiện."
Chúng ta đã gom toàn bộ 100 năm dữ liệu, với tất cả các loại trạng thái (kiểu random) trend + sideway, hoảng loạn + bình yên, pump + dump, thanh khoản cao + thanh khoản thấp....
rồi bỏ hết vào 1 biểu đồ.
Với nhiều ae từng đọc sách của tôi, việc biết phân phối tổng thể là đuôi béo này giúp mở mang đầu óc và đẹp thật,
nhưng lại không giúp họ được gì nhiều.
Bởi không phải lúc nào thị trường cũng rơi vào phần đuôi béo để họ kiếm ăn.
Phần lớn thời gian nó sẽ ở trạng thái Mediocristan,
làm ae chạy trend-folowing (hay bất kỳ hệ thống nào cũng thế) bị SL/drawdown sml...
=>Đây chính là lý do chính mà nhiều ae nghi ngờ nhân sinh và bỏ cuộc giữa chừng khi chạy live.
Muốn trade đúng, thì để tôi thông não cho ae về phân phối có/không có điều kiện trước.
Nghe tên thì có vẻ học thuật ghê lắm, nhưng thực ra nó dễ thôi.
-"Phân phối KHÔNG điều kiện" (giống như tổng thể đuôi béo phía trên):
sẽ = việc ae gom toàn bộ dữ liệu => quăng vào 1 đống => rút ra kết luận tổng thể.
Giống kiểu ae nhìn tất cả phụ nữ trên đời rồi kết luận:
“Phụ nữ khó hiểu vãi.”
-Còn "phân phối CÓ điều kiện":
sẽ = việc ae chỉ nhìn dữ liệu khi "một điều kiện cụ thể nào đó xảy ra."
Giống như ae chỉ soi phụ nữ lúc đang vui, hoặc đang đói, hoặc đang đến kỳ…
Lúc đó tính cách, phản ứng, “phân phối hành vi” của họ khác hoàn toàn.
Khó hiểu quá hả?
Để tôi cho ae một ví dụ chuẩn thống kê hơn.
Giả sử ae hỏi:
“Trong 24h của một ngày, lúc nào câu cá được nhiều nhất?”
Muốn trả lời, thì ae phải gom tất cả dữ liệu trong ngày, tổng hợp lại rồi thống kê đúng không?
Đó chính là phân phối tổng thể không điều kiện.
Kết quả sẽ kiểu như:
12h nhiều cá, 8h ít cá, 3h sáng không có con mẹ gì.
Nhưng thực tế, ai đi câu cũng biết một điều rất cơ bản:
-khi nước đứng => cá lười
-khi nước rút => cá đi xa
-khi nước lên => cá vào gần bờ, hoạt động mạnh, dễ ăn mồi
Vậy nên nếu tôi bảo ae:
“Ê, ngày hôm nay nước đang lên.”
Thì toàn bộ phân phối xác suất ban đầu lập tức thay đổi.
Xác suất bắt được cá trong 24h lúc này tăng vọt trên tất cả thời gian (đi bừa lúc nào cũng vẫn được cả xô).
Đó là điều quan trọng: khi thay đổi bối cảnh, ae không đổi cần câu, không đổi mồi, không đổi kỹ năng, và vẫn câu trên cái hồ đó, nhưng tỉ lệ bắt được cá trong 24h đã thay đổi.
Đấy chính là phân phối có điều kiện!
Và thị trường thì nó không khác mấy so với câu chuyện câu cá hay con gái,
nó cũng có rất nhiều trạng thái ngẫu nhiên khác nhau:
-khi vol tăng
-khi giá phá range
-khi đám đông FOMO
-khi funding lệch
-khi gần tới liquidation level
-khi tin tức kích hoạt tâm lý...
Mỗi trạng thái (bối cảnh) này sẽ cho ae một loại phân phối cụ thể.
=>Nên nếu ae biết được đúng trạng thái và gắn đúng loại phân phối, thì ae sẽ có rất nhiều máy in tiền.
Điều này giống như việc một cao thủ tán gái nhìn một cô gái và biết:
“À, hôm nay em ấy hơi nhạy cảm.”
“Hôm nay em ấy vui, dễ nói chuyện.”
“Hôm nay đừng động vào.”
Đây cũng chính là hướng đi mà nhiều ae quant tiếp cận:
dùng Hidden Markov và machine learning để gán nhãn trạng thái rồi sử dụng chiến lược phù hợp.
Nhưng vấn đề oái oăm của thực tại là thị trường không phải Markovian.
Bởi một quá trình Markov có nghĩa là:
“Tương lai chỉ phụ thuộc vào hiện tại. Quá khứ không còn ý nghĩa.”
Nếu thị trường là Markov thuần túy (như tung xúc xắc), thì giá quá khứ hoàn toàn vô nghĩa và không có các hiệu ứng tâm lý dây chuyền (feedback loops).
Nhưng thực tế là thị trường lại có đầy trí nhớ.
FOMO được nhớ. SL bị quét được nhớ.
Narrative được nhớ.
Kháng cự được nhớ, hỗ trợ được nhớ, vùng kẹp hàng được nhớ.
Đỉnh đáy cũ ảnh hưởng tới quyết định hiện tại.
Funding tác động tâm lý.
Liquidation kích nổ hành vi dây chuyền.
Media khuếch đại cảm xúc…
Tất cả những thứ này tạo ra một cái gọi là "Path Dependence",
khiến tương lai phụ thuộc con đường giá đã đi qua.
Và cái Path Dependence này sẽ làm biến đổi hình dạng phân phối tương lai liên tục, chứ không cố định như HMM giả định.
Ngay cả khi ae dùng machine learning để phân loại trạng thái, thì bản thân cái định nghĩa về “trạng thái” đó cũng sẽ thay đổi theo thời gian (non-stationarity).
Ví dụ:
Trạng thái "Sideway" của năm 2017 khác hoàn toàn trạng thái "Sideway" của năm 2024 (do thanh khoản khác, bot khác, player khác).
Vậy nên, đó là lý do, ae càng tối ưu, ae càng phân cụm.
Càng cố chia/lọc state bằng HMM và ML, thì ae càng dễ overfit vào quá khứ.
Nếu ae hiểu đúng, thì thị trường thật ra chỉ có một cơ chế (rất khó thay đổi) với 2 mode chính:
Mediocristan vs Extremistan.
Trong Mediocristan (90%-95% thời gian):
-giá biến động nhỏ
-cực nhiễu
-volume thấp
-trader không đồng pha
-mean reversion mạnh
Đây là nơi ae bị quét SL liên tục, drawdown kéo dài, tâm lý sụp đổ.
Và là nơi 80% trader chết/bỏ cuộc vì tưởng các hệ thống đều “phế”.
Trạng thái thứ 2 là Extremistan (10% thời gian nhưng tạo 90% lợi nhuận):
-có biến động lớn, theo cụm
-có feedback loops
-đám đông đồng pha
-vol nổ
-liquidation dây chuyền
-phân phối cực lệch, đuôi béo kéo dài
Đây là trạng thái mà EV (kỳ vọng) của trend-following chuyển từ âm sang dương cực mạnh.
Và cũng là nơi backtest tạo ra toàn bộ lợi nhuận.
Vậy, quay trở lại với câu hỏi ban đầu:
“Backtest thì ngon mà live thì toang”, tại sao?
Bởi vì:
-Backtest = ae dùng phân phối tổng thể.
-Live trade = ae phải đối mặt với phân phối có điều kiện.
Backtest thì ae ăn được mọi con trend suốt 20 năm, mọi cú momentum điên rồ, mọi chu kỳ bull market.
Còn khi live thì ae (chắc chắn) gặp Mediocristan liên tục.
Giá sideway vài tháng, thậm chí nhiều năm, không có trend đàng hoàng.
SL thì liên tục cắn.
Tâm lý chán nản => làm ae bỏ hệ thống trước khi trend thật sự đến.
Oái oăm nhất là mấy cái trend tử tế thường chỉ xuất hiện ngay sau lúc ae bỏ cuộc, lại còn trong rất ít thời gian.
=>Vậy nên, nếu ae không quản lý vốn, đủ tin tưởng/ kiên nhẫn vào nguyên lý của hệ thống để vượt qua được drawdown, thì ae không bao giờ chiến thắng.
Trend-following bản chất không phải trò giao dịch hướng giá.
Nó là trò "giao dịch bối cảnh",
Để đặt cược rằng:
Extremistan sẽ xuất hiện nhiều hơn mọi người tưởng.
Nếu bối cảnh sai, ae thua nhỏ (liên tục).
Nếu bối cảnh đúng, ae thắng lớn.
Chỉ đơn giản như vậy.
Thế nên, khi ae hỏi:
“Sao trend-following của e lúc được lúc không?”
“Nên làm gì khi bị drawdown không còn tin tưởng vào hệ thống?”
Tôi chỉ muốn nói một câu:
“Không phải hệ thống phế,
mà là vì ae ko đợi được thị trường bước vào đúng phân phối của nó.”

Comments