Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
理解相關性:數據驅動決策的實用指南
為什麼相關性在實際市場中很重要
在深入公式之前,先考慮為什麼投資者會關心相關性。當兩個資產的變動具有可預測的共同趨勢時,你可以構建更能抵禦下跌的投資組合。當它們朝相反方向移動時,將它們結合可以降低整體風險。這就是理解變數之間關聯性的力量——這不僅僅是學術問題,而是與金錢相關。
基礎知識:相關性到底衡量什麼
相關係數是一個單一指標,用來捕捉兩個數據流的同步緊密程度。它的值始終介於 -1 和 1 之間。接近 1 表示它們一起上升和下降。接近 -1 表示它們呈反向運動。大約 0 表示幾乎沒有線性關聯。這個簡單的數字能將雜亂的散點圖轉化為你可以採取行動的資訊。
其美妙之處在於普遍適用:無論你是在研究溫度與冰淇淋銷售,還是資產價格變動,-1 到 1 的尺度都讓你可以比較完全不同的情境。這是一種描述關係強度的共同語言。
選擇合適的相關性測量方法
並非所有的相關性測量方法都適用於每種情況。選擇取決於你的數據類型。
皮爾森相關係數適用於兩個變數都是連續型的——也就是它們可以取範圍內的任何值,例如價格變動或回報率。它衡量兩個連續變數是否沿著一條直線緊密相關。
斯皮爾曼和肯德爾則是基於排名的替代方法。當數據是序數型(排名但不一定等距),或當關係呈曲線而非直線時,建議使用這些方法。在許多情況下,它們比皮爾森更能處理雜亂的現實數據。
這個區分很重要:類別型變數與連續型變數需要不同的處理方式。像「風險等級:低/中/高」或「市場狀態:牛市/熊市」(這類類別型變數),需要用不同的工具——例如列聯表或Cramér’s V,而非皮爾森。連續型變數(價格、成交量、時間)則是皮爾森的理想範圍。
對於結合類別型與連續型數據的情況,可能需要專門的技術或先將其中一個轉換成另一種形式。
了解尺度:數字代表什麼
以下範圍提供大致指引,雖然實際情況總是要看上下文:
負值的解釋相同:-0.7 表示強烈的反向運動。
為什麼要考慮上下文?粒子物理學要求相關性接近 ±1 才能認為是真實的關聯。社會科學則接受較弱的相關性,因為人類行為本身就充滿噪聲。在市場中,什麼算是「有意義的」相關性,取決於你的策略和時間範圍。
相關性是如何計算的 (運作機制)
皮爾森公式在概念上很簡單:將協方差除以標準差的乘積。