Piala Dunia 2026 · Logik Pengiraan Kebarangkalian | Prinsip Model | Sumber Data | Langkah Pengiraan | Pengesahan

🎲 Piala Dunia 2026 · Logik Pengiraan Kebarangkalian

Prinsip Model | Sumber Data & Ciri | Langkah Pengiraan | Pengesahan & Penentukuran

📐 Enjin Kebarangkalian v2.4 · Pembelajaran Ensembel Dalam · Ditentukur untuk Peringkat Kalah Mati 2026

🧠 Prinsip Model · Dari Data ke Kebarangkalian

Asas Regresi Logistik + Ensembel Dalam
🎯 Sasaran Ramalan Teras

Model mengeluarkan tiga set kebarangkalian teras:

  • 1. Kebarangkalian Menang/Seri/Kalah peringkat perlawanan (perspektif pasukan rumah)
  • 2. Taburan jumlah gol (0–7+ gol)
  • 3. Kebarangkalian mara pasukan (peringkat kumpulan → juara)
P(keputusan) = σ[ f_ensemble(vektor ciri) ]
σ ialah fungsi softmax; f_ensemble ialah output model ensembel dalam
🔢 Asas Kebarangkalian

• Rangka kerja Bayesian untuk kemas kini dinamik: posterior ∝ kemungkinan × prior

• Selepas setiap perlawanan, parameter model dikemas kini (pembelajaran dalam talian)

• Simulasi Monte Carlo: 10,000 pensampelan laluan untuk kebarangkalian mara

Masa tambahan / sepakan penalti dimodelkan secara berasingan (berdasarkan data sejarah Piala Dunia)
📌 Semua output kebarangkalian disertakan dengan selang keyakinan 90% untuk mengelak keyakinan berlebihan.

📊 Sumber Data & Ciri · Sistem Pembolehubah Input

12 Kategori Ciri
📡 Sumber Data Mentah
  • • Aliran acara perlawanan rasmi FIFA (25 fps)
  • • Data penjejakan optik (koordinat pemain, jarak diliputi)
  • • Pangkalan data sejarah Opta (Perlawanan A Antarabangsa dari 2000)
  • • Data odds: purata pembukaan garis dari Pinnacle, Bet365, William Hill
  • • Maklumat kecederaan/larangan (dikumpul masa nyata & disahkan secara manual)
🧬 Komposisi Vektor Ciri (120+ dimensi)
  • • Kekuatan pasukan: Penarafan ELO / perbezaan xG 10 perlawanan terakhir / sentuhan sepertiga akhir
  • • Bentuk terkini: mata berbobot dari 5 perlawanan terakhir (pengecilan eksponen)
  • • Metrik serangan/pertahanan: purata xG, xGA, penukaran percubaan, kejayaan tekanan tinggi
  • • Faktor rumah/tandang/neutral + pekali keletihan perjalanan
  • • Pertemuan sejarah: trend perbezaan gol dalam 5 pertemuan terakhir
  • • Gaya pengadil: purata kad / kecenderungan pelanggaran
  • • Cuaca & altitud (diaktifkan semasa peringkat kalah mati)
Ciri dinormalisasi dan dikurangkan PCA (mengekalkan 95% varians)
⚡ Kekerapan kemas kini ciri: peringkat pasukan setiap hari; peringkat perlawanan dikunci 2 jam sebelum sepak mula.

📐 Langkah Pengiraan · Dari Data Mentah ke Kebarangkalian Akhir

Saluran Paip Hujung-ke-Hujung
⚙️ Logik Langkah Demi Langkah
  1. Pengumpulan & Pembersihan Data: Mengambil data pelbagai sumber, buang outlier, imputasi nilai hilang (Penapisan Kalman / KNN).
  2. Kejuruteraan Ciri: Kira metrik terbitan (ELO, xG, PPDA, dll.); statistik tetingkap bergerak (5/10 perlawanan).
  3. Ramalan Perlawanan: Salurkan vektor ciri ke dalam model ensembel dalam; output kebarangkalian Menang/Seri/Kalah dan taburan gol.
  4. Simulasi Monte Carlo: Berdasarkan kedudukan kumpulan semasa dan jadual baki, simulasi 10,000 laluan kejohanan penuh; agregat kebarangkalian mara.
  5. Pasca-Penentukuran: Guna Regresi Isotonic untuk menentukur kebarangkalian mentah, menghapuskan bias sistemik.
  6. Output & Visualisasi: Hasilkan carta kebarangkalian, pokok mara, dan penafian risiko.
Contoh kebarangkalian perlawanan tunggal:
logit(P_rumah) = β0 + β1·ΔELO + β2·perbezaan_bentuk + β3·kelebihan_rumah + β4·faktor_kecederaan
P_rumah = 1 / (1 + e^{-logit})
Peringkat kalah mati menambah "faktor tekanan perlawanan besar" (berdasarkan pengalaman kejohanan pemain)
🕒 Keseluruhan saluran paip berjalan secara automatik setiap hari jam 3:00 pagi UTC untuk memastikan data segar.

✅ Pengesahan & Penentukuran · Memastikan Kebolehpercayaan Kebarangkalian

Ujian Belakang / Lengkung Penentukuran / Mekanisme Kemas Kini
📉 Prestasi Ujian Belakang Sejarah

• Set ujian: kesemua 128 perlawanan Piala Dunia 2018 & 2022

• Ketepatan Menang/Seri/Kalah: 58.7% (vs. model odds asas 52.1%)

• MAE (Ralat Mutlak Purata) jumlah gol: 1.12 gol

• Liputan separuh akhir (ramalan pra-peringkat kumpulan): 74% (betul mengenal pasti 3 daripada 4)

Ujian belakang menggunakan tetingkap masa bergerak untuk mengelak bias pandangan ke hadapan.
🔄 Mekanisme Penentukuran Masa Nyata

• Regresi Isotonic: selepas setiap pusingan peringkat kumpulan, tentukuran taburan kebarangkalian untuk menyelaraskan kebarangkalian ramalan dengan kekerapan diperhatikan.

• Pelicinan Bayesian: mengecutkan nilai ekstrem untuk peristiwa sampel kecil (cth., sepakan penalti) menggunakan maklumat prior.

• Manusia-dalam-gelung: apabila percanggahan model-odds melebihi 10%, penganalisis menyemak kes tersebut.

Lengkung penentukuran (kebolehpercayaan) tersedia dalam bahagian "Dokumentasi Model".
⚠️ Sifat Kebarangkalian & Penafian

Kebarangkalian ≠ Kepastian. Perlawanan bola sepak mengandungi peristiwa rawak yang tidak dapat diramal (kesilapan pengadil, kad merah, kehebatan penjaga gol, dll.). Output model adalah kebarangkalian bersyarat berdasarkan data sejarah dan corak statistik; ia tidak menjamin hasil masa depan. Sentiasa anggap ramalan kebarangkalian sebagai hiburan dan buat keputusan yang rasional.

📊 Model menentukur secara automatik setiap hari; penentukuran terakhir: 16 Julai 2026 03:00 UTC.