Piala Dunia 2026 · Metodologi Data | Piawaian Pengumpulan | Definisi Metrik | Rangka Kerja Statistik

📊 Piala Dunia 2026 · Metodologi Data

Piawaian Pengumpulan Data | Definisi Metrik Teras | Rangka Kerja Statistik | Kebolehpercayaan & Had

📐 Metodologi v2.4 · Mematuhi piawaian FIFA · Data terkini sehingga peringkat kalah mati

📡 Pengumpulan & Pemprosesan Data · Dari Padang ke Pangkalan Data

Suapan rasmi + penjejakan optik
🎥 Sumber Data Mentah

• Suapan perlawanan rasmi: Aliran data acara masa nyata berlesen FIFA (25 fps)

• Sistem penjejakan optik: 12 kamera berkelajuan tinggi setiap stadium, merakam koordinat pemain/bola (x,y) pada 25Hz

• Pengesahan manual: Peristiwa utama (gol, kad merah, penalti) disahkan oleh sekurang-kurangnya dua penganalisis bebas

• Rakan data: Opta / StatsBomb / CSL Data Lab

⚙️ Pembersihan & Penjajaran Data

• Pengendalian nilai hilang: Penapisan Kalman untuk interpolasi trajektori; jurang peristiwa diisi melalui semakan video

• Penjajaran pelbagai sumber: Menyegerakkan data optik dengan isyarat pengadil, cap masa milisaat

• Penyingkiran outlier: Rekod pecut/kelajuan yang tidak munasabah secara fizikal ditandai dan disemak secara automatik

• Penormalan zon waktu: Semua cap masa disimpan dalam UTC, paparan hadapan disetempatkan ke zon waktu pengguna

✅ Semua data yang diterbitkan melalui pengesahan pelbagai lapisan; kadar ralat < 0.5% berdasarkan audit rawak FIFA.

📏 Definisi Metrik Teras · Mengkuantitikan Bola Sepak

Serangan / Pertahanan / Binaan / Kecekapan
⚽ Berkaitan Gol

xG (Jaringan Dijangka) — Kebarangkalian percubaan menghasilkan gol berdasarkan jarak, sudut, tekanan pertahanan, dll. Lihat model xG untuk butiran.

PSxG (Post-Shot xG) — xG diselaraskan untuk keupayaan penyelamatan penjaga gol, digunakan untuk menilai prestasi penjaga gol.

Kadar penukaran percubaan = Gol / Jumlah percubaan (tidak termasuk yang disekat)
Kadar penukaran tepat sasaran = Gol / Percubaan tepat sasaran

🔄 Penguasaan Bola & Hantaran

Peratusan penguasaan bola — Bahagian hantaran setiap pasukan (tidak termasuk hantaran keluar, lontaran ke dalam).

Kadar kejayaan hantaran = Hantaran berjaya / Jumlah percubaan hantaran (hantaran ke hadapan diberi berat lebih tinggi)
Hantaran progresif — Hantaran yang menggerakkan bola ke arah gol lawan sekurang-kurangnya 10 meter.

PPDA (Hantaran Setiap Tindakan Pertahanan) = Tindakan pertahanan di separuh lawan / Hantaran lawan di zon tersebut.

⚔️ Metrik Pertahanan

Kadar kejayaan tekel = Tekel berjaya / Jumlah percubaan tekel
Potongan — Hantaran lawan yang dipintas (bukan tekel)
Keluaran — Bola ditendang keluar dari zon berbahaya
Kadar kejayaan tekanan tinggi — Peratusan perolehan atau kesilapan yang dipaksa di separuh lawan

📊 Kecekapan Komposit

xPts (Mata Dijangka) — Mata simulasi berdasarkan xG dan xGA setiap perlawanan; mengukur "nasib".

Penarafan ELO — Penarafan kekuatan dinamik diselaraskan untuk kekuatan lawan: R_baru = R_lama + K * (sebenar - dijangka).

Sentuhan sepertiga akhir — Sentuhan di sepertiga akhir lawan (termasuk kawasan lebar).

📌 Semua metrik boleh digunakan untuk keseluruhan perlawanan atau segmen separuh masa; data masa tambahan ditanda secara berasingan.

📐 Rangka Kerja Statistik · Dari Deskripsi ke Unjuran

Model ramalan | Atribusi | Monte Carlo
🧠 Model Kebarangkalian Kemenangan Dinamik

Regresi logistik menggunakan ELO langsung, indeks bentuk 5 perlawanan terakhir, berat kecederaan, dan kelebihan rumah:

P(Kemenangan Rumah) = 1 / (1 + e^-(β0 + β1·ΔELO + β2·Rumah + β3·PerbezaanBentuk))

Parameter dipasang semula setiap hari untuk menangkap momentum terkini.

Cross-entropy pengesahan: 0.62, mengatasi model odds sejarah tulen.
🎲 Kebarangkalian Mara · Monte Carlo

10,000 simulasi baki perlawanan berdasarkan kedudukan semasa dan kebarangkalian perlawanan.

  • Kedudukan kumpulan mengikut ketat pemecah seri FIFA: mata → PG → satu-lawan-satu → permainan bersih.
  • Keputusan kalah mati disampel dari taburan sisihan piawai enjin ramalan AI.
  • Sepakan penalti dimodelkan menggunakan data sejarah Piala Dunia (kadar penukaran pemain + kecenderungan penjaga gol).
📈 Pengelompokan Kekuatan Pasukan

Pengelompokan K-means tanpa penyeliaan mengkategorikan pasukan ke dalam 4 peringkat kekuatan untuk simulasi undian dan visualisasi.

Vektor ciri merangkumi: ELO, perbezaan xG 10 perlawanan terakhir, hantaran kunci, daya tahan pertahanan.

Kaedah siku disahkan; skor siluet = 0.68, pemisahan yang baik.
🔍 Penalaan Dinamik Bayesian

Hiperparameter (cth., kadar pembelajaran terbobot) dioptimumkan melalui kaedah Bayesian apabila kejohanan berkembang.

Juga menggunakan pelicinan Bayesian pada peristiwa "rawak" seperti terkena tiang atau lencongan untuk mengurangkan bias sampel kecil.

⚙️ Semua model dilatih semula secara automatik setiap malam; data paparan hadapan dikemas kini sewajarnya.

🔍 Kebolehpercayaan & Had · Membaca Data dengan Berhati-hati

Selang keyakinan | Bias diketahui | Penafian
✅ Asas Kebolehpercayaan

• Data mentah bersumber secara eksklusif daripada pembekal berlesen FIFA.
• Setiap metrik agregat disertakan dengan selang keyakinan 90% untuk mengelak "kepastian palsu".
• Ujian belakang terhadap tiga edisi Piala Dunia lepas menunjukkan ketepatan 74% dalam mengunjurkan pasukan separuh akhir.
• Pengesahan sumber terbuka: definisi metrik teras tersedia secara terbuka di GitHub.

⚠️ Had yang Diketahui

• Faktor tidak dapat diramal secara semula jadi: suasana bilik persalinan, bias pengadil, kecederaan saat akhir.
• "Kolusi" hari perlawanan terakhir dalam peringkat kumpulan sukar dimodelkan dengan boleh dipercayai.
• Letupan/kejatuhan pemain individu (cth., kehebatan penjaga gol) tidak dapat diramal awal.
• Kesan cuaca ekstrem (hujan lebat) terhadap xG belum dimasukkan sepenuhnya, tetapi ditanda semasa peringkat kalah mati.

📢 Kenyataan Etika & Tanggungjawab

Semua data, output model, dan visualisasi di laman web ini adalah bertujuan semata-mata untuk penyelidikan akademik, hiburan peminat, dan rujukan maklumat. Ia tidak boleh digunakan untuk perjudian haram atau sebarang aktiviti yang melanggar undang-undang tempatan. Kami tidak bertanggungjawab terhadap keputusan yang dibuat berdasarkan data ini. Kami mematuhi GDPR dan undang-undang privasi yang berkenaan; tiada maklumat pengenalan peribadi dikumpul.

📧 Untuk pertanyaan metodologi atau perkongsian data, hubungi data-methodology@worldcup2026-analytics.com