Online: 970 online | Members: 0 | Guests: 970
Isnin, Jun 8, 2026

Pada 5 Desember 2025, Cloudflare – salah satu pilar inti internet modern – menderita lagi kerusakan besar yang secara singkat memecahkan potongan besar web. Untuk pemilik situs, tim SRE dan pengguna biasa, itu adalah pengingat yang tajam betapa rapuhnya internet \"selalu-on\" kita.

Di bawah ini adalah menyelam mendalam ke dalam apa yang terjadi, mengapa penting, dan apa pelajaran infrastruktur dan tim aplikasi dapat mengambil dari itu.

Cloudflares_Latest_Global_Outage_What_Went_Wrong_and_What_It_Means_for_Your_Website.png


Apa yang terjadi pada 5 Desember 2025?

Pada pagi hari 25 Desember 2025, Cloudflare mengalami Gangguan pelayanan global Feadon yang menyebabkan banyak website untuk kembali Halaman kosong atau galat os 2 menit. Penyakit di luar mempengaruhi berbagai macam layanan utama, termasuk platform seperti (Inggris) LinkedIn, Zoom, Coinbase, Canva, Groww, BookMyShow dan lain-lain, tergantung pada wilayah dan peering. Berita + + + + + + Perancis

Ruang berita dan tempat pemantauan yang dilaporkan:

  • Pengguna kapal melihat “halaman kosong” Alih-alih konten normal ketika mengunjungi situs yang terkena dampak. Berita Sky + + + + + + Perancis

  • Ada peningkatan Kesalahan 5xx Keterkaitan dan isu konektivitas melintasi situs web dan API yang mengandalkan jaringan tepi Cloudflare. Jurnal Mesin Pencarian Finan

  • Masalah bukan hanya dengan lalu lintas pelanggan, tapi juga dengan Papan Sengkang dan API Cloudflare sendiri, yang terdegradasi observabilitas dan kontrol tepat ketika pelanggan membutuhkan mereka paling. Berita + + + + + + Perancis

Meskipun kematian itu hanya berlangsung sebentar — kira - kira 08:47 sampai 09:13 GMT Menurut laporan awal — radius ledakan cukup besar bahwa itu secara singkat berdampak platform kritis seperti Coinbase Dan AI Claude Antropik, dan mengirim saham Cloudflare sendiri turun sekitar 230.5%4,5% dalam perdagangan pra-pasar. Reuters + + + + + + Perancis

Cloudflare telah menyatakan bahwa:

  • Insiden Bukan karena serangan cyber..

  • Ini berasal dari Pergantian internal ke penanganan/pemrosesan permintaan firewall Dianggap sebagai pernyataan baru Komponen Server React (RSC) kerentanan. Reuters + + + + + + Perancis

Dengan kata lain: perubahan yang mendorong keamanan ke logika firewall Cloudflare memperkenalkan efek samping yang sementara membuat bagian besar jaringannya tidak tersedia.


Apa yang sebenarnya pecah?

Dari perspektif pengguna, ada dua gejala dominan:

  1. Situs web Major menolak kesalahan atau halaman kosong

    • Sejumlah besar situs menunjukkan HTTP dalam jumlah besar Kesalahan 5xx, atau sederhana Halaman kosong/putih Dia tidak puas. Berita Sky + + + + + + Perancis

    • Untuk beberapa platform, yang berarti halaman log masuk tidak memuat, dashboard tidak merender, atau API waktu keluar.

  2. Pesawat kendali Cloudflare sendiri terdegradasi

    • Fiji ♪ Cloudflare Dashboard ♪ Fiji dan sekitarnya API Memanfaatkan juga dampaknya, membatasi kemampuan pelanggan untuk mengubah konfigurasi atau melihat apa yang terjadi secara nyata. Berita + + + + + + Perancis

Pada tingkat teknis, pernyataan awal dari Cloudflare dan laporan media menunjuk ke Woidon mengubah bagaimana firewall memproses permintaan, diperkenalkan untuk meminimalkan kerentanan dalam React Server Komponen. Tidak sengaja perubahan itu menyebabkan jaringan Cloudflare efektif Luncom berhenti melayani lalu lintas dengan benar selama beberapa menit. Reuters + + + + + + Perancis

Bahkan gangguan singkat di penyedia yang duduk di depan begitu banyak website menciptakan sebuah Pola kegagalan kaskadingKANTOR:

  • Peramban mencoba kembali koneksi, meningkatkan beban.

  • Backend berketergantungan bercorak melihat lonjakan, penumpukan antrian, atau tenggat waktu.

  • Alat monitoring tools cepat banjir insinyur on-call dengan waspada, sering dengan data yang tidak lengkap atau menyesatkan karena stack observabilitas itu sendiri juga dapat mengandalkan Cloudflare.


Mengapa outage ini menonjol, \"Kecelakaan besar kedua dalam tiga minggu\"

Ini bukan kesalahan yang terisolasi. Itu datang Kurang dari tiga minggu setelah kejadian Cloudflare yang lebih besar pada 18 November 2025.

18 November 2025 meninggal dunia (konteks)

On 25 November 2025Cloudflare mengalami pemadaman besar bahwa:

  • Penyebab tersebar luas Kesalahan 5xx Prestasi yang terdegradasi untuk banyak situs secara global.

  • Platform profil tinggi yang dipengaruhi termasuk (sebelumnya Twitter) Dan OpenAI / ChatGPTSalah satunya. Hidodo

  • Dilacak kembali ke bug logika generasi untuk file fitur Manajemen Bot, yang mempengaruhi banyak layanan kunci Cloudflare. Blog Cloudflare + + + + + + Perancis

Cloudflare kemudian menerbitkan detail post-mortem menjelaskan bahwa file konfigurasi Manajemen Bot menyebabkan kegagalan kaskading di seluruh sistem internal – kasus klasik a Artefak konfigurasi palsu tunggal yang nakal Melumpuhkan jalur lalu lintas kritis. Blog Cloudflare

3.2 5 Desember vs 18 November: pola serupa, pemicu berbeda

Membandingkan keduanya:

  • 25 November 2025

  • PemicuPerubahan penanganan firewall digulung sebagai mitigasi untuk kelemahan Komponen Server React. Reuters + + + + + + Perancis

  • KesanKemungkinan singkat tapi luas, halaman kosong, Cloudflare Dashboard/API masalah.

Bagi para pelanggan, perbedaannya tidak penting: kedua insiden itu klasik Pesawat-pengontrol pesawat-didorong keluar Di mana konfigurasi atau perubahan keamanan di tingkat penyedia memiliki konsekuensi seluruh sistem.


Sebuah pola yang melampaui Cloudflare

Cloudflare tidak sendirian di sini. Selama beberapa tahun terakhir kami telah melihat serangkaian kerusakan skala internet yang disebabkan oleh kesalahan konfigurasi, pembaruan perangkat lunak atau mitigasi keamanan di penyedia utama:

  • Cloudflare, Microsoft, AmazonDan Cowok Semua insiden terjadi di ribuan layanan tergantung. Reuters + + + + + + Perancis

  • Analisis ari catatan gangguan internet Puluhan kematian global signifikan di paruh pertama 2020-an, mengurangi pertumbuhan Risiko konsentrasi kepekatan Hanya mengandalkan seperangkat kecil vendor infrastruktur. ONSolvers

Kerusakan Cloudflare terbaru ini cocok dengan tema yang lebih besar:

Semakin banyak kita sentralisasi keamanan, DNS, CDN dan edge menghitung ke dalam segelintir penyedia, lebih banyak bug konfigurasi tunggal dapat menjadi Risiko sistemik Untuk seluruh internet.


Pelajaran teknis dari 5 Desember kerusakan

Dari informasi publik terbatas, kita sudah dapat mengekstrak beberapa pelajaran teknis yang relevan untuk SRE, DevOps dan tim platform.

5.1 Perubahan keamanan membutuhkan disiplin yang sama dengan pengerahan kode

Penyebab akar adalah Perubahan proses permintaan firewall Diangkat sebagai bagian dari mitigasi a Komponen Reakt Server Komponen kerentanan. Reuters + + + + + + Perancis

Takeaways Kunci:

  • Perbaikan Keamanan Fix = perubahan produksi
    Pemutakhiran konfigurasi yang didorong-keselamatan harus melalui Saluran yang sama, pengujian, dan pelindung Sebagai perubahan fitur tetap. \"Ini adalah patch keamanan\" bukan pembenaran untuk melewati kontrol normal.

  • Pengontrol radius ledakan & rollout Tahapan
    Setiap perubahan ke perilaku firewall global harus:

    • Dia pergi ke subset POP atau pelanggan pertama.

    • Dilindungi oleh Flag fitur Dan Mekanisme rollback instant.

    • Dimonitor dengan Metrik kenari spesifik Perbandingan halaman kosong untuk menangkap kegagalan dalam hitungan detik.

5.2 Pesawat pengendali pesawat sangat kritis sebagai pesawat data uptime

Fakta bahwa Awan Berawan Papan dashboard dan API Veidon juga terdegradasi selama insiden tersebut sangat menyakitkan. Berita + + + + + + Perancis

Untuk operator, ini berarti:

  • Kau perlu Cara keluar-dari-band atau provider-independen Ke:

    • DNS switch.

  • Bypass atau lumpuhkan lapisan yang gagal (misalnya, sementara akan langsung ke asal).

  • Log akses log dan metrik log log log log log log log dan metrik, walaupun UI/API milik penyedia tersebut sendiri tidak aktif.

Jika satu - satunya cara untuk memperbaiki problem bergantung pada infrastruktur yang sama yang saat ini rusak, Anda kehilangan jaring pengaman yang kritis.

Artefak konfigurasi 5.3 bisa berbahaya seperti kode

Keduanya November 18 Dan 2010, 5 Desember Insiden memiliki pola struktural yang sama:

  • AS Konfig konfigurasi atau artefak kebijakan (Perilaku aturan firewall)

  • Diledakkan melalui otomatisasi global

  • Interaksi buruk dengan lalu lintas produksi pada skala. Blog Cloudflare2 +2Hidodo2 +2

Pelajaran: Perlakukan konfigurasi dengan Kekakuan yang sama dengan kodeKANTOR:

  • Kontrol version, ulasan kode, dan tes.

  • Kesahiahan terhadap Permainan ulang lalu lintas yang realistis Dalam pementasan.

  • Membatasi radius ledakan konfigurasi tunggal yang salah.


Apa artinya ini bagi perusahaan yang mengandalkan Cloudflare

Kebanyakan organisasi tidak bisa sekadar ” berhenti menggunakan Cloudflare ”. Ini sangat terintegrasi ke dalam:

  • DNS dan routing sebarangcast

  • Perlindungan DDoS

  • Manajemen WAF dan robot

  • CDN dan caching

  • AI pekerja dan banyak lagi. Blog Cloudflare

Tapi kau Akan Hal ini mengurangi dampak kerusakan di masa depan.

Peta 6.1 Peta Anda Dependensi Cloudflare ¶

Pertama, tahu Bagaimana bergantung pada Cloudflare:

  • Apakah Anda DNS tinggal di sana?

  • Apa kau berhenti? TLS Hanya di Cloudflare, atau juga asalnya?

  • Perancis API kritis Akses akses ke publik hanya melalui Cloudflare?

  • Tim internal Do mengandalkan tim internal Terowongan / Akses / WASP Untuk mencapai layanan sensitif?

Misalnya, selama gempa bumi 12 Juni 2025, Cloudflare mencatat bahwa produk seperti Pekerja Workers KV, WARP, Akses, Gateway, Images, Stream, Workers AI, Turstile, Zaraz, dan bagian dari Dashboard Alexore terpengaruh – peringatan tentang berapa banyak lapisan yang dapat diikat pada satu vendor. Blog Cloudflare

DNS dan CDN gagalover

Untuk layanan bernilai tinggi, pertimbangkan:

  • Sekunder Wachida dengan penyedia lain mampu mengambil alih dengan cepat.

  • Strategi multi-CDN atau CDN-bypassAgar jika Cloudflare gagal, kau bisa:

    • Macet lalu lintas langsung ke asal.

    • Atau memindahkan lalu lintas ke CDN cadangan, bahkan jika kinerja sementara lebih buruk.

Ini jarang datang secara gratis (kost/kompleksitas), tetapi untuk layanan misi-kritikal dapat bernilai ketahanan.

6.3 Bina ketahanan tingkat-aplikasi

Bahkan ketika ujungnya patah, aplikasi Anda dapat gagal lebih anggun:

  • Wajik Laman galat statik tercache Itu menjelaskan situasinya bukan respon kosong.

  • Bina Logika retry sisi klien Yang mundur, daripada memukul ujung yang berjuang.

  • Hiruple Kefungsian non-kritikal (analitik, skrip pihak ketiga, personalisasi berat) sehingga mereka dapat dinonaktifkan dengan cepat.

6.4 Secara operasional: perlakukan provider outages sebagai skenario game-day biasa

Guna ini dan 18 November mati sebagai bahan untuk game-daysKANTOR:

  • Seberapa cepat Anda dapat mendeteksi bahwa masalahnya adalah dengan Cloudflare vs asal Anda sendiri?

  • Nama do on-call buku panduan termasuk:

  • Tautan ke halaman status Cloudflare dan jalur kontak vendor Anda? Status Cloudflare + + + + + + Perancis

  • Langkah-langkah sebelum disetujui untuk bypass atau re-route lalu lintas?

  • Kau sedang mengawasinya. Periksa eksternal Tuah yang memukul layanan Anda ♪ tanpa ♪ Melewati awan?


Bagaimana Cloudflare mungkin menanggapi

Cloudflare memiliki sejarah panjang penerbitan detail post-mortem untuk insiden besar (misalnya, 25 Juni 20 Juni 2024 Dan 27 Juni 2024 Insiden, serta insiden 2 Juni 2025 Dan 25 November 2025 outages). Blog Cloudflare3 +3Blog Cloudflare3 +3Blog Cloudflarekelas

=---me-1 flex h-full items-center bulat-full px-1 text-[#8F8F8F]">+ Fiji 3

Berdasarkan pola itu, kita bisa memperkirakan:

  • Penulisan blog teknis:

    • Logika firewall yang tepat.

    • Mengapa mitigasi untuk React Server Komponen kerentanan terjadi tanpa diduga.

    • Berapa lama dampaknya berlangsung di berbagai wilayah.

  • A list of RemediasiMisalnya:

    • Validasi konfigurasi dan pengujian yang lebih kuat.

    • Ketat dipentaskan rollout dan otomatis rollback pemicu.

    • Pemisahan yang lebih baik antara sistem yang melayani lalu lintas pelanggan dan mereka yang power Dashboard dan API.

Bagi pelanggan, transparansi itu berharga – tetapi tidak menghilangkan kebutuhan untuk Desain desain untuk kegagalan penyedia Di arsitektur mereka sendiri.


Gambar yang lebih besar: sentralisasi vs ketahanan

Kerusakan 5 Desember adalah bagian dari percakapan yang lebih besar industri sudah memiliki:

  • Kami telah memusatkan sejumlah besar routing, DNS, keamanan, WAF, dan pengiriman konten Ke dalam segelintir penyedia. ONSolvers + + + + + + Perancis

  • Setiap insiden besar di Cloudflare, Azure, AWS, atau CrowdSpatch sekarang berperilaku seperti kegagalan sistem keuanganItu tidak hanya mencatat satu situs, itu singkat penyok seluruh Ekonomi digital.

Untuk regulator dan perusahaan besar, yang menimbulkan pertanyaan tentang:

  • Risiko konsentrasi nirawak – sampai sejauh mana infrastruktur kritis harus dipaksa untuk memiliki redundansi multi-vendor?

  • Ketelanjangan dan akuntabilitas – Seberapa cepat dan jelaskah penyedia berbagi root-cause detail?

  • Investment dalam ketahanan – Apakah kita menghabiskan cukup banyak untuk guardrails vs pada pengiriman fitur baru?


Ringkasan

Untuk membungkus, Cloudflare’s Kecelakaan besar terbaru pada 5 Desember 2025 kinof dapat dirangkum sebagai:

  • AS Kehabisan global tetapi singkat Feagon disebabkan oleh perubahan pemrosesan firewall internal yang dikerahkan sebagai bagian dari respon keamanan.

  • Ketampakan kepada pengguna sebagai Kejadian halaman kosong dan 5xx Di seluruh situs web utama, dan degradasi dari Papan Sengkang dan API milik Cloudflare.

  • Fiji Insiden kedua dalam waktu kurang dari tiga minggu, mengikuti yang jauh lebih besar 18 November 2025 Bot Management–terkait outage.

  • Satu lagi titik data dalam cerita yang sedang berlangsung Risiko konsentrasi infrastruktur infrastrukturDi mana kesalahan konfigurasi pada beberapa penyedia dapat memecahkan internet secara singkat untuk semua orang.

Perusahaan-perusahaan yang mengandalkan Cloudflare, inti pesan tidak \"panik dan bermigrasi,\" tetapi:

Asumsikan bahwa Penyedia Anda akan gagal, dan desain arsitektur, operasi, dan proses bisnis Anda sehingga kerusakan berumur pendek tidak menjadi krisis eksistensial.

Latest Articles

Read More...
date dark
hits dark 3019