Từ 22h ngày 4/10 (giờ Việt Nam) các dịch vụ của Facebook trên toàn cầu bất ngờ không thể truy cập. Đến khoảng 8h sáng 5/10, các dịch vụ của Facebook đã được khắc phục dần, hoạt động bình thường trở lại.
Trước khi toàn bộ nền tảng gặp lỗi, cổ phiếu Facebook đã liên tục giảm do bê bối về loạt thông tin bí mật. Ngày 3/10, Frances Haugen, nhà khoa học dữ liệu từng làm việc cho Facebook đã cáo buộc Công ty lừa dối nhà đầu tư về cách đối phó ngôn từ kích động thù địch và tin giả.
Hàng nghìn trang tài liệu Haugen đăng tải cho thấy sự hời hợt trong cách xử lý các dịch vụ Instagram gây ảnh hưởng tiêu cực cho giới trẻ. Sự việc căng thẳng tới mức các cáo buộc dự kiến được đưa ra phiên điều trần Quốc hội Mỹ ngày 5/10. Vì vậy, nhiều đồn đoán cho rằng Facebook có thể bị hack.
Tuy nhiên, truyền thông của Facebook vừa lên tiếng cho biết nguyên nhân sự cố đến từ sai sót trong lúc tinh chỉnh router (bộ định tuyến) điều phối lưu lượng mạng giữa các trung tâm dữ liệu. Mặc dù vậy, các chi tiết kỹ thuật vẫn chưa được công bố.
Sau khi phân tích, các chuyên gia an ninh mạng từ Cloudflare cho rằng sự cố có thể liên quan đến giao thức định tuyến Internet có tên BGP (Border Gateway Protocol). BGP về cơ bản là một trong những hệ thống định tuyến lưu lượng, đưa thiết bị của người dùng đến website cần truy cập càng nhanh càng tốt.
Do Internet luôn thay đổi, bản đồ cần được cập nhật để tránh dẫn nhầm đường. Các hệ thống thường "tham khảo" thông tin từ máy chủ khác để sao chép thông tin mới. Nếu một điểm đến gặp lỗi nhưng không được phát hiện, chúng sẽ ảnh hưởng đến bản đồ, khiến lưu lượng không được truyền đến đúng vị trí. Các chuyên gia nhận định Facebook "bị xóa sổ khỏi Internet" khi điểm đến trên bản đồ biến mất.
Sai sót trong cập nhật BGP cũng có thể ảnh hưởng đến tuyến đường lưu lượng. Đại diện của Cloudflare cho biết đã ghi nhận nhiều bản cập nhật BGP từ Facebook ngay trước khi sự cố xảy ra. Một trong những lãnh đạo của Fastly cho biết Facebook đã ngừng cấp tuyến đường lưu lượng đến dịch vụ này. Ngay cả các website nội bộ của Facebook cũng không thể truy cập. Theo The Verge, một số kỹ sư đã đến trung tâm dữ liệu của Facebook tại California (Mỹ) để khắc phục sự cố.
Sự cố diện rộng của Facebook diễn ra trong nhiều giờ liên tục. Với quy mô lớn và lưu lượng truy cập đông, Facebook cần đảm bảo không xảy ra sai sót khi cập nhật hoặc tùy chỉnh máy chủ, đảm bảo điểm đến không bị xóa khỏi bản đồ để BGP điều hướng lưu lượng chính xác.
Năm 2018, hacker đã chiếm đoạt lưu lượng truy cập đến Amazon trong gần 2 tiếng, đánh cắp hàng nghìn USD tiền mã hóa Ethereum bằng cách xâm nhập hệ thống BGP của một ISP kết nối với Amazon. Từ đó, lưu lượng truy cập đến Amazon đã bị chuyển hướng đến địa chỉ khác.