Sự cố dịch vụ Microsoft nghiêm trọng: Azure và M365 tê liệt

Tập đoàn Microsoft đã trải qua một sự cố dịch vụ Microsoft quy mô lớn vào Thứ Tư, ngày 29 tháng 10 năm 2025.
Sự cố này đã ảnh hưởng đến nền tảng đám mây Azure và bộ ứng dụng Microsoft 365, khiến hàng nghìn người dùng không thể truy cập các dịch vụ kinh doanh thiết yếu.
Tổng Quan Về Sự Cố Dịch Vụ và Phạm Vi Ảnh Hưởng
Sự gián đoạn bắt đầu vào khoảng 16:00 UTC (tức khoảng 21:30 IST) và được xác định nguyên nhân là do các vấn đề cấu hình Hệ thống Tên miền (DNS).
Những vấn đề này đã làm tê liệt khả năng kết nối trên toàn bộ cơ sở hạ tầng toàn cầu của Microsoft.
Sự cố đã tác động đến một phổ rộng các sản phẩm và dịch vụ của Microsoft, với hàng chục nghìn người dùng báo cáo khó khăn khi truy cập các nền tảng quan trọng.
Theo trang web theo dõi sự cố Downdetector, Azure đã ghi nhận hơn 16.600 báo cáo từ người dùng.
Trong khi đó, Microsoft 365 cũng nhận được gần 9.000 khiếu nại trong thời điểm cao điểm của sự cố.
Các Dịch Vụ Bị Ảnh Hưởng Trực Tiếp
- Microsoft 365 admin center
- Azure Portal
- Exchange admin center
- Microsoft Intune
- Xbox Live
- Minecraft
- Microsoft Copilot
- Outlook add-ins
Những gián đoạn này đã ngăn cản người dùng xác thực vào các mạng doanh nghiệp và truy cập các nền tảng kinh doanh dựa trên đám mây.
Điều này gây ra những thách thức hoạt động đáng kể cho các tổ chức trên toàn cầu.
Phân Tích Nguyên Nhân Gốc Gác của Lỗi DNS Azure
Microsoft đã xác nhận vấn đề bắt nguồn từ các sự cố DNS ảnh hưởng đến cơ sở hạ tầng nội bộ của họ.
Các quan chức sau đó đã cho rằng sự cố ngừng hoạt động là do một thay đổi cấu hình Azure Front Door không chủ ý.
Azure Front Door là một dịch vụ CDN (Content Delivery Network) toàn cầu của Microsoft, giúp tối ưu hóa định tuyến và hiệu suất ứng dụng.
Một lỗi cấu hình trên dịch vụ này có thể có tác động dây chuyền nghiêm trọng đến khả năng truy cập.
Trong các bản cập nhật được đăng trên trang trạng thái của Azure, công ty cho biết họ đang “xem xét tình trạng sức khỏe của cơ sở hạ tầng mạng và lưu trữ để xác định lý do dịch vụ ở trạng thái không lành mạnh”.
Sự cố DNS đã ngăn người dùng xác thực vào mạng công ty và truy cập các nền tảng kinh doanh dựa trên đám mây, gây ra gián đoạn nghiêm trọng.
Ngay cả các trang trạng thái dịch vụ của chính Microsoft status.cloud.microsoft cũng tạm thời ngoại tuyến trong giai đoạn đầu của sự gián đoạn.
Điều này khiến khách hàng không thể theo dõi tiến độ phục hồi.
Tác Động Toàn Cầu và Thách Thức Vận Hành
Các tổ chức chăm sóc sức khỏe, nền tảng lập kế hoạch du lịch của hệ thống đường sắt Hà Lan, và các doanh nghiệp thuộc nhiều lĩnh vực khác nhau đều báo cáo lỗi xác thực.
Những lỗi này đã làm gián đoạn các hoạt động hàng ngày và gây thiệt hại đáng kể.
Ví dụ, việc không thể truy cập các công cụ cộng tác hoặc cơ sở dữ liệu quan trọng có thể làm đình trệ toàn bộ chuỗi công việc.
Trạng thái cập nhật trên Microsoft 365 admin center đã được ghi nhận với mã sự cố MO1181369.
Biện Pháp Khắc Phục và Khuyến Nghị Kỹ Thuật
Là một phần trong chiến lược giảm thiểu, Microsoft đã bắt đầu chuyển hướng lưu lượng truy cập bị ảnh hưởng sang cơ sở hạ tầng thay thế đang hoạt động bình thường.
Đồng thời, công ty đã chặn tất cả các thay đổi đối với dịch vụ Azure Front Door và khôi phục lại cấu hình hoạt động tốt gần nhất.
Các đội kỹ sư của Microsoft đã triển khai các hành động khôi phục đồng thời, bao gồm đánh giá các tùy chọn chuyển đổi dự phòng cho các dịch vụ nội bộ chạy trên cơ sở hạ tầng Azure Front Door.
Khuyến Nghị Truy Cập Tạm Thời
Công ty đã khuyến nghị khách hàng gặp khó khăn khi truy cập cổng thông tin sử dụng các phương pháp lập trình như PowerShell hoặc CLI để truy cập tài nguyên Azure làm giải pháp tạm thời.
Điều này cho phép các quản trị viên vẫn có thể thực hiện các tác vụ quản lý và truy cập các tài nguyên cần thiết mà không phụ thuộc vào giao diện web.
Ví dụ, để truy cập thông tin về một máy ảo Azure bằng CLI, người dùng có thể sử dụng lệnh sau:
az vm list --output table
az vm show --resource-group MyResourceGroup --name MyVM --output json
Các hành động chuyển hướng lưu lượng truy cập đã được tiến hành.
Tuy nhiên, các cuộc điều tra về nguyên nhân gốc rễ của sự cố dịch vụ Microsoft này vẫn đang tiếp diễn.
Bài Học Rút Ra Từ Sự Cố Dịch Vụ Đám Mây
Sự cố này một lần nữa nhấn mạnh sự phụ thuộc quan trọng của các doanh nghiệp hiện đại vào các nhà cung cấp cơ sở hạ tầng đám mây.
Nó cũng làm nổi bật những hiệu ứng domino mà các lỗi ở cấp độ DNS có thể gây ra trên các dịch vụ kỹ thuật số được kết nối với nhau trên toàn thế giới.
Đây là một minh chứng rõ ràng về tác động của các mất dịch vụ đám mây quy mô lớn.
Các tổ chức cần có kế hoạch dự phòng mạnh mẽ và hiểu rõ về kiến trúc dịch vụ mà họ đang sử dụng.









