Theo những phát hiện mới nhất của nhóm nghiên cứu Cybernews, vụ rò rỉ dữ liệu siêu lớn này có khả năng đã làm lộ thông tin của hàng trăm triệu người dùng, chủ yếu là người Trung Quốc. Một cơ sở dữ liệu khổng lồ, mạnh mẽ với dung lượng 631 gigabyte đã không có mật khẩu và làm công khai khoảng 4 tỷ hồ sơ. Đây là một con số đáng kinh ngạc.
![]() |
Bob Dyachenko, nhà nghiên cứu an ninh mạng và chủ sở hữu tại SecurityDiscovery.com, cùng với nhóm Cybernews, đã phát hiện ra hàng tỷ hồ sơ bị lộ trên một phiên bản mở.
Cơ sở dữ liệu bao gồm nhiều bộ sưu tập, chứa từ nửa triệu đến hơn 800 triệu hồ sơ từ nhiều nguồn khác nhau. Nhóm nghiên cứu Cybernews tin rằng, tập dữ liệu đã được thu thập và duy trì một cách tỉ mỉ để xây dựng hồ sơ hành vi, kinh tế và xã hội toàn diện của hầu hết mọi công dân Trung Quốc.
“Khối lượng và sự đa dạng của các loại dữ liệu trong vụ rò rỉ này cho thấy đây có khả năng là một điểm tập trung dữ liệu, được duy trì cho mục đích giám sát, lập hồ sơ hoặc làm giàu dữ liệu”, nhóm nghiên cứu nhận xét.
Không thiếu cách để các tác nhân đe dọa khai thác dữ liệu. Với một tập dữ liệu có quy mô như vậy, mọi thứ từ lừa đảo, tống tiền và gian lận quy mô lớn đến thu thập thông tin tình báo và các chiến dịch làm sai lệch thông tin do nhà nước tài trợ đều có thể xảy ra.
Dữ liệu nào đã được đưa vào vụ rò rỉ dữ liệu lớn nhất của Trung Quốc?
Ngay sau vụ rò rỉ, các thông tin bị lộ đã nhanh chóng được gỡ xuống, chính vì vậy, danh tính của chủ sở hữu dữ liệu vẫn chưa bị lộ. Tuy nhiên, việc thu thập và duy trì loại cơ sở dữ liệu này cần khá nhiều thời gian và công sức, thường liên quan đến các tác nhân đe dọa, chính phủ hoặc các nhà nghiên cứu có động lực để thực hiện.
Các chuyên gia nghiên cứu đã cố gắng xem mười sáu bộ sưu tập dữ liệu, có khả năng được đặt tên theo loại dữ liệu mà họ đưa vào.
Bộ sưu tập lớn nhất, với hơn 805 triệu bản ghi, được đặt tên là "wechatid_db", rất có thể là dữ liệu của siêu ứng dụng WeChat thuộc sở hữu của Baidu.
Bộ sưu tập lớn thứ hai, "address_db", có hơn 780 triệu bản ghi, chứa dữ liệu nhà ở có mã định danh địa lý. Bộ sưu tập lớn thứ ba, được đặt tên đơn giản là "ngân hàng", có hơn 630 triệu bản ghi dữ liệu tài chính, bao gồm số thẻ thanh toán, ngày sinh, tên và số điện thoại.
Nếu sở hữu trong tay ba bộ sưu tập này, những kẻ tấn công có kỹ năng đối chiếu các điểm dữ liệu khác sẽ tìm ra nơi sinh sống của một số người dùng nhất định và thói quen chi tiêu, nợ nần và tiền tiết kiệm của họ.
Một bộ sưu tập lớn khác trong tập dữ liệu rò rỉ được đặt tên bằng tiếng Quan Thoại, có nghĩa là "kiểm tra ba yếu tố". Với hơn 610 triệu bản ghi, bộ sưu tập này rất có thể chứa ID, số điện thoại và tên người dùng.
Trong khi đó, một bộ sưu tập có tên "wechatinfo" chứa gần 577 triệu bản ghi. Vì ID người dùng WeChat được lưu trữ trong một bộ sưu tập riêng biệt, wechatinfo rất có thể có siêu dữ liệu, nhật ký giao tiếp hoặc thậm chí là các cuộc trò chuyện của người dùng.
“Khối lượng và sự đa dạng của các loại dữ liệu trong vụ rò rỉ này cho thấy đây có khả năng là một điểm tổng hợp tập trung, có khả năng được duy trì cho mục đích giám sát, lập hồ sơ hoặc làm giàu dữ liệu”, các nhà nghiên cứu cho biết.
300 triệu bản ghi khác được lưu trữ trong bộ sưu tập dữ liệu “zfbkt_db”, chứa thông tin thẻ Alipay và mã thông báo. Kẻ tấn công có thể cố gắng kích hoạt các khoản thanh toán trái phép, chiếm đoạt tài khoản và đánh cắp danh tính của người dùng. Cùng với đó là bộ sưu tập nhỏ hơn với 20 triệu bản ghi về dữ liệu tài chính liên quan đến Alipay, điều này có thể gây ra thảm họa cho những người dùng bị rò rỉ dữ liệu.
Hơn 353 triệu bản ghi được phân bổ không đồng đều trong chín bộ sưu tập khác với nhiều chủ đề khác nhau. Bất kỳ ai sở hữu bộ dữ liệu đều có thông tin về cờ bạc, đăng ký xe, thông tin việc làm, quỹ hưu trí và bảo hiểm. Các nhà nghiên cứu tin rằng, một bộ sưu tập có tên “tw_db” chứa các chi tiết liên quan đến Đài Loan.
Sự cố rò rỉ dữ liệu của Trung Quốc
Mặc dù đã nỗ lực hết sức, nhóm nghiên cứu vẫn không thể xác định được dữ liệu thuộc về tổ chức nào. "Những cá nhân có thể bị ảnh hưởng bởi vụ rò rỉ này hiện vẫn chưa có cách giải quyết trực tiếp do chủ sở hữu ẩn danh và thiếu kênh thông báo", nhóm nghiên cứu lưu ý.
Rò rỉ dữ liệu tại Trung Quốc hầu như không phải là chuyện mới. Trước đây đã có những bài viết về một vụ rò rỉ dữ liệu làm lộ 1,5 tỷ hồ sơ của Weibo, DiDi, chính quyền thành phố Thượng Hải và những hồ sơ khác, hoặc một tác nhân bí ẩn đã tiết lộ hơn 1,2 tỷ hồ sơ của người dùng Trung Quốc. Gần đây hơn, những kẻ tấn công đã rò rỉ trực tuyến hồ sơ của 62 triệu người dùng iPhone.
Tuy nhiên, vụ rò rỉ dữ liệu với 04 tỷ bản ghi vẫn là một kỷ lục mà trước đây chưa từng có. Qua đó khẳng định, vụ rò rỉ dữ liệu này trở thành vụ rò rỉ dữ liệu cá nhân của người Trung Quốc từ một nguồn lớn nhất từng được xác định.
Bình luận