Thứ Hai, 3 tháng 11, 2014

Google thu thập cách thức người dùng sử dụng phần mềm

Hãng tìm kiếm khổng lồ Google đang áp dụng một kĩ thuật khảo sát từ những năm 1960 cho dự án thu thập dữ liệu mà không gây ảnh hưởng đến tính riêng tư của người dùng.



Google vừa công bố một dự án mã nguồn mở gọi là RAPPOR (Randomized Aggregatable Privacy-Preserving Ordinal Response), qua đó sử dụng dữ liệu ngẫu nhiên để thu thập thông tin về việc sử dụng phần mềm của người dùng trong khi vẫn giữ được tính riêng tư về hành vi cá nhân của họ.
Google đang thử nghiệm phương pháp tiếp cận này trong trình duyệt Chrome nhằm thu thập dữ liệu về các trang web mà người dùng đặt làm trang chủ mặc định trên trình duyệt của hãng, qua đó giúp Google có thể xử lí tốt hơn những phần mềm độc hại có âm mưu thay đổi trang chủ trình duyệt.
Có khoảng 14 triệu người dùng đã tham gia cuộc nghiên cứu này và nhiều người dùng đã đồng ý để Chrome gửi dữ liệu về việc sử dụng của họ cho Google.
Đây rõ ràng là dự án thú vị cho một hãng có kho dữ liệu cá nhân khổng lồ như Google. Dữ liệu này có thể sẽ có ích cho các cơ quan chính phủ, cho Google hoặc thậm chí đây sẽ là miếng mồi béo bở cho giới tin tặc. Nhưng phương pháp RAPPOR sẽ có những thuật toán riêng để “giữ kín” thông tin cá nhân đưa ra trước khi Google nhận được dữ liệu. Kết quả của phương pháp này là "đảm bảo sự riêng tư mạnh mẽ".
Ảnh
RAPPOR được thiết kế để thu thập số liệu thống kê liên quan đến phần mềm, chẳng hạn các lỗ hổng bảo mật, nhưng theo một cách được cho là sẽ không làm lộ những thông tin nhạy cảm. RAPPOR có thể làm được điều đó bằng cách áp dụng một kĩ thuật để khảo sát phản ứng ngẫu nhiên. RAPPOR cho phép khảo sát toàn bộ “rừng” dữ liệu khách hàng nhưng không cho phép nhìn vào từng “cây” riêng lẻ.
Phương pháp này hơi giống với một thủ thuật thống kê trong đó mọi người tham gia khảo sát được hướng dẫn để trả lời một cách cụ thể dựa trên việc tung đồng xu ra kết quả "hình" hay "chữ". Khảo sát sau đó có thể tính toán để đưa ra những câu trả lời được cho là có tính trung thực, nhưng người trả lời vẫn có quyền từ chối nếu muốn.
RAPPOR được xây dựng dựa trên các khái niệm như vậy, cho phép phần mềm gửi những báo cáo hữu ích và không phân biệt những kết quả ngẫu nhiên của đồng xu. Bằng cách tập hợp báo cáo này, Google có thể tìm hiểu số liệu thống kê phổ biến được chia sẻ bởi nhiều người dùng.
Google cho biết sẽ phát hành RAPPOR dưới dạng mã nguồn mở để ai cũng có thể thử nghiệm cơ chế báo cáo và phân tích này.