rss
10/21/2019
EN   UA

Молодiжне Перехрестя (Тисність на обкладинку)

#362

Ваша точка зору

Чого, на Вашу думку, найбільше бракує Україні для перемоги?
Грошей
Зброї
Ядерної зброї
Міжнародної підтримки
Совісті найвищого керівництва
Ваш варіант відповіді
Це цікаво \ Big Data: недостатньо анонімні

Ідентичність особи та її персональні дані навіть в анонімних базах даних можна легко пов'язати з реальними людьми, засвідчує дослідження. Більшість людей можна ідентифікувати навіть на підставі цілком легально проданих даних - незважаючи на анонімність.

 

Для цього достатньо чотири параметри, натомість, більшість баз даних містять значно більше даних про особу, - повідомляють науковці у фаховому віснику Nature Communications.

Пошуки в Інтернеті, використання додатків або оплата кредитною карткою - майже все, що ми робимо, залишає свій інформаційний слід. Ці особисті дані часто потрапляють до третіх осіб - наприклад, самі додатки передають їх або ж зловмисники викрадають бази даних, врешті, ці дані можуть використовувати маркетингові компанії чи інші установи з науковою метою - часто навіть зовсім легально.

Бази даних - анонімні, тобто, з них видаляють ім'я, номер рахунку, номер соціального страхування й подібне, тож їхнє використання та передача - дозволені. Але це породжує питання: наскільки анонімними ці дані є насправді? Чи немає небезпеки, що людей ідентифікують на підставі тих даних, що збереглися? Насправді ще кілька років тому на прикладі даних кредитних карток учені продемонстрували: це можливо - і з, на диво, незначною кількістю вихідних даних.

Ще масштабніший тест здійснили Люк Рочер (Luc Rocher) з Левенського університету та його колеги. Вони використали адаптивний алгоритм, аби з'ясувати, з якою ймовірністю у великій кількості даних можна однозначно ідентифікувати анонімів. Як джерело даних науковці використали анонімні дані американського перепису населення та чотири інші публічно доступні бази даних.

Ключовим питанням дослідження було: скільки та які ознаки (зокрема, вік, стать, місце проживання або кількість дітей) потрібно, щоб ідентифікувати людину, незважаючи на анонімність? Розроблений ученими алгоритм був натренований розпізнавати унікальність комбінації цих ознак у кожному випадку. «Напевно є чимало осіб чоловічої статі, народжених у 30-х роках ХХ сторіччя в Нью-Йорку, - пояснив Рочер. - Але значно менше народилися 5-го січня, їздять на червоному спортивному авто, живуть із двома доньками та собакою».

Оцінювання засвідчило: всупереч обіцянкам спеціалізованих фірм і державних установ, загальноприйнятна анонімність - не перешкода для того, щоб на підставі інформаційного сліду заново визначити особу. Лише з поштовим індексом, датою народження, статтю та кількістю дітей ученим вдалося точно визначити майже 80% усіх мешканців американського штату Массачусетс, - повідомили Рочер та його команда.

«І це дані, які фірми запитують за замовчуванням», - сказав співавтор Ів-Александр де Монжуа (Yves-Alexandre de Montjoye) з Імперського коледжу Лондона. Натомість, з дещо ширшими 15 параметрами даних можна було правильно розпізнати вже 99,8% усіх мешканців Массачусетса. «Це демонструє, як просто й точно можна ідентифікувати людей через такі бази даних», - наголосив Монтжуа.

Крім того, чимало цілком легально переданих баз даних містять значно більше інформації про особу: «Наприклад, брокер інформації Experian перепродав анонімні дані про 120 мільйонів американців, і вони містили 248 параметрів на кожне господарство», - повідомили вчені.

Завдяки онлайн додатку, який розробили вчені, громадяни Великої Британії та США можуть самостійно переконатися, як просто ідентифікувати їхню особу. Спочатку учасники тесту повинні зазначити свій поштовий індекс, стать і дату народження, на підставі отриманої інформації програма визначить, наскільки високий ризик для кожного бути ідентифікованим. Ці дані не зберігаються, - наголошують учені. Потім можна заповнити нові дані - сімейний статус, кількість авто, зайнятість, і програма заново вирахує ризик. На підставі цього можна легко виявити, скільки й які параметри потрібно, щоб усю множину ймовірних варіантів звести до одного - до нас самих.

На думку Рочера та його команди, визнані методики анонімізації - недостатні, щоб стерти індивідуальний інформаційний слід. «Нас часто запевняють, що анонімність захистить персональну інформацію. Але наше дослідження доводить, що цієї простої деінтифікації недостатньо, щоб захистити приватну сферу наших даних», - сказав колега Рочера Жульєн Гендрікс (Julien Hendrickx).

Свої дослідження вчені вважають сигналом, який адресований політикам і законодавцям: «Коли стандарти анонімності переглядатимуть, як це відбувається, зокрема, в ЄС, важливо, щоб вони були надійними і враховували нові небезпеки, зокрема, ті, які ми представили», - наголосили Рочер та його колеги.

 

Автор: Nadja Podbregar

Джерело: Imperial College London

Зреферувала С. К., «Збруч»

Чи технології вбивають стосунки?

Український стартап – у фіналі популярної платформи для розвитку технологій та інновацій Start-up Chile

 

Реклама

© 2006-2011 "Час i Подiї". All Rights Reserved | Chicago Web Design - www.4everstudio.com