Редактор GeekTimes
802,6
рейтинг
30 января 2015 в 17:16

Владельца банковской карты можно выделить из миллионного списка всего по четырём покупкам

image

Исследователи из MIT разоблачили несколько мифов о приватности в современном обществе. Они установили, что даже неполные данные о четырёх покупках, совершённых при помощи банковских карт, позволяют установить личность человека в 90% случаев. Необходимо знать только даты и места покупок. Эти данные сравнивались со списком транзакций за три месяца, совершённых более чем миллионом человек.

Более того, если воспользоваться грубыми данными о ценах покупок (стоимость покупки с точностью до 50%), то количество точек привязки сокращается до трёх, а точность вырастает до 94%. То есть, к примеру, вооружившись одним выброшенным вами чеком, одной фотографией вашего завтрака в кафе из Instagram и одним вашим твитом с сообщением о покупке нового гаджета, можно почти наверняка идентифицировать вас в списке транзакций среди миллиона других покупателей.

Для исследования был использован список транзакций, включающий названия и местоположение магазинов, а также дату и сумму покупки. Покупки, совершённые с одной банковской карты, были отмечены одним и тем же id. Во время работы над проектом исследователи пробовали разное количество опорных точек, от двух до пяти. Даже при использовании двух точек без информации о стоимости покупки идентификация человека становится возможной в 40% случаев. Использование пяти точек приводит к результатам, близким к 100%.

Встал вопрос — каким образом можно было бы изменить набор данных, чтобы он всё ещё представлял интерес с точки зрения экономистов и маркетологов, но при этом улучшал приватность покупателей. Для этого исследователи пробовали делать информацию менее точной, укрупнив временной промежуток покупки до недели, а место покупки обобщив до 150 магазинов на определённой территории. И всё равно по четырём опорным точкам, у которых стоимость покупки указана с точностью 50%, оказалось возможным выделить человека из общего набора транзакций с вероятностью 70%.

Современные средства обработки больших данных позволяют из такой, казалось бы, обезличенной информации, как база покупок, или база перемещений и использования мобильных телефонов, строить неожиданно точные выводы. Пожалуй, обычным гражданам опасаться таких возможностей не стоит. Но и не нужно питать иллюзий по поводу вашей анонимности, если вам по каким-то причинам это важно. Особенно, когда вы активно пользуетесь социальными сетями, мобильным телефоном и банковскими картами.
Вячеслав Голованов @SLY_G
карма
133,2
рейтинг 802,6
Редактор GeekTimes
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое

Комментарии (21)

  • +5
    Даже в абстракте написано, что не «установить личность», а «uniquely reidentify». То есть личность и так уже есть и надо только найти действия этого человека в списке. Имея некие дополнительные якоря, типа тех самых чеков, фотографий завтраков и т.п.

    • 0
      Только мне кажется, что задача стоит обратная: имея несколько якорей (покупки, завтраки и т.п.) выбрать соответствующую им личность (карту) из списка.
      • 0
        Мы примерно об одном и том же.
        Да, надо выбрать карту из списка. Но список покупок обезличенный, у вас только айди карт, даты и места покупок. Потому об установлении личности речь не идёт. Сама личность у вас уже есть, некий Скотти (если в терминологии авторов статьи). Там, кстати, есть такие забавные вещи как влияние пола на вероятность идентификации…
        • 0
          А, понятно. Я думал, все данные по картам известны и было непонятно, зачем именную карту пере-привязывать к человеку по покупкам. А в статье речь идет, оказывается, об анонимных данных и их де-анонимизации. Тогда да, вы все правильно сказали.
  • 0
    Данный алгоритм не принимает во внимание тот факт что человек который скрывается — находится в стрессовой ситуации психологически и скорее всего не будет себя вести как раньше. Если я раньше брал брендовые вещи, то когда я в бегах, это будет маловероятно. Равно как и мои походы в ресторан за стейком. Как и мои покупки в Steam. И уж точно мне будет не до оперы или балета.
    Собственно это обесценивает алгоритм. Вот если бы они ещё вычислили дельту изменения в покупательском проведении во время стрессовой ситуации — тогда бы это было эпично.
    • 0
      Если человек скрывается и при этом вовсю пользуется банковской карточкой, то я уж и не знаю…
      Тут же первейшее дело — обналичить все что только можно.
    • 0
      По изменению в покупательском поведении можно даже беременность вычислить… ;)
  • 0
    Там случайно не используется тот факт что в разных штатах США свои налоги на разные категории товаров? В таком случае этот алгоритм будет только там и работать.
  • 0
    Непонятно. Я вот вчера четыре покупки сделал по карте в разных интернет-магазинах. Причём, карта не на моё имя. Как это поможет установить мою личность?
  • 0
    Сплошная вода без примеров в стиле «шеф, всё пропало». Это технической ресурс, а не для американских домохозяек.
    Почитал оригинал, там немного о другом.
    Речь о том, что зная что некто позавчера ел пирожное в кондитерской, а вчера ходил в рестаран, и зная только примерный географический район, можно найти id этого человека среди миллионов других транзакций и далее по нему отфильтровать все прошлые и будущие его покупки и его расходы.
    Непонятно только у кого есть доступ к таким данным. Если ты Visa или Mastercard, то ты и так знаешь всё о своих клиентах, и эти алгоритмы не нужны. Если ты платёжный шлюз, то через тебя проходит лишь малая часть транзакций.
  • 0
    1) Никогда не выбрасываю чеки и прочие бумажки, на которых есть мои данные. Я их уничтожаю или на работе в шредере, или дома сжигаю.
    2) Никогда не фотографирую еду и свежие покупки, не сообщаю о них в соцсетях.
    3) Имею несколько карт и стараюсь делать покупки равномерно с нескольких.

    Я один такой параноик?
    • 0
      Вместо третьего пункта лучше снимайте наличку в разных местах, и делайте покупки за наличку.
      • 0
        Я имею в виду онлайн-магазины. Наличку вообще снимаю редко. В последнее время даже чаще закидываю на счёт для оплаты всяких услуг (интернет, телефон) и онлайн-покупок. Налички стало больше в условиях кризиса почему-то.
    • 0
      Зачем шредер? Можно же зажигалкой нагреть чек, термобумага чернеет в мгновение.
      • 0
        Пластиковые пакеты с наклееным моим адресом, телефоном и прочими данными (посылки из братского Китая, например) так не уничтожить. И сжигать их дома сильно вонюче. Так что я их складирую, а потом оптом отношу на работу и в шредер.
        • 0
          Достаточно острым ножичком отодрать наклейки с адресом доставки и штрих кодом. И потом пакеты использовать в других целях или утилизировать как обычные бытовые отходы.
          • 0
            Я не знаю, чем они там клеят, но отдирать их удаётся только мелкими кусочками. Очень трудоёмко и медленно. С больших пакетов для бытовых целей я наклейки ещё отдираю, а мелкие отправляются в шредер целиком.
      • 0
        А я просто всю пачку окунаю в теплую воду, и через несколько минут буквы начинают плыть, а бумага размокать и превращаться в кашу.
        • 0
          Даже под скотчем?
          • 0
            У меня под скотчем ниразу не было :(
            • 0
              А мне пакеты вечно приходят сплошь перемотанные скотчем, заклеенные, иногда явно вскрытые (но всё содержимое на месте).
              Впрочем, я же «неблагонадёжный», вот и шмонают…

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.