Владельца банковской карты можно выделить из миллионного списка всего по четырём покупкам

    image

    Исследователи из MIT разоблачили несколько мифов о приватности в современном обществе. Они установили, что даже неполные данные о четырёх покупках, совершённых при помощи банковских карт, позволяют установить личность человека в 90% случаев. Необходимо знать только даты и места покупок. Эти данные сравнивались со списком транзакций за три месяца, совершённых более чем миллионом человек.

    Более того, если воспользоваться грубыми данными о ценах покупок (стоимость покупки с точностью до 50%), то количество точек привязки сокращается до трёх, а точность вырастает до 94%. То есть, к примеру, вооружившись одним выброшенным вами чеком, одной фотографией вашего завтрака в кафе из Instagram и одним вашим твитом с сообщением о покупке нового гаджета, можно почти наверняка идентифицировать вас в списке транзакций среди миллиона других покупателей.

    Для исследования был использован список транзакций, включающий названия и местоположение магазинов, а также дату и сумму покупки. Покупки, совершённые с одной банковской карты, были отмечены одним и тем же id. Во время работы над проектом исследователи пробовали разное количество опорных точек, от двух до пяти. Даже при использовании двух точек без информации о стоимости покупки идентификация человека становится возможной в 40% случаев. Использование пяти точек приводит к результатам, близким к 100%.

    Встал вопрос — каким образом можно было бы изменить набор данных, чтобы он всё ещё представлял интерес с точки зрения экономистов и маркетологов, но при этом улучшал приватность покупателей. Для этого исследователи пробовали делать информацию менее точной, укрупнив временной промежуток покупки до недели, а место покупки обобщив до 150 магазинов на определённой территории. И всё равно по четырём опорным точкам, у которых стоимость покупки указана с точностью 50%, оказалось возможным выделить человека из общего набора транзакций с вероятностью 70%.

    Современные средства обработки больших данных позволяют из такой, казалось бы, обезличенной информации, как база покупок, или база перемещений и использования мобильных телефонов, строить неожиданно точные выводы. Пожалуй, обычным гражданам опасаться таких возможностей не стоит. Но и не нужно питать иллюзий по поводу вашей анонимности, если вам по каким-то причинам это важно. Особенно, когда вы активно пользуетесь социальными сетями, мобильным телефоном и банковскими картами.
    Поделиться публикацией
    Никаких подозрительных скриптов, только релевантные баннеры. Не релевантные? Пиши на: adv@tmtm.ru с темой «Полундра»

    Зачем оно вам?
    Реклама
    Комментарии 22
    • +5
      Даже в абстракте написано, что не «установить личность», а «uniquely reidentify». То есть личность и так уже есть и надо только найти действия этого человека в списке. Имея некие дополнительные якоря, типа тех самых чеков, фотографий завтраков и т.п.

      • 0
        Только мне кажется, что задача стоит обратная: имея несколько якорей (покупки, завтраки и т.п.) выбрать соответствующую им личность (карту) из списка.
        • 0
          Мы примерно об одном и том же.
          Да, надо выбрать карту из списка. Но список покупок обезличенный, у вас только айди карт, даты и места покупок. Потому об установлении личности речь не идёт. Сама личность у вас уже есть, некий Скотти (если в терминологии авторов статьи). Там, кстати, есть такие забавные вещи как влияние пола на вероятность идентификации…
          • 0
            А, понятно. Я думал, все данные по картам известны и было непонятно, зачем именную карту пере-привязывать к человеку по покупкам. А в статье речь идет, оказывается, об анонимных данных и их де-анонимизации. Тогда да, вы все правильно сказали.
      • 0
        Данный алгоритм не принимает во внимание тот факт что человек который скрывается — находится в стрессовой ситуации психологически и скорее всего не будет себя вести как раньше. Если я раньше брал брендовые вещи, то когда я в бегах, это будет маловероятно. Равно как и мои походы в ресторан за стейком. Как и мои покупки в Steam. И уж точно мне будет не до оперы или балета.
        Собственно это обесценивает алгоритм. Вот если бы они ещё вычислили дельту изменения в покупательском проведении во время стрессовой ситуации — тогда бы это было эпично.
        • 0
          Если человек скрывается и при этом вовсю пользуется банковской карточкой, то я уж и не знаю…
          Тут же первейшее дело — обналичить все что только можно.
          • 0
            По изменению в покупательском поведении можно даже беременность вычислить… ;)
          • 0
            Там случайно не используется тот факт что в разных штатах США свои налоги на разные категории товаров? В таком случае этот алгоритм будет только там и работать.
            • 0
              Непонятно. Я вот вчера четыре покупки сделал по карте в разных интернет-магазинах. Причём, карта не на моё имя. Как это поможет установить мою личность?
              • 0
                Сплошная вода без примеров в стиле «шеф, всё пропало». Это технической ресурс, а не для американских домохозяек.
                Почитал оригинал, там немного о другом.
                Речь о том, что зная что некто позавчера ел пирожное в кондитерской, а вчера ходил в рестаран, и зная только примерный географический район, можно найти id этого человека среди миллионов других транзакций и далее по нему отфильтровать все прошлые и будущие его покупки и его расходы.
                Непонятно только у кого есть доступ к таким данным. Если ты Visa или Mastercard, то ты и так знаешь всё о своих клиентах, и эти алгоритмы не нужны. Если ты платёжный шлюз, то через тебя проходит лишь малая часть транзакций.
                • 0
                  1) Никогда не выбрасываю чеки и прочие бумажки, на которых есть мои данные. Я их уничтожаю или на работе в шредере, или дома сжигаю.
                  2) Никогда не фотографирую еду и свежие покупки, не сообщаю о них в соцсетях.
                  3) Имею несколько карт и стараюсь делать покупки равномерно с нескольких.

                  Я один такой параноик?
                  • 0
                    Вместо третьего пункта лучше снимайте наличку в разных местах, и делайте покупки за наличку.
                    • 0
                      Я имею в виду онлайн-магазины. Наличку вообще снимаю редко. В последнее время даже чаще закидываю на счёт для оплаты всяких услуг (интернет, телефон) и онлайн-покупок. Налички стало больше в условиях кризиса почему-то.
                    • 0
                      Зачем шредер? Можно же зажигалкой нагреть чек, термобумага чернеет в мгновение.
                      • 0
                        Пластиковые пакеты с наклееным моим адресом, телефоном и прочими данными (посылки из братского Китая, например) так не уничтожить. И сжигать их дома сильно вонюче. Так что я их складирую, а потом оптом отношу на работу и в шредер.
                        • 0
                          Достаточно острым ножичком отодрать наклейки с адресом доставки и штрих кодом. И потом пакеты использовать в других целях или утилизировать как обычные бытовые отходы.
                          • 0
                            Я не знаю, чем они там клеят, но отдирать их удаётся только мелкими кусочками. Очень трудоёмко и медленно. С больших пакетов для бытовых целей я наклейки ещё отдираю, а мелкие отправляются в шредер целиком.
                          • 0
                            Отдираю ярлыки с моими данными, крошу их вручную и в мусорку. Да, и самое главное, в мусорном ведре их надо раскидать так, чтобы они не кучковались <>параноя 80 lvl <>:)
                          • 0
                            А я просто всю пачку окунаю в теплую воду, и через несколько минут буквы начинают плыть, а бумага размокать и превращаться в кашу.
                            • 0
                              Даже под скотчем?
                              • 0
                                У меня под скотчем ниразу не было :(
                                • 0
                                  А мне пакеты вечно приходят сплошь перемотанные скотчем, заклеенные, иногда явно вскрытые (но всё содержимое на месте).
                                  Впрочем, я же «неблагонадёжный», вот и шмонают…

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.