Может ли анализ больших данных помочь в спасении жизни больных?



    Сегодня большие данные в тренде и таком же большом фаворе. Недавно в этой сфере отметился и Ларри Пейдж, который заявил, что будь в открытом доступе больше информации о состоянии здоровья, то благодаря её анализу в следующем году можно будет спасти около 100 000 человек. После Агентства Национальной Безопасности США, Google занимает второе место по объёму хранимых данных. Однако Пейдж, вероятно, несколько поторопился со своим утверждением, особенно в свете того, что крупная программа Google Flu Trends (официальный сайт) продемонстрировала низкую эффективность. Большие данные не являются волшебным инструментом, способным решить все нашим проблемы, и вряд ли Пейджу с их помощью удастся спасти тысячи жизней.

    Вопрос конфиденциальности


    Этому препятствует несколько факторов. Сама по себе идея анализа больших данных ради сохранения здоровья и жизни людей является очень честолюбивой, однако ни в коем случае нельзя считать это простой задачей. Любой вопрос, в котором замешаны персональные данные людей, требует очень продуманной схемы обеспечения доступа к информации со стороны третьих лиц. Предоставление больших данных для анализа требует обязательного обезличивания, чтобы не было возможности сопоставления информации с конкретными людьми.

    Глобализация и повсеместный комплексный сбор информации о населении, по сути, стали чуть ли не само собой разумеющимися. Многие государственные и частные организации ежедневно аккумулируют гигантские объёмы информации о пользователях, в том числе об их поведении в сети. И разработка механизмов регуляции оборота такой информации лежит на государственных организациях. И неизбежные ограничения на распространение личных данных будут являться препятствием и в благом деле своевременного выявления заболеваний на основании медицинских показателей.

    Машинный интеллект как инструмент анализа




    Своим заявлением Ларри Пейдж проиллюстрировал ложную точку зрения о больших данных, характерную для сильных мира сего. Из его слов можно сделать вывод, что именно недостаток публичной информации приводит к смерти людей в результате тех или иных заболеваний. Но это всего лишь эмоции. Вполне вероятно, часть летальных исходов в системе здравоохранения можно предотвратить, если дать нужную информацию правильным людям. Однако необходимо помнить, что открытие такой информации подразумевает предоставление доступа к большим базам данных для различных организаций. При этом нет никаких аргументов в пользу того, что само по себе предоставление доступа обеспечит «встречу» необходимой информации с нужными людьми.

    Раскрытие медицинских данных может быть полезным, но, к сожалению, пока что нет причин считать, что сам по себе автоматизированный анализ больших данных поможет снизить смертность по медицинским причинам. Спекуляции на этой теме обращаются к эмоциям, а не к разуму. Без научной теоретической базы и дальнейших практических шагов, подобный анализ становится бессмысленным.



    К сожалению, мы далеко не всесильны, и наши инструменты компьютерного анализа далеки от совершенства. Даже спустя 60 лет после смерти Алана Тюринга его тест остаётся недоступным для всех претендентов на гордое звание «искусственного интеллекта». Даже последняя громкая попытка с участием программы «Евгений Гусман», имитирующей 13-летнего подростка, обернулась провалом. Тактика, заложенная автором программы в своё детище, схожа с той, что использовалась 42 года назад в программе Parry, которая «прикидывалась» параноидальным шизофреником. Также можно вспомнить о программе Eliza, которую было трудно отличить по стилю общения от врача, придерживающегося роджерианской теории (Теория Карла Роджерса).

    Многие десятилетия неустанно ведутся работы по созданию искусственного интеллекта, а точнее, обучаемой машины. Немало ярчайших умов участвовало в подобных разработках. Вычислительные мощности до недавнего времени росли экспоненциально, а всемирная сеть дала немало примеров взаимодействия между людьми, на которых можно обучать компьютер. И несмотря на всё это, мизерный прогресс доказывает, насколько сложно трансформировать большие объёмы данных в подобие человеческого интеллекта.

    Поэтому, возвращаясь к Пейджу, лучше избегать делать столь громкие заявления о потенциале больших данных. В проекте Google Flu Trends пытались получить информацию о распространении гриппа, собирая данные о случаях, когда люди использовали поисковые запросы со словом «грипп». Но мы снова и снова сталкивались с тем, что компьютеры не способны понять людей и достоверно имитировать особенности нашего поведения.



    В качестве примера, подтверждающего этот тезис, можно привести тот факт, что к 11 сентября 2001 года АНБ владело объёмом разведывательной информации, достаточным для предотвращения катастрофы. Но эта организация просто не смогла вовремя соединить все части мозаики. Разоблачения Эдварда Сноудена подтвердили подозрения о том, что АНБ и Центр правительственной связи (разведслужба Великобритании) постоянно собирают разнообразную информацию о гражданах многих стран. Да и не только они. Разведслужбы не раз уже заявляли, что анализ этих больших данных не раз позволял предотвратить серьёзные террористические атаки, но все эти заявления не выдерживают критики при ближайшем рассмотрении. Учитывая вычислительные мощности, доступные АНБ, им пришлось бы в течение 30 лет обрабатывать с помощью искусственного интеллекта информацию, собранную ещё до эпохи интернета. И нет никаких доказательств, что подобные изыскания дали конкретные результаты. По крайней мере, такой информации нет в публичном доступе.

    Увы, но ситуация такова, что существующие зачатки технологии «искусственного интеллекта» не позволят спасти чьи либо жизни, анализируя большие данные из сферы здравоохранения. Для правильного сопоставления информации необходимо человеческое умение проводить взаимосвязи, а компьютеры пока не обзавелись такой способностью, несмотря на многолетние усилия и финансовые вливания со стороны многих корпораций.

    Постановка диагноза не заключается в простом сопоставлении результатов анализов и текущего состояния организма. Для этого врачи должны задавать пациентам правильные вопросы и принимать решения, влияющие на их жизни. Поэтому анализ больших данных в области медицины только тогда обретёт смысл, когда компьютер сможет самостоятельно «задавать» нужные вопросы и находить на них ответы в массивах информации.
    Метки:
    • +28
    • 7,7k
    • 1
    ASUS Russia 151,20
    Компания
    Поделиться публикацией
    Комментарии 1
    • +16
      Бред какой-то. Как раз эта статья — «сплошные эмоции» вместо фактов. Автор по ходу напрочь лишен экспоненциального мышления. Мол, если за столько десятилетий не смогли создать сильный ИИ, то и не смогут. Хотя причем здесь вообще сильный человекоподобный ИИ?

      Большие данные, которые, вероятно, имел в виду Пейдж и которые потенциально могли бы спасти сотни тысяч жизней, — это не базы поисковых запросов и не ИИ, который якобы должен их «интеллектуально» обрабатывать. Это скорее что-то типа Watson с соответствующей базой знаний, который уже демонстрирует результаты в обработке данных. Имелось в виду, что если бы биомедицинская информация миллионов людей, начиная хотя бы с секвенированных геномов, находилась в открытом доступе, то на основе этих больших данных медицина бы несомненно очень серьезно продвинулась. (Собственно, так оно со временем и будет, хочет этого автор с его скепсисом к «сильным мира сего» типа Пейджа или нет.) 100 тысяч за первый год — возможно, и передергивание, но потенциал здесь реально очень большой. Автор за деревьями ситуативных проблем не видит общего леса — незнание убивает, знания помогают спасать жизни и чем больше таких знаний (релевантных!) доступно для обработки (вовсе необязательно человекоподобным ИИ, биоинформатика развивается и без него), тем лучше в целом для всех.

      Люди, которые сейчас боятся не то что делиться, а даже самостоятельно узнавать генетическую и другую биомедицинскую информацию о себе, — это люди с сознанием прошлого. Они полагают, что для них будет лучше, если они будут закрывать глаза на угрозы, которые могут их убить лет так через 50. Почему? Потому что они глубоко поражены пессимизмом в отношении будущего, не понимают, что за эти 50 лет или даже гораздо раньше человечество вполне может разработать способ устранить или отодвинуть ранее неустранимую проблему, и главное — получение подобных данных может напрямую ускорить получение этого результата. Активные пользователи сервисов типа 23andme руководствуются принципом «Познай себя, чтобы себя изменить» и в целом конструктивно относятся к возможностям коллективного человеческого разума в этом отношении. А противники, вероятно, цепляются за старый мир с его ограничениями — как в доступе к информации, так и в возможностях медицины и других наук и технологий, — и основанными на этих ограничениях социальными отношениями. И они придумывают тысячи оправданий для того, чтобы оставаться в этом старом мире, хотя имхо, все это перечеркивается одним простым аргументом — старый мир убивает человека с вероятностью 100% в предсказуемый и весьма ограниченный срок. Поэтому я предпочту ему «дивный новый», даже если в нем социальные отношения будут отличаться от нынешних, как Амстердам от Кабула (и даже не то что «даже если», но и благодаря такой либерализации и открытости в том числе).

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое