company_banner
31 марта в 12:33

Куда приведет нас бэкап? Нестандартные хранилища данных

image


Сегодня традиционно отмечается День бэкапа. Но однажды он исчезнет. К тому времени вся информация до последнего байта будет резервироваться автоматически. Возможно, тогда изменятся и способы бэкапа. Пока мы только на пути к этому светлому будущему и всячески приближаем его наступление: недавно мы запустили Icebox и Hotbox на базе Облака для бизнеса. Icebox — это хранилище для холодных данных (бэкапов, логов и прочих редко используемых, но ценных вещей). И да, там есть WebDAV. Hotbox — это хранилище для горячих данных (аналог Амазон S3), оно создано для тех, кому нужно не только хранить большие объемы данных, но и часто запрашивать их.


Технологии хранения информации не остановились в развитии — нас ждут необычные хранилища, создаваемые прямо сейчас в научных лабораториях. Облака никуда не исчезнут, вот только информация будет храниться совсем на других носителях.


Запись в ДНК


image
Исследователи из Лаборатории молекулярных информационных систем сохранили 200 мегабайт данных в ДНК — новый рекорд!


Компьютерные данные можно переместить в основу самой жизни — ДНК. Молекулы ДНК могут потенциально хранить весь объем мировой цифровой информации — уже сейчас это 1,1 зеттабайта (1021) данных — примерно в 9 литрах раствора в течение тысячелетий.


В природе молекулы ДНК несут генетические инструкции, управляющие функционированием живых организмов. Емкость ДНК ошеломляет по сравнению с самыми передовыми электронными системами хранения. Закодированную в ДНК информацию в экзабайт данных теоретически можно хранить в объеме, который занимает одна песчинка.


Эксперименты, проведенные учеными из Европейского института биоинформатики в Хинкстоне (Англия) в 2013 году и в 2012 году в Гарварде, показали, что можно хранить файлы данных в ДНК, а затем читать информацию в цифровом виде. Исследовательские группы из Университета штата Иллинойс и Вашингтонского университета, основываясь на этой работе, смогли сохранить четыре небольших файла изображений, а затем восстановить их с помощью специального идентификатора файлов.


Биологи из Гонконга сумели внедрить в клетку бактерии E.coli синтетическую ДНК с несколькими килобайтами зашифрованной информации. Для хранения данных использовалась четверичная система счисления, по количеству нуклеотидов. Данные (текст) переводились в четверичную систему, а затем «шифровались» цепочкой нуклеотидов.


С тех пор показатели емкости ДНК постоянно увеличивались за счет изменения подхода: вместо живой клетки использовалась синтетически сгенерированная молекула, а вместо четверичной системы — бинарная.


ДНК — замечательная среда для долговременного хранения. Если на первых экспериментах нужно было поддерживать холод и сухость, то в последующих опытах информацию удавалось сохранить при комнатной температуре. А если добавить ДНК в кварцевый шарик и хранить при температуре -18 °C, то информация будет сохранена на миллионы лет.


Почему прямо сейчас не строят дата-центры, внутри которых будут чашки Петри? Оборудование для работы с ДНК стоит непомерно дорого (стоимость кодирования информации в ДНК оценивается примерно в $ 12 400 за мегабайт, стоимость считывания — $ 220 за 1 мегабайт), однако стоимость секвенирования или «считывания» генетического кода падает быстрее, чем стоимость компьютерной памяти, и технологии создания синтетической ДНК продолжают развиваться. Но не решена другая важная проблема — скорость записи и считывания информации занимает несколько часов.


Кварцевое стекло


image


ДНК с кварцем обеспечивает удивительное долголетие записанной информации. Кварц сам по себе потрясающее вещество и обеспечивает защиту и хранение данных без помощи экспериментов с нуклеотидами. Диск из кварцевого стекла, не превосходящий размерами CD-диск, потенциально может вместить несколько сотен терабайт информации, при этом выдерживает температуру до 1000 °C и имеет практически неограниченный срок хранения (около 300 млн лет). Ученым из университета Саутгемптона удалось успешно записать и считать информацию в кварцевом стекле по аналогии с CD-диском, создавая точки (углубления) на поверхности стекла.


Hitachi разрабатывает технологию создания в стекле 50 двусторонних слоев с помощью фемтосекундного лазера, очень быстро меняя фокусировку на разных слоях. В то же время Western Digital и Seagate работают над дисками, использующими технологию термоассистируемой магнитной записи, комбинирующей магнитное чтение и магнитооптическую запись, с помощью которой можно будет создать диски формата 3,5” с емкостью до 60 ТБ.


Хранение данных в нейронах


image


Почему бы не подглядеть устройство хранения информации, созданное самой природой? Наш мозг является первым долговременным «устройством» хранения информации — по крайней мере, мы точно знаем, что он работает. А значит, повторив работу мозга, сможем по аналогичной методике записывать информацию.


Человеческий мозг состоит приблизительно из 100 миллиардов нейронов. Нейрон соединяется с другими нейронами через примерно 1000 взаимосвязей, или синапсов, таким образом, в человеческом мозге существует около 100 триллионов связей, которые в основном выполняют работу по хранению данных. Ученые предполагают, что человеческий мозг может хранить до 1 петабайта данных, используя только 20 ватт непрерывной мощности. На самом деле, мы не можем эффективно пользоваться этим огромным хранилищем, потому что мозг все время занят выполнением основных моторных функций, которые необходимы нашему организму, чтобы остаться в живых.


Нейробиологи научились воздействовать на сеть нейронов, заставляя их принимать то или иное состояние под воздействием точечных электроимпульсов. Ученые из Тель-Авивского университета использовали пикротоксин (активный стимулятор центральной нервной системы), чтобы зафиксировать паттерны в живой сети нейронов.


image
Нейроны активизируются в момент формирования приятных воспоминаний


Для создания совместно работающих групп нейронов, функционирование которых лежит в основе процессов обучения, другая группа ученых использовала технологию оптогенетики, которая позволяет произвольно активировать популяции нервных клеток с помощью облучения мозга светом определенной волны.


Многократная искусственная активация нейронных групп позволяет создать стабильные группы клеток, которые являются основной памяти. Воздействуя методами оптогенетики, удалось записать в мозг искусственные воспоминания.


Хранение информации в газе


image


Звучит абсурдно. Газ всегда пытается убежать из любого контейнера, в котором хранится, а молекулы ведут себя хаотично, передвигаясь с большой скоростью. Скорость, температура, давление и объем не остаются неизменными в газе, поэтому нельзя использовать эти параметры для записи информации.


Однако можно передавать информацию за счет смеси различных газов. Наше обоняние — это уже процесс считывания информации, позволяющий обнаружить множество различных органических соединений. Собаки используют запахи в качестве универсального источника данных об окружающем мире.


Раньше считалось, что человек может различать только около 10 000 различных ароматов, в то время как собаки имеют в 1000–10 000 раз более чувствительное обоняние. Однако группа исследователей из Рокфеллеровского университета утверждает, что человеческий нос действительно способен различать порядка триллиона различных ароматов. И это, вероятно, только нижний предел потенциального количества обонятельных паттернов, которые могут различать люди.


Раз человеческая обонятельная система намного превосходит другие чувства по числу различных стимулов, которые она может различать, значит ее (или цифровой аналог) можно использовать для считывания различной информации. Состав газа можно использовать для шифрования определенного вида данных. Реакция между газами также является достаточно предсказуемым фактором, чтобы на ее основе передавать или хранить информацию.


Маркировка ароматической композиции позволяет использовать запахи для передачи информации: летучие химические вещества создают различные виды запахов, каждому из которых можно присвоить метку цифровых данных.


Хранение везде


image
Сканирующий туннельный микроскоп


Раньше считалось, что будущее компьютерной памяти заключается в голографической технологии, сохраняющей цифровые данные с высокой плотностью внутри кристаллов. Однако перспективные исследования, использующие электрон и ядро атома, показывают принципиальную возможность сохранения информации практически в любом объекте.


Сейчас один бит в обычных жестких дисках «занимает» миллион атомов. В новой системе удалось создать стабильный магнит из одного атома вещества (гольмия) и превратить два таких магнита в «жесткий диск», способный хранить два бита информации. В теории всего в одном грамме гольмия можно сохранить около 456 экзабайт данных.


В эксперименте были использованы атомы гольмия на подложке из оксида магния при температуре -268 градусов Цельсия. Ученые изменяли направление магнитного поля с помощью электрического импульса от сканирующего туннельного микроскопа. Считывать данные ученые могли, используя тот же микроскоп. Метод теоретически позволяет увеличить плотность записи в тысячу раз.


Воскрешение старых технологий


image


Всегда можно усовершенствовать старую технологию и повторять этот процесс снова и снова. С середины девяностых годов магнитная лента умирала, постепенно вытесняемая жесткими дисками и твердотельными накопителями. Громоздкая лента с множеством хрупких движущихся частей для перемотки, могла только рассыпаться в прах… Но она не умерла. Оказалось, что лента позволяет дешевле, чем при применении SSD и HDD, хранить данные. А при определенной доработке напильником, она может соответствовать современным стандартам хранения информации.


Еще в 2013 году IBM совместно с Fujifilm удалось записать 220 Тб на одну бобину магнитной ленты; а ведь ленты впервые использовали еще в 1952 году. Технология подходит для тех данных, работа с которыми не требует высокой скорости. Чтобы повысить надежность, исследователи использовали современные системы управления сервоприводами, которые позволяют перемещать магнитную головку в пределах 6 нанометров, а также улучшили алгоритм обработки сигналов и коррекции ошибок.




Возможно, одна из предложенных в сегодняшнем материале технологий станет стандартом де-факто. Вероятно также, что учесть все направления развития нельзя, и через несколько лет появится неожиданная идея, которая перевернет наши представления о работе с резервированием данных. При всех раскладах футуристические методы сохранения информации изменят мир уже очень скоро.

Автор: @randall

Комментарии (8)

  • 0
    Давайте делать ставки через сколько лет на рынке появятся компании, предоставляющие услугу сохранения вашего семейного фото-видео-архива на фикусе или дубе. Забавно, наверно, будет археологам через пару тысяч лет выковыривать из генома флоры и фауны фрагменты домашнего видео, ленты твиттера и инстаграма.
    Надеюсь никто не додумается сохранить дедовский семейный альбом в геноме детей… хотя… чёрт! Я не нарочно! Забудьте об этом!
    • 0
      По разным оценкам от 20% до 90% человеческой ДНК непонятно зачем нужно: http://elementy.ru/nauchno-populyarnaya_biblioteka/432625

      Так что может быть там, среди остатков ДНК ретровирусов и прочего хлама есть и полезная информация, кем-то когда-то записанная?
      • +1

        Угу. Сервис-мануал, спецификация и дефолтная прошивка для тельца.

  • 0
    Так они не только в ДНК запишут фотографии, еще и листья будут формы портрета.
  • +1

    Основная проблема в хранении информации это даже не как ее записать, а как ее потом прочесть. Запишу я, допустим, для потомков кварцевый диск в одном формате, а в будущем его сменит другой формат, и прочесть этот диск станет проблемой. А даже если прочтут, надо еще чтобы формат файлов поддерживался. В общем, нюансов много. Гарантировано прочесть (при сохранении языка и его письменности) уже даже через пару сотен лет можно наверное только старые добрые микрофильмы, для этого достаточно обычной линзы. Для сохранности можно выгравировать их лазером в кварцевом стекле.

    • 0
      Если закрыть глаза на возможную смерть цивилизации, то…

      сдается мне что проблема чтения и интерпретации форматов в будущем будет решаться автоматически, хотя бы с помощью технологий виртуализации, в т.ч. каскадной. Я говорю не только про операционные системы и компьютеры, которые будут хранить и воспроизводить (обеспечивать доступ) файлы, но и интерфейсы взаимодействия с пользователем — как минимум новые интерфейсы позволяют делать то же что позволяли и старые (книги -> фото -> видео -> виртуальная реальность — … ), так что наши внуки буду смотреть дедовские видеофайлы, запустив старое приложение в виртуальной машине, запущенной в чем то новом, несовместимом со старыми, в виртуальной реальности (или к примеру контролируемом машиной нейросне), в том самом старом виде — плоского экрана…

      ну да, для индексации старого видео, ИИ будет буквально смотреть эти видеофайлы, запустив его в виртуальной машине, ускорив течение времени в ней по максимуму.

      Или просто включим логику — как только у общества появится проблема получения доступа к старым данным, начнется профилактика этой проблемы для будущих поколений. Как минимум этот вопрос уже звучит.
  • –4
    Можно еще хранить данные на Бесконечной флешке
  • 0
    Ученые предполагают, что человеческий мозг может хранить до 1 петабайта данных, используя только 20 ватт непрерывной мощности.

    О привет Джони мнемоник!
    На самом деле, мы не можем эффективно пользоваться этим огромным хранилищем, потому что мозг все время занят выполнением основных моторных функций, которые необходимы нашему организму, чтобы остаться в живых.

    Кинул сериальчик больше допустимого — печень отключилась ))

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое