Как стать автором
Обновить

Новое достижение учёных из Microsoft позволит создать эксабайтные диски

Время на прочтение 2 мин
Количество просмотров 15K
Автор оригинала: Liam Tung


Перспектива появления огромных хранилищ данных, основанных на ДНК, стала вполне реальной благодаря новому методу извлечения данных.

Уже сейчас Microsoft видит в синтетической ДНК перспективный носитель информации, который сможет удовлетворить потребности в хранении больших данных. Предыдущие исследования показали, что всего лишь несколько грамм ДНК способны хранить в себе эксабайт данных, при этом срок их хранения составляет около 2000 лет.

Но главным недостатком этой технологии явялется дороговизна и медленность записи, которая включает в себя преобразование нулей и единиц в нуклеотиды. Извлечение данных из ДНК представляет собой секвенирование и обратный перевод файлов в нули и единицы. Поиск и извлечение определенных файлов также является большой проблемой.

Но это осталось в прошлом — ученые из Microsoft Research и Вашингтонского университета впервые получили произвольный доступ к ДНК-носителю в крупном масштабе. Как они объяснили, отсутствие произвольного доступа или возможности выборочного извлечения файлов из ДНК-хранилища приводит к тому, что для нахождения нужных файлов пользователь должен секвенировать и декодировать весь набор данных. Получение произвольного доступа позволит уменьшить количество операций по секвенированию.

Для получения произвольного доступа к ДНК учёные создали библиотеку праймеров, которые прикреплены к каждой последовательности молекулы и используются в качестве мишеней для выбора нужных её фрагментов.

Исследователи также разработали алгоритм для более эффективного декодирования и восстановления данных. Старший научный сотрудник Microsoft Сергей Еханин отметил, что новые алгоритмы более терпимы к ошибкам в написании и чтении последовательностей ДНК, что сокращает секвенирование и обработку данных, необходимую для их восстановления.

В синтетической ДНК было закодировано 200 мегабайт данных, состоящих из 35 файлов объёмом от 29 килобайт до 44 мегабайт. В данных файлах содержатся HD-видео, аудиофайлы, изображения и тексты. Учёные полагают, что метод, который они использовали для случайного доступа, будет масштабироваться до физически изолированных ДНК-пулов, способных вмещать в себя несколько терабайт.
Теги:
Хабы:
+25
Комментарии 27
Комментарии Комментарии 27

Публикации

Истории

Ближайшие события

PG Bootcamp 2024
Дата 16 апреля
Время 09:30 – 21:00
Место
Минск Онлайн
EvaConf 2024
Дата 16 апреля
Время 11:00 – 16:00
Место
Москва Онлайн
Weekend Offer в AliExpress
Дата 20 – 21 апреля
Время 10:00 – 20:00
Место
Онлайн