В связи с развитием технологий и ростом объема передаваемых данных, специалисты ищут все новые способы хранения информации. И недавно группа ученых из Колумбийского университета и Нью-Йоркского Центра Генома продемонстрировали новый алгоритм сжатия информации, позволяющий упаковать ее в виде последовательности четырех базовых оснований ДНК. Примечательно то, что этот способ представляет из себя видоизмененный алгоритм, изначально предназначенный для сжатия видео для мобильных телефонов.
Ученые давно выяснили, что молекулы ДНК являются отличным носителем информации благодаря компактности и тому, что они могут сохраняться не поврежденными достаточно долгое время. К примеру, недавно удалось восстановить геном из останков человека возрастом 430 тысяч лет. Таким образом, даже утерянная часть информации, закодированной в ДНК, может быть возвращена.
Для проведения процедуры кодирования в виде последовательности молекулы ДНК ученые отобрали несколько файлов: код простой операционной системы, короткометражный французский фильм 1895 года, изображение подарочной карты Amazon, снимок послания человечества, отправленного на борту космического аппарата Pioneer, и текст одной из научных работ Клода Шеннона. Все эти файлы были собраны в один большой, который при помощи специального алгоритма был разрезан на большое количество коротких, а затем участки файлов были обработаны для преобразования из двоичных данных в код, соответствующий последовательности четырех оснований молекулы ДНК. Плюс алгоритм изменяет файлы и для обратного преобразования. В результате всех этих действий получился список из 72 000 нитей ДНК, каждая из которых состояла из 200 пар оснований. На основе этих данных эксперты компании Twist Bioscience синтезировали искусственную нить ДНК. Восстановление файлов проходило при помощи обычной технологии считывания последовательности цепи ДНК. Восстановленные файлы не содержали ошибок, а операционную систему даже сумели успешно установить. Данный метод сжатия и хранения информации позволяет упаковать 215 петабайт данных в молекулы ДНК весом всего в 1 грамм.
«Мы полагаем, что нам удалось создать устройство хранения данных, имеющее самое высокое значение показателя плотности хранения информации. Максимальная емкость одного основания ДНК составляет два двоичных разряда. Однако потребность включения в ДНК добавочной информации, необходимой для восстановления данных, понижает информационную емкость одного основания до 1.6 разряда, что на 60 процентов больше, чем было достигнуто при помощи других методов, и очень близко к теоретическому верхнему пределу в 1.8 бита на основание».
Несмотря на крайне положительные результаты, на данный момент основным препятствием на пути к применению ДНК для записи информации является высокая стоимость процедуры записи и считывания. Ученые потратили 7000 долларов на синтез ДНК с записью информации и 2000 долларов на их расшифровку.