Если в ближайшие десятилетия мы полностью перейдем на хранение информации на флеш-памяти, то есть на таких накопителях, как SSD или флешки, то к 2040 году количество данных станет настолько велико, что для их хранения перестанет хватать всего кремния, который можно использовать для создания чипов памяти. Поэтому не удивительно, что исследователи, чтобы предотвратить этот кризис, изучают материал для хранения, на который опирается сама жизнь: ДНК.

В теории, это вещество может содержать огромное количество информации — более одного эксабайта (одного миллиарда гигабайт) на кубический миллиметр, при этом срок хранения составит тысячелетия. К примеру, магнитная лента, которая служит основой большинства цифровых архивов уже почти сотню лет, может сохранять данные около 30 лет и при этом требует особых условий хранения. При этом ДНК в 700 000-летних окаменелостях все еще можно секвенировать, то есть установить последовательность нуклеотидов.

Однако одним из препятствий на пути превращения ДНК в накопитель в вашем компьютере является медленный, дорогостоящий и подверженный ошибкам процесс создания или синтеза новых последовательностей ДНК, соответствующих желаемому коду.

«Синтез ДНК является главным узким местом в отношении стоимости, точности и скорости записи», — говорит Ольгица Миленкович, теоретик кодирования в Университете Иллинойса в Урбана-Шампане и соавтор нового исследования. Она и ее коллеги предложили новое решение: вместо того, чтобы синтезировать нужную ДНК с нуля, можно просто пометить существующие молекулы ДНК узорами «засечек» для кодирования данных.


«Стандартная» перфокарта.

Авторы нового исследования говорят, что вдохновлялись перфокартами — по сути простейшими хранителями информации, представляющими собой кусок плотной бумаги, в нужных местах которого были выбиты (перфорированы) отверстия, которые и считывали ранние компьютеры. Ближе к 70-ым годам перфокарты были вытеснены магнитной записью, подробнее почитать об этом можно в этой статье.

Предыдущие подходы к хранению данных в генокоде рассматривали четыре ключевых компонента ДНК, так называемые основания — аденин, тимин, цитозин и гуанин — как биты, 1 и 0, которые кодируют цифровые данные. Например, каждое основание может быть назначено для представления пары битов: 00, 01, 10 или 11. Но вместо того, чтобы переводить последовательность битов в код ДНК и синтезировать соответствующие цепочки оснований, новый метод рассматривает существующий генетический материал как аналог бумаги для перфокарт.

В нем ферменты применяются как «устройства, создающие дыры», говорит ведущий автор исследования Касра Табатабаи, биолог из Урбана-Шампан. В этом случае «дыры» — это разорванные связи между молекулами, составляющими основу ДНК. Наличие связи означает 1, а ее отсутствие символизирует 0.

Наиболее интересным аспектом этого исследования является то, как оно опирается на природу, говорит Бренда Рубенштейн, химик-теоретик из Университета Брауна, которая не принимала участия в новой работе. Исследователи «позволяют этим ферментам создавать засечки — по сути делать то, что для них наиболее естественно — для хранения информации», — говорит она.


Структура ДНК.

Чтобы точно разместить засечки, команда нагревала двухцепочечные молекулы ДНК — представьте себе каждую из них в виде витой лестницы с перекладинами, сделанными из пар оснований, и вертикальными перилами из сахаров и фосфатов — пока они не развалились на две части, создав тем самым одноцепочечные молекулы ДНК

Затем ученые развернули получившиеся одноцепочечные молекулы ДНК, каждая длиной всего 16 оснований, при этом их концы служат направляющими, сообщая ферментам, как и где действовать. В ДНК каждое основание соединяется с молекулой сахара и фосфатной группой, образуя соединение, известное как нуклеотид. Ферменты, используемые в новой технике, разрывают связь, связывающую один нуклеотид с другим, чтобы тем самым создать засечку на «сахаро-фосфатных перилах».

Поскольку этот метод не требует синтеза точных последовательностей ДНК, исследователи говорят, что одним из его ключевых преимуществ является то, что они могут обработать практически любую молекулу ДНК, как своеобразную перфокарту. Например, они экспериментировали с генетическим материалом, полученным из дешевых и легкодоступных штаммов бактерий Escherichia coli (кишечная палочка), чьи последовательности нуклеотидов исследователи знают достаточно хорошо.

Используя нити бактериальной ДНК с 450 парами оснований, каждая из которых может содержать от 5 до 10 засечек, ученые закодировали 272 слова Геттисбергского обращения Авраама Линкольна и 14-килобайтное изображение Мемориала Линкольна. После того, как они поместили эту информацию в ДНК, они использовали коммерческие методы секвенирования, чтобы прочитать файлы, и это у них получилось с идеальной точностью.


Принцип работы нового метода хранения информации в ДНК.

«В течение многих лет люди думали, что молекулярные вычисления являются переносом того, что мы делаем с кремнием, на различные молекулы, что привело к созданию таких сложных устройств, как Rube Goldberg», — говорит Рубенштейн. «Вместо этого новая работа изучила то, как ферменты развивались в течение многих сотен миллионов лет, чтобы использовать их невероятно эффективные природные особенности».

Ученые надеются, что их новая технология в итоге может оказаться намного дешевле и быстрее, чем те, которые основаны на синтезе ДНК. Однако они отмечают, что способы хранения данных в ДНК, основанные на синтезе, все еще предлагают некоторые преимущества — например, примерно в 12-50 раз большую плотность хранения информации, чем их «метод перфокарты». Тем не менее, «самая большая проблема с хранением данных в ДНК сейчас не в плотности, а в стоимости», — говорит Миленкович. «А наши затраты действительно низкие и могут быть еще ниже».

Кроме того, добавляет она, предыдущие методы хранения данных в ДНК должны включать избыточное кодирование последовательностей нуклеотидов, которое помогает избежать потери информации от подверженного ошибкам традиционного синтеза ДНК. Это требование уменьшает объем данных, который фактически можно хранить в искусственно созданных ДНК, сокращая разрыв в плотности хранения между ними и новым методом.




iGuides в Telegram — t.me/igmedia
iGuides в Яндекс.Дзен — zen.yandex.ru/iguides.ru
У нас есть подкаст и его видео-версия