Дезоксирибонуклеиновая кислота (ДНК) представляет собой природную систему хранения информации. И, как и прочие творения природы, эта система по эффективности превосходит всё, что ранее пытался создать человек. Однако недавно кое-что поменялось.
ДНК состоит из комбинаций четырёх азотистых оснований: аденина, гуанина, цитозина и тимина. Обозначенные буквами A, G, C и T, эти основания группируются в определённой последовательности, создавая "чертежи" для каждого живого организма.
И эта система хранения информации обладает невероятной по современным меркам плотностью: один грамм ДНК способен сохранить в себе до 215 петабайт (215 миллионов гигабайтов) данных. Получается, всё содержимое Интернета может поместиться в обувной коробке, если бы её доверху заполнили нитями ДНК.
Недавно учёные продемонстрировали способ сделать это хранилище ещё более плотным.
Исследователи из Иллинойсского университета в Урбане-Шампейне удвоили и без того невероятную ёмкость "памяти" ДНК, добавив дополнительные буквы в её "алфавит". Они также разработали новый способ её "чтения".
Такая система представляется очень привлекательным потенциальным решением для хранения огромных объёмов данных, которые ежедневно производит современное общество.
Наряду с естественными A, G, C и T команда добавила семь дополнительных "букв" в ДНК. Они представляют собой химически модифицированные нуклеотиды. Такой подход позволил создать больше разнообразных комбинаций "букв". Это, в свою очередь, позволило хранить больше информации в том же объёме физического пространства.
"Представьте себе английский алфавит, – объясняет Сейедкасра Табатабаи (Seyedkasra Tabatabaei), соавтор исследования из Института передовых наук и технологий Бекмана. – Если бы у вас было только четыре буквы, вы могли бы составить столько-то слов. Если бы у вас был полный алфавит, вы могли бы создавать неограниченное количество комбинаций слов. То же самое и с ДНК. Вместо того чтобы преобразовывать нули и единицы в A, G, C и T, мы можем преобразовать нули и единицы в A, G, C, T и семь новых букв в алфавите хранилища".
Конечно, добавление дополнительных нуклеотидов означает, что существующие системы обратного считывания данных не распознают их, поэтому исследовательская группа также разработала новую систему считывания.
Для "чтения" нить ДНК провели через нанопоры в специально разработанном белке, который может обнаруживать отдельные единицы независимо от того, являются ли они природными или синтетическими. Затем алгоритмы машинного обучения декодируют считанную таким образом информацию.
Учёные испробовали 77 различных комбинаций одиннадцати нуклеотидов. Разработанная система считывания смогла правильно определить каждую из них. При этом структура глубокого обучения, используемая разработчиками как часть метода идентификации различных нуклеотидов, является универсальной. Это позволит использовать новый подход во многих других приложениях.
Есть и ещё один плюс. Новый метод повышает не только плотность, но и скорость записи данных. Последняя в случае ДНК происходит довольно медленно. Новая система примерно вдвое сократила время, необходимое для записи информации в нити ДНК.
Отметим, что системы хранения данных в ДНК разрабатывают уже довольно давно, но учёным пока не удаётся получить систему, которая могла бы составить достойную конкуренцию существующим.
Однако эта работа приблизила человечество ещё на один шаг к получению жизнеспособной системы хранения данных на основе ДНК. Впрочем, даже авторы нынешнего исследования признают, что предстоит проделать ещё много работы.
Статья американских химиков была опубликована в журнале Nano Letters 25 февраля 2022 года.
Ранее мы рассказывали о том, как навечно записать в стекло сотни терабайт информации с помощью лазера, разместить бит информации в одном атоме, а также об устройстве хранения данных, сделанном из яичной скорлупы.
Больше интересных новостей из мира науки и технологий вы найдёте в разделе "Наука" на медиаплатформе "Смотрим".