برخلاف دهه های قبل، حجم قابل ملاحظه ای از داده های دیجیتالی ما هیچ بایگانی فیزیکی ندارند. برای مثال سی دی های قدیمی، بیش از چند دهه عمر نمی کنند. این مساله علاقه مندان به بایگانی و باستان شناسان را حسابی نگران کرده و تبدیل به یک چالش فنی بسیار پیچیده شده است.
شاید در آینده دانش ما درباره اوایل قرن بیست و یکم بسیار کمتر از اطلاعات ما درباره اوایل قرن بیستم باشد. قسمت بسیار زیادی از اطلاعات قرن بیستم هنوز روی چیزهایی مثل کاغذ و فیلم قرار داشته و همچنان قابل دسترسی هستند؛ در حالی که فعالیت های امروز ما کلا به صورت دیجیتال انجام شده و تقریبا همه در فضاهای ابری قرار دارند؛ به نوعی می توان گفت این فعالیت های دیجیتالی متولد شده اند و نه فیزیکی. این فعالیت ها از یک ظرف آنالوگ به یک ظرف دیجیتال منتقل نمی شوند، بلکه به صورت کاملا دیجیتالی به دنیا آمده و می میرند و هیچ رونوشت یا معادل آنالوگی از آنها وجود ندارد.
متخصصان کامپیوتر و داده ها از این دوره داده های گمشده با عنوان ”عصر دیجیتال ناشناخته“ یاد می کنند. بعضی هم ترجیح می دهند از عبارت ”حفره سیاه اطلاعات“ استفاده کنند، زیرا ممکن است در آینده کامپیوترها و برنامه های نرم افزاری قادر به خواندن اطلاعات دیجیتالی که در حال حاضر تولید می کنیم نباشند. آنها نگران اند تمام این داده ها که به نوعی تاریخ دیجیتال قرن ما محسوب می شوند، در آینده قابل بازیابی نباشند.
جالب اینجاست که بسیاری از بزرگ ترین شرکت های جهان و سازمان های داده محور همچنان وابسته به رسانه های ذخیره سازی قدیمی یعنی نوارهای مغناطیسی هستند. در سال ۱۹۵۲ یعنی در اوایل برآمدن عصر جدید محاسبات الکترونیکی، شرکت IBM اولین سیستم ذخیره سازی داده مبتنی بر نوار مغناطیسی را معرفی کرد. نوارهای مغناطیسی اولیه قادر به ذخیره ۲٫۳ مگابایت داده روی هر قرقره موجود در دو نوار مغناطیسی بودند.
«لائورن یانگ»، تهیه کننده سری برنامه های Science Friday و گزارشگر اصلی یک سری سه قسمتی به نام ”File Not Found“ که در آن به بررسی مسائل مرتبط با ذخیره سازی و از دست رفتن داده ها صحبت می شود در این رابطه می گوید تنها یک کارتریج از نوارهای مغناطیسی امروزی قادر به نگهداری صدها ترابایت داده است. تابستان گذشته شرکت IBM ظرفیت نگهداری داده های یک کارتریج را به ۳۳۰ ترابایت افزایش داد، به عبارتی دیگر ۳۳۰٫۰۰۰ گیگابایت در هر کارتریج. شرکت های بزرگی مثل گوگل و آزمایشگاه های فیزیک از جمله Fermilab همگی دارای کتابخانه های بزرگی از نوارهای مغناطیسی با هزاران و هزاران کارتریج هستند.
اگر چه اکثر شرکت ها از تکنولوژی های دیجیتال به عنوان اولین راهکار ذخیره سازی استفاده می کنند، اما در بسیاری از موارد، از نوارهای مغناطیسی به عنوان پشتیبان پشتیبان ها استفاده می شود. این مساله خود به خاطر پدیدار شدن فرمت ها مغناطیسی کامل تر موجب بروز مشکلاتی دیگر و همچنین پدیده bit rot یا پوسیدگی بیت می شود. با گذشت زمان، اطلاعات دیجیتال روی نوار یا سایر رسانه های ذخیره سازی دیجیتال، در صورتی که به درستی ذخیره نشده یا در شرایط بدی قرار بگیرند، فاسد یا پوسیده خواهند شد.
«کری کروس» پروفسور دانشکده مطالعات داده ای در دانشگاه مریلند که نقش فعالی در پروژه نجات و احیای داده های دیجیتال قدیمی مثل بازی های ویدئویی و دنیاهای مجازی دارد، اطلاعات بسیار زیادی در مورد پوسیدگی بیت و همچنین پدیده پوسیدگی نرم افزار دارد؛ در پوسیدگی نرم افزار فایل های قدیمی، بازی ها و سایر داده ها به خاطر منسوخ شدن فرمت ها و عدم امکان خواندن یا تولید مجدد اطلاعات، عملا غیرقابل استفاده می شوند.
رسانه های ذخیره سازی گوناگون طول عمر متفاوتی دارند. در پروژه پروفسور کروس متخصصان روی تعداد بسیار زیادی از فلاپی دیسک های مغناطیسی کار کرده اند و این رسانه ها عمری بین ۱۰ تا ۱۴ سال دارند. رسانه های نوری مثل CD/DVDها عمری کمتر دارند. این مساله تبدیل به مشکل بزرگی در رسانه های ذخیره سازی گوناگون خواهد شد.
یانگ می گوید بعضی از پژوهشگران امید بسیار زیادی به یکی از جدیدترین تکنولوژی های این حوزه دارند یعنی: ذخیره سازی DNA. پژوهشگران راهی برای ذخیره سازی داده در DNA (این مولکول تقریبا ۱ میلیارد ساله) پیدا کرده اند. البته این DNA طبیعی نیست و تماما ساخته دست بشر است.
در این روش جدید، ظرفیت ذخیره سازی با واحد پتابایت اندازه گیری می شود، واحدی متشکل از میلیون ها گیگابایت. تنها یک گرم از DNA قادر به ذخیره سازی تمام بیت داده هایی است که تا به امروز توسط انسان های ثبت شده اند، آن هم در اندازه و وزن چند وانت معمولی.
پروفسور کروس به فوریت مساله واقف است اما در مورد به کار بردن عبارت عصر دیجیتال ناشناخته احتیاط می کند. وی سخنان خود را این طور به پایان می برد: ”خرابه های باستانی بسیار زیادی در جهان وجود دارد و آثار هنری باستانی معیوبی هم از انسان های پیشین به جا مانده است. همواره بقایایی از گذشته باقی خواهند ماند. نمی توانم به محافظت از داده ها به شکل صفر و یک نگاه کنم. حفظ تدریجی (آثار و داده ها) همواره انجام می شود. امیدوارم بتوانیم بخش قابل توجهی از اقیانوس بزرگ داده ها را حفاظت کنیم.“
*گویاای تی