شگفتانگیزترین دیتاسنترها کاری بیش از ذخیرهسازی دادهها و اطلاعات انجام میدهند. آنها به دانشمندان کمک میکنند بحرانهای اقتصادی را پیشبینی کنند، نقشه جهان را تهیه کنند و حتی زندگی شما را نجات دهند.
محمود حاجزمان: شاید فکر کنید که پایگاه داده تنها مختص دنیای کامپیوتر است، اما به هیچ وجه این طور نیست. پایگاههای داده در علوم مختلفی کاربرد دارند و شگفتانگیزترین آنها کاری بیش از ذخیرهسازی دادهها و اطلاعات را انجام میدهند. آنها برای محققان راههای جدیدی را فراهم میکنند تا پروندههای پلیسی قدیمی را حل کنند، بحرانهای اقتصادی را پیشبینی کنند، نقشه جهان را تهیه کنند و حتی زندگی شما را نجات دهند. با هم نگاهی به 10 پایگاه برتر به انتخاب سایت پاپساینس میاندازیم.
سیستم فهرستنویسی ترکیبی دیانای
تا قبل از سال 1990 / 1369، زمانیکه اداره فدرال آمریکا اقدام به ساخت پایگاه داده اصلی دیانای خود را با نام سیستم فهرستنویسی ترکیبی دیانای با به اختصار CODIS نمود، کارآگاهان عموما بررسیهای دیانای را تنها برای پروندههایی انجام میدادند که در آنها هر دو شواهد صحنه قتل و یک مظنون مشخص را در اختیار داشتند.
اما اکنون پلیس آمریکا میتواند شواهد ژنتیک جمعآوری شده در صحنه جرم را با میلیونها نمونه دیانای معلوم مقایسه کند، جرمهای مشابه را شناسایی کند، مظنونان جدیدی پیشنهاد کند، دو صحنه قتل ظاهرا نامربوط را به یکدیگر ربط دهد، و افرادی را که مدتها است مفقود شدهاند تعیین هویت کند.
اغلب نمونههای این پایگاه داده از مظنونین صحنههای جرم و زندانیان گرفته شده است، اما تحلیلگران پزشکی قانونی به طور فزایندهای مشغول اضافه کردن شواهد ژنتیکی کشف شده از صحنههای جرم، اجساد ناشناس و افراد گمشده به این پایگاه هستند. تا کنون کارآگاهان پلیس آمریکا موفق شدهاند به کمک CODIS بیش از 143 هزار پرونده را حل کنند.
دایرهالمعارف حیات
چهار سال قبل، موسسه اسمیتسونیان، موزه تاریخ طبیعی آمریکا، دانشگاه هاروراد، باغ گیاهشناسی میسوری، آزمایشگاه زیستشناسی اقیانوسی و کتابخانه میراث تنوع زیستی آمریکا به یکدیگر ملحق شدند تا یک مجموعه داده جامع را درباره تمام موجودات زنده روی زمین خلق کنند.
تا کنون محققان این کنسرسیوم اطلاعات مربوط به 40 درصد از 1.9 میلیون گونه شناخته شده سیاره زمین را جمعآوری، مرتب و بررسی کردهاند. در این مجموعه میتوان اطلاعات جالبی مانند مشاهدات توصیفی از رفتار شبانه لمورهای پرنده، و یا نقشه توزیع قارچ سیاه عسل را پیدا کرد.
محققان اطلاعات را از صدها منبع مختلف جمعآوری کردهاند، آن را به یک قالب واحد و سازگار تبدیل کردهاند، و بر اساس گونههای منفرد آن را سازماندهی کردهاند. ترکیب کردن دادههای مجزا و مختلف به صورت یک پایگاه داده واحد و قابل جستجو امکان مشاهده ارتباطات جدید بین اشکال مختلف حیات را فراهم کرده است. با جستجوی الگوهای طول عمر یا شباهتهایی در مقاومت در مقابل بیماری، و انجام این جستجو در طیف گسترده صفحات دایرهالمعارف حیات، زیستشناسان قصد دارند تا گونهها و ژنهای جدیدی را کشف کنند که به مطالعات آنها در خصوص افزایش طول عمر، توسعه واکسنها و سایر تحقیقات پزشکی کمک کند. با سرعت فعلی، دایرهالمعارف حیات (EOL) دادههای مربوط به تمام گونههای گیاهی، جانوری، حشرات و میکروبها را تا سال 2017 / 1396 جمعآوری خواهد کرد.
FAOSTAT
نظارت و پیگیری بر منابع غذای جهان شامل ردیابی دادههای کشاورزی، استفاده از زمین، ماهیگیری، جنگلبانی، کمکهای غذایی، رشد جمعیت و تغذیه است. برای قابل فهم کردن تمام این اطلاعات، محققان سازمان خوار و بار جهانی (FAO) سازمان ملل متحد اقدام به ساخت FAOSTAT کردند: بزرگترین پایگاه داده جهان در خصوص اطلاعات غذا و کشاورزی، با بیش از یک میلیون سرشماری که آمار مربوط به پنج دهه و 254 کشور و منطقه را شامل میشود.
با استفاده از FAOSTAT محققان به سرعت میتوانند تعیین کنند که در سال 2000 / 1379، انسانها در مقایسه با بیست سال پیش از آن، 249 کالری بیشتر در روز مصرف میکردند؛ 70 درصد مصرف آب انسان صرف کشاورزی میشود؛ نزدیک به 2 میلیارد گوسفند و بز در گلههای جهان وجود دارد؛ و اگرچه سیاره زمین غذای کافی برای تغذیه تمام ساکنان آن تولید میکند، اما 13 درصد جمعیت جهان دچار سوءتغذیه هستند. سال گذشته سازمان فائو استفاده از FAOSTAT را به صورت رایگان درآورد و از آن تاریخ تعداد کاربران آن از 400 نفر به 11500 نفر افزایش یافت.
در میان کاربران این پایگاه داده، دولتها و سازمانهای مردمنهاد (NGOs) وجود دارند که FAOSTAT را به دنبال راههایی برای غذارسانی موثرتر به مردم جهان زیر و رو میکنند. در یک مطالعه اخیر، وزارت کشاورزی چین با استفاده از دادههای فائو، میزان استفاده از زمین و تولید مواد غذایی خام را در 19 کشور مقایسه کرد. یکی از نتایج شگفتآور این بود که تعداد کارگران در مزارع چین بیش از حد نیاز است، و اگر افراد بیشتری به شهرها مهاجرت کنند کارایی و راندمان مزارع بهتر خواهد شد.
پروژه ژنوگرافیک
بهترین سابقه مهاجرت انسانهای اولیه نه در استخوانهای باستانی و نه در مصنوعات باستانشناسی، بلکه در دیانای انسانهای زنده امروزی یافت میشود. در سال 2005 / 1384 برای قابل دسترس کردن این اطلاعات، انجمن ملی جغرافیا آمریکا و آیبیام پروژه ژنوگرافیک (Genographic Project) را آغاز کردند.
در این پروژه، کیتهای جمعآوری دیانای به افراد فروخته میشود و یک تحلیل از خاستگاه آنها به افراد ارائه میشود. شرکتکنندگان تشویق میشوند تا اطلاعات خود را به صورت ناشناس به یک پایگاه داده اهدا کنند؛ پایگاهی که همچنین نمایه دیانای افراد بومی را که توسط ژنتیکدانان انسانشناسی در 10 آزمایشگاه جمعآوری شده است نگهداری میکند. با جستجوی 420 هزار نمایه ذخیره شده در این پایگاه داده، دانشمندان میتوانند جهشهای ژنتیکی را در میان مردم پیگیری، و مراحل آن را در انسانهای باستانی مجددا ردیابی کنند.
در سال 2008 / 1387، با مطالعه نسب مادری 624 ژن آفریقایی، محققان پروژه ژنوگرافیک کشف کردند که اگرچه تمام انسانها در دیانای یک جد مادری 200 هزار ساله با هم سهیم هستند، دستههای کوچک انسانها پیش از آنکه برای شکل دادن یک جمعیت واحد در اواخر عصر حجر با یکدیگر متحد شوند، نیمی از تاریخ بشر را در انزوا زندگی کردهاند.
مرکز توزیع داده هیئت بینالمللی تغییرات آبوهوایی
قبل از اینکه هیئت بینالمللی تغییرات آبوهوایی مرکز توزیع داده خود (DDC) را در سال 1998 / 1377 راهاندازی کند، محققانی که به پروژههای تغییرات آبوهوایی نیاز داشتند مجبور بودند که آنها را از تنی چند از دانشمندان بگیرند که در مدلسازی آماری آبوهوایی محاسبات بالا متخصص بودند. مدلسازها با کوهی از اطلاعات مواجه بودند و مطالعات بسیار خسته کننده بود.
بدتر از آن، آنها اغلب فرضیات و قالبهای دادهای متفاوتی را استفاده میکردند، که مقایسه سریع نتایج را دشوار میساخت. با این حال، اکنون DDC به عنوان مخزن مرکزی جهانی برای پروژهای آبوهوایی آینده خدمت میکند. تحلیلگران DDC قبل از آنکه دادهها را به پایگاه داده اصلی وارد کنند، آنها را از مدلهای مختلف به قالبهای سازگار و قابل بارگذاری تبدیل میکنند.
اگر یک دانشمند بخواهد مطالعه کند که سناریوهای مختلف گرمایش جهانی مثلا بر روی تولید ذرت در چین چطور اثر میگذارد، میتواند مجموعه دادههای تولید شده از 49 مدل آماری مختلف را انتخاب کند و دادههایی را که به یک قالب قابل استفاده تبدیل شدهاند، دانلود کند.
MD-Pro
با داشتن فهرستی از بیش از 15 میلیون بدافزار کامپیوتری، MD-Pro مرکزی برای کنترل بیماریهای دنیای مجازی است. شرکت Frame4 Security Services که در سال 2006 / 1385 در هلند تاسیس شد، این پایگاه داده را به عنوان منبعی برای متخصصان امنیت ایجاد کرد، متخصصانی که برای شناسایی تهدیدهای جدید و توسعه و تست اقدامات دفاعی نیاز دارند تا به بدافزارها دسترسی داشته باشند.
تحلیلگران Frame4 برای جمعآوری نمونهها از کامپیوترهایی موسوم به honeypot استفاده میکنند، که برنامهریزی میشوند تا بدافزارها را جذب و گمراه کنند. همچنین بخشی از نمونهها از سوی سازندگان آنتیویروس و متخصصان امنیت مجازی به این پایگاه اهدا شده است. تحلیلگران میتوانند نمونهها را از سایت MD-Pro دانلود کنند، البته برای جلوگیری از فروش نمونهها به سازندگان بدافزارها و هکرها، Frame4 بر کاربران خود نظارت میکند. پس از افزودن یک موتور پردازش دیگر در اوایل سال میلادی، MD-Pro با سرعت بیش از یک میلیون نمونه در ماه در حال توسعه است.
پایگاه داده نقشهبرداری دیجیتال آسمان اسلون
در سال 1998 / 1377 اخترشناسان با استفاده از تلسکوپ 2.5 متری Sloan در رصدخانه آپاچی نیومکزیکو شروع به عکسبرداری از آسمان و بارگذاری تصاویر تهیه شده در پایگاه داده نقشهبرداری دیجیتال آسمان اسلون (SDSS) کردند که به رایگان در اختیار عموم مردم قرار دارد. از آن زمان، اخترشناسان 100 ترابیت فضا را برای نقشهبرداری نیم میلیارد ستاره، کهکشان، سیارک و کوازار استفاده کردهاند؛ و نقشههای سهبعدی کهکشانهای خارجی را خلق، و ساختار کیهان را مطالعه کردهاند.
سال گذشته، دانشمندان از نمونههای ستارهای انبوه SDSS استفاده کردند تا تعیین کنند که چرا برخی از کوتولههای سفید رد غیرمنتظرهای از فلز را در اتمسفر خود بر جای میگذارند. با مقایسه اندازهگیریهای SDSS از هزاران کوتوله سفید جدیدا شناسایی شده با اندازهگیریهای مربوط به سایر ستارگان، آنها کشف کردند که این آلودگی احتمالا باقیماندههای سیارهای است. از آنجاییکه کهکشان راهشیری در بردارنده تعداد زیادی کوتوله سفید آلوده است، دانشمندان استدلال کردند که ممکن است سیارات صخرهای و آبدار از چیزی که قبلا گمان میشد متداولتر باشند. بنابراین ممکن است احتمال وجود حیات فرازمینی در کهکشان ما بیش از آن چیزی باشدکه دانشمندان قبلا حدس میزدند.
Wayback Machine
هدف Wayback Machine کپی و ذخیره کردن اینترنت است. زمانیکه شرکت غیرانتفاعی Internet Archive این پایگاه داده را 15 سال پیش بنیان گذاشت، نرمافزار مرورگر موسوم به خزنده (crawlers) حدود 180 میلیارد صفحه وب متعلق به بیش از 200 میلیون سایت را ذخیره کرده است.
اکنون با حجم 4 پتابایت، که هر ماه 35 تا 40 ترابایت نیز به آن اضافه میشود، Wayback Machine بزرگترین آرشیو در دسترس وب است که در جهان وجود دارد. کافی است یک آدرس URL مانند آدرس یک وبلاگ بسته شده را وارد کنید، و تاریخچه زمانی رو به عقب آن را با لینکهایی که به نسخههای عملیاتی وب سایتهای همان زمان ارجاع میدهند، مشاهده کنید. پایگاه Wayback Machine رایگان است، بنابراین هر کاربر کنجکاوی میتواند دادههای آن را برای تحقیقهای تاریخی یا مطالعه تکامل وب استفاده کند.
WorldCat
از زمانیکه مرکز کتابخانه کامپیوتر آنلاین در 40 سال قبل WorldCat را خلق کرد، کتابداران سراسر دنیا این پایگاه داده را با اطلاعات کتابشناسی بیش از 1.75 میلیارد کتاب از 72 هزار کتابخانه در 170 کشور مختلف پر کردهاند.
کتابداران از این پایگاه داده برای دسترسی به اطلاعات هر کتابی در قفسه کتابخانه جهانی استفاده میکنند. امانتگیرندگان میتوانند با نرمافزار مخصوص WorldCat برای گوشیهای همراه، به جستجوی کتابها، فیلمها، موسیقی و مقالات تحقیقی در کتابخانههای نزدیک خود بپردازند. در عین حال محققان میتوانند WorldCat را برای کشف گرایشهای فرهنگی و تاریخی، و شاید پیشبینی گرایشهای آینده زیر و رو کنند. برای مثال دانشگاهی در تورنتو با استفاده از این پایگاه داده کشف کرد که افت و خیزهایی که در تعداد کتابهای فناورانه جدید ایجاد میشود، به ترتیب بر شکوفاییها و بحرانهای اقتصادی مقدم است.
53275
نظر شما