دادههای پژوهشی، روندی جدید در دنیای علم برای افزایش تأثیرگذاری، اعتبار، کارایی و شفافیت در پژوهش (این مقاله نیاز به بازبینی دارد)
اساس علم را دادههای پژوهشی تولید شده توسط پژوهشگران تشکیل میدهد که با اشتراکگذاری آنها میتوان به پیشبرد بیشتر علم و پژوهش کمک کرد، اشتراکگذاری و به دنبال آن دسترسپذیری دادههای پژوهشی قابلیتهای زیادی برای پیشرفتهای علمی فراهم کرده است و باعث تسهیل در بازتولید نتایج پژوهشها شده است(۱)، ترویج پژوهشهای جدید، تقویت انسجام پژوهشهای پیشین، تسهیل فرصتهای یادگیری دانشجویان، جلوگیری از جمعآوری دوباره دادههای تکراری، افزایش اثر پژوهشها، افزایش شهرت دانشگاهی، پذیرش سیاستهای حامیان مالی پژوهشها و الزامات نشریات، اعتبار یابی پژوهشها، آزمون فرضیههای جدید با استفاده از دادههای موجود و کمک به پیشبرد علم ازجمله مزایای اشتراکگذاری دادهها هست(۲, ۳)
مدیریت صحیح دادههای پژوهشی موجب میشود که پژوهشگران هم خود بتوانند بعدها به دادهها مراجعه کنند و در پژوهشهای دیگر خود از آنها استفاده نمایند، و هم با اشتراکگذاری دادهها این امکان را برای سایر پژوهشگران فراهم نمایند که بتوانند آن دادهها را برای اهداف دیگر مورد استفاده قرار دهند در حال حاضر بیشتر پژوهشگران علاوه بر مقاله، دادههای پژوهشی(دادههایی که برای تحلیل و ارائه نتایج یک پژوهش بهصورت رقومی جمعآوری، مشاهده و یا تولید شده است و شامل: دادههایی است که در نرمافزارهای مختلف مانند SPSS , Excel و … ذخیره شدهاند) خود را نیز ارسال میکنند تا برای عموم مردم دسترسپذیر باشد.
- اکنون پایگاههایی که خدمات اینگونه ای ارائه میدهند، رو به رشد میباشند مثالهایی از این دست عبارتاند از پایگاه مندلی که پژوهشگران در بخش دیتاست[۱] (مجموعه داده) میتوانند دادههای پژوهشی را بارگذاری کرده و دیگران از آن استفاده کنند یا دانشگاه هاروارد که با Harvard Dataverse خدمات ارائه میدهد.
مندلی دیتا (ایجاد دادههای پژوهشی مؤثر):
در الزویر ما بر این باور هستیم که ۱۰ مرحله برای ایجاد دادههای مؤثر وجود دارد که میتواند مانند یک نقشه راه برای توسعه بهتر فرایندهای مدیریت دادهها در طول چرخه حیات داده عمل کند، این موارد شامل:
- ذخیره کردن
اولین گام در سلسله مراتب نیازهای تحقیقاتی ذخیره کردن دادههای مورد نیاز است.
- حفظ کردن
پس از ذخیرهسازی، دادهها باید بهصورت یک فرمت مستقل و ماندگار حفظ شوند.
- دسترسپذیری
زمانی که دادهای ذخیره و حفظ میشوند، لزوماً به این معنی نیست که بهطور خودکار قابلدسترسی است، در مواردی باید هم محقق و هم ماشین (نرمافزار یا موارد مورداستفاده) برای استفاده مجدد دادهها دسترسی داشت.
- قابل جستجو بودن (کشف دادهها)
حتی اگر دادهها، ذخیره، حفظ و در دسترس عموم باشند، اما تا زمانی که این دادهها توسط دیگران قابل جستجو و بازیابی نباشد، ارزشمند نیست.
- قابل استناد بودن
یکی از موانع به اشتراکگذاری دادهها این است که پاداش کمی برای کار بیشتر محققان (در دسترس قرار دادن دادههای پژوهشی) در نظر گرفتهشده است. استناد به دادههای پژوهشی یک پتانسیل برای تغییر این وضعیت دارد زیرا میتواند در سیستم پاداش فعلی مبنی بر تعداد استنادات مقاله گنجانده شود.
- قابلدرک بودن
برای اینکه دادهها مجدداً قابلاستفاده شود، باید مشخص شود که از کدام واحد اندازهگیری استفادهشده است و نحوهی جمعآوری دادهها و اختصارات و پارامترهای بهکاررفته چیست.
- بازبینی
باوجوداینکه برای مقالههای پژوهشی این مورد بسیار رایج است ولی هنوز برای دادههای پژوهشی خیلی معمول نیست. بااینحال، این یک گام مهم در مورد کنترل، کیفیت و اطمینان از دادهها است.
- قابل بازیابی
تکرارپذیر بودن نتایج تحقیق، نگرانی بزرگی برای علم است. کامل بودن موارد دادههای پژوهشی برای دستیابی به نتایج مشابه تحقیق مورد نیاز است. بهعنوانمثال مواردی مانند آنتیبادیها، مدلهای ارگانیسم و نرمافزار در زیست پزشکی نشان دادهاند که برای استفاده مجدد جزئیات کافی ندارند.
- قابلیت استفاده مجدد
مزیت دادههای پژوهشی به اشتراک گذاشتهشده استفاده مجدد از این دادههاست و تنها زمانی این امر محقق میشود که دادههای پژوهشی قابلاعتماد و قابل تکرار باشد. - یکپارچگی
برای استفاده مؤثر از دادههای پژوهشی باید این ۹ جنبه را در نظر گرفت، بهطور مثال دادهها باید حفظ شوند و قابلدسترسی باشند و قابلیت استناد داشته باشند، باید از سیستمهای موجود برای ذخیرهسازی و به اشتراکگذاری دادهها استفاده شود.
این نه لایه، به همراه مرحله یکپارچهسازی بهعنوان یک اصل هدایت شده است که توسط آن میتوان اقدامات مرتبط به مدیریت دادههای پژوهشی را انجام و بررسی کرد.
معرفی مندلی دیتا:
دیتا سرچ الزویر[۲] یک موتور جستجوی دادهای است که به دانشمندان و محققان اجازه میدهد تا انواع مختلفی از دادها را با فرمتهای مختلف از میان حوزههای موضوعی مختلف، مؤسسات مختلف و سایر منابع دادهای جستجو کنند. در این موتور جستجو نتایج بهصورت یکپارچه نمایش داده میشود تا کاربران اطلاعات مفیدی مربوط به کلیدواژه مورد جستجو به دست آوردند و پیشنمایشی برای کاربران قبل از مشاهده کامل مدرک جهت ارزیابی وجود دارد، این پیشنمایش شامل چکیدهای از مدرک و تصاویر و جداول و… است که به کاربران کمک میکند، از طریق این مجموعهی دادهای که فراهمشده است بهراحتی و با سرعت به ارزیابی مدارک بازیابی شده بپردازند. در این دیتاسرچ ها هم داده و ابرداده بهمنظور تسهیل در تطبیق جستجوی کاربر با مدارک نمایه شده وجود دارد.
که شما با کلیک بر روی هر عنوان میتوانید اطلاعات مختصری در مورد تحقیق ببیند، علامت کنار عنوان نشان میدهد که این رکورد متعلق به کدام سازمان (تأمینکننده) است، در مورد تصویر زیر همانطور که میبینید، متعلق به دانشگاه هاروارد هست.
و در مورد تصاویر زیر رکوردهایی را از پایگاه ساینس دایرکت برای ما نمایان شده است.
که میتوان روی هرکدام کلیک و اگر مورد درخواست بود، روی go to data source کلیک کنید تا شما را به منبع موردنظر هدایت کند.
و علامتهای زیر در کنار منابع:
اگر هرکدام از موارد بالا در کنار منبع موردنظر وجود داشته باشد، به این معنی است که مجموعهای از دادهها برای آن منبع وجود دارد. مثلاً مجموعهای از دادهها، شامل جداول، متن کامل، فایل صوتی و ویدیویی، تصاویر مربوط به منبع، مجموع ای از پ، کدها و نرمافزارهای مربوطه، دادههای رکورد، اطلاعات جغرافیایی و … . اعداد کنار این موارد هم نشاندهندهی تعداد موجود در منبع هست، مثلاً مورد اولی نشان میدهد ۹۳ جدول برای منبعی که انتخابشده وجود دارد.
منابعی که دادههای «دیتاسرچ» از آنها تأمین میشود:
- Mendeley Data
- Dryad
- Zenodo
- Harvard Dataverse
- NeuroElectro
- The Inter-university Consortium for Political and Social Research (ICPSR)
- ThermoML at NIST Thermodynamic Research Center (TRC)
- PANGAEA
- The following data sources from the EarthChem Portal from The Interdisciplinary Earth Data Alliance (IEDA) :
- Tables, figures and supplementary data associated with papers from