مرکز ملی اطلاعات زیستفناوری (NCBI) چیست؟
NCBI مخفف نشنال سنتر فور بایوتکنولوژی اینفورمیشن National Center for Biotechnology Information است و یکی از مهمترین مراکز اطلاعات زیستی در جهان محسوب میشود. این مرکز زیر نظر موسسه ملی سلامت آمریکا (NIH) فعالیت میکند و وظیفه جمعآوری، سازماندهی و ارائه دسترسی آزاد به اطلاعات زیستشناسی را بر عهده دارد.
تاریخچه مرکز ملی زیست فناوری آمریکا (NCBI)
حجم سرسامآور دادههای مولکولی و الگوهای رمزنگاری و ظریف آن منجر به نیاز مطلق به پایگاههای داده رایانهای و ابزارهای تحلیل شده است. چالش در یافتن رویکردهای جدید برای مقابله با حجم و پیچیدگی دادهها و ارائه دسترسی بهتر به محققان برای ابزارهای تحلیل و محاسباتی جهت پیشبرد درک میراث ژنتیکی ما و نقش آن در سلامت و بیماری است. سناتور کلود پپر Claude Pepper اهمیت روشهای پردازش اطلاعات رایانهای را برای انجام تحقیقات زیستپزشکی تشخیص داد و قانونگذاری را برای تأسیس مرکز ملی اطلاعات زیستفناوری (NCBI)National Center for Biotechnology Information در ۴ نوامبر ۱۹۸۸ به عنوان بخشی از کتابخانه ملی پزشکی (NLM) در مؤسسه ملی سلامت (NIH) حمایت کرد. NLM به دلیل تجربه خود در ایجاد و نگهداری پایگاههای اطلاعاتی زیستپزشکی انتخاب شد و به عنوان بخشی از NIH، توانست یک برنامه تحقیقاتی درون سازمانی در زیستشناسی مولکولی محاسباتی ایجاد کند. اجزای تحقیقاتی جمعی NIH بزرگترین مرکز تحقیقات زیست پزشکی در جهان را تشکیل میدهند. NCBI به عنوان یک مرکز تخصصی عمل میکند و بر توسعه و مدیریت پایگاههای داده زیستشناسی مولکولی تمرکز دارد. اگرچه NCBI به عنوان بخشی از NLM تاسیس شده است، اما این دو سازمان دارای هویت و تمرکزهای متفاوتی هستند. با این حال، این دو سازمان به طور نزدیک با هم همکاری میکنند تا اطمینان حاصل کنند که محققان و پزشکان به بهترین اطلاعات ممکن در زمینه زیست پزشکی دسترسی دارند.
کتابخانه ملی پزشکی آمریکا (NLM) چیست؟
کتابخانه ملی پزشکی آمریکا (National Library of Medicine) یکی از معتبرترین و بزرگترین کتابخانههای پزشکی در جهان است. این کتابخانه به عنوان یک منبع غنی و قابل اعتماد، اطلاعاتی جامع در زمینههای مختلف پزشکی، زیستشناسی و علوم مرتبط را در اختیار محققان، پزشکان، دانشجویان و عموم مردم قرار میدهد.
هدف NCBI
به عنوان یک منبع ملی برای اطلاعات زیستشناسی مولکولی، ماموریت NCBI توسعه فناوریهای اطلاعاتی جدید برای کمک به درک فرآیندهای اساسی مولکولی و ژنتیکی است که سلامت و بیماری را کنترل میکنند. به طور خاصتر، به NCBI وظیفه ایجاد سیستمهای خودکار برای ذخیره و تحلیل دانش در مورد زیستشناسی مولکولی، بیوشیمی و ژنتیک؛ تسهیل استفاده از چنین پایگاههای داده و نرمافزار توسط جامعه تحقیقاتی و پزشکی؛ هماهنگی تلاشها برای جمعآوری اطلاعات زیست فناوری در سطح ملی و بینالمللی؛ و انجام تحقیقات در مورد روشهای پیشرفته پردازش اطلاعات رایانهای برای تحلیل ساختار و عملکرد مولکولهای مهم زیستی محول شده است.
فعالیتها و قابلیتهای NCBI
- وارد کردن دادهها به NCBI از طریق Submission Portal
- اکثر داده های NCBI برای دانلود در دسترس هستند، یا مستقیماً از سایت NCBI FTP یا با استفاده از ابزارهای نرم افزاری برای دانلود مجموعه دادههای سفارشی.(راهنمای دانلود رکوردها از NCBI)
- ابزارهای تجزیه و تحلیل داده
- NCBI انواع محصولات آموزشی از جمله دوره ها، کارگاه ها، وبینارها، مواد آموزشی و مستندات را ایجاد می کند. رویدادهای آموزشی NCBI رایگان و برای همه آزاد است. همه مطالب آموزشی NCBI برای استفاده مجدد و توزیع برای هر کسی در دسترس است.
- تحقیقاتی در مورد مشکلات اساسی زیستپزشکی در سطح مولکولی با استفاده از روشهای ریاضی و محاسباتی انجام میدهد.
- همکاریهایی با چندین مؤسسه NIH، دانشگاهها، صنعت و سایر سازمانهای دولتی دارد.
- با حمایت از جلسات، کارگاهها و سخنرانیها، ارتباطات علمی را تقویت میکند.
- از طریق برنامه تحقیقاتی درون سازمانی NIH، آموزش در زمینه تحقیقات پایه و کاربردی در زیستشناسی محاسباتی برای پژوهشگران پسادکتری را حمایت میکند.
- از طریق برنامه بازدیدکنندگان علمی، اعضای جامعه علمی بینالمللی را در تحقیقات و آموزش انفورماتیک درگیر میکند.
- توسعه، توزیع، پشتیبانی و هماهنگی دسترسی به انواع پایگاههای اطلاعاتی و نرمافزار برای جوامع علمی و پزشکی را انجام میدهد.
- توسعه و ارتقای استانداردها برای پایگاههای اطلاعاتی، ذخیره و تبادل داده و نامگذاری زیستی را انجام میدهد.
ساختار سازمانی NCBI
- شاخه زیستشناسی محاسباتی (CBB)
این شاخه به تحقیقات پایه و کاربردی در زمینه مسائل محاسباتی، ریاضی و نظری در زیستشناسی و ژنتیک مولکولی میپردازد. این تحقیقات شامل تحلیل ژنوم، مقایسه توالیها، روشهای جستجوی توالی، ساختار ماکرومولکولها، دینامیک و تعامل آنها، و پیشبینی ساختار و عملکرد میشود. همچنین این شاخه پروژههای تحقیقاتی مشترک در زیستشناسی مولکولی محاسباتی را با زیستشناسان، شیمیدانان، ریاضیدانان و دانشمندان کامپیوتر در آزمایشگاههای درون سازمانی NIH، سایر سازمانهای دولتی، دانشگاهها و صنعت برقرار میکند. علاوه بر این، به سازمانها و آزمایشگاههای دولتی در استفاده از ابزارهای تحلیلی مبتنی بر رایانه برای مطالعه زیستشناسی مولکولی مشاوره میدهد. همچنین با گروههای زیستشناسی مولکولی برای بهبود تحقیقات آزمایشگاهی از طریق استفاده از رویکردهای محاسباتی و نظری تعامل دارد.
- شاخه مهندسی اطلاعات (IEB)
این شاخه تحقیقات کاربردی در نمایش و تحلیل دادهها را انجام میدهد، از جمله توسعه سیستمهای رایانهای برای ذخیره، مدیریت و بازیابی دانش مرتبط با زیستشناسی مولکولی، ژنتیک و بیوشیمی. همچنین طراحی طرحهای پایگاه داده و مشخصات برای نمایش انواع مختلف اطلاعات زیستشناسی مولکولی، از جمله اطلاعات اسید نوکلئیک، پروتئین و ساختاری را بر عهده دارد. این پایگاههای اطلاعاتی به عنوان منابع ملی عمل میکنند. علاوه بر این، طراحی و توسعه سیستمهای نرمافزاری توزیعشده را از مرحله نمونهسازی تا عملیاتی انجام میدهد که به محققان خدمات محاسباتی محلی و از راه دور ارائه میدهد. هماهنگی دسترسی عمومی به اطلاعات توالی، ژنتیک، ساختاری و کتابشناختی با ساخت پایگاههای اطلاعاتی منظم و یکپارچه و در صورت امکان ایجاد ارتباط با پایگاههای اطلاعاتی خارجی نیز بر عهده این شاخه است. همچنین پروژههای تحقیقاتی مشترک در انفورماتیک با آزمایشگاههای درون سازمانی NIH و گروههای دانشگاهی خارج از سازمان برقرار میکند. علاوه بر این، به سازمانها و آزمایشگاههای دولتی در مورد روشهای پیشرفته طراحی نرمافزار و پایگاه داده مشاوره میدهد. و در نهایت، توسعه و ارتقای استانداردها برای پایگاههای داده، تبادل داده و نامگذاری زیستی را بر عهده دارد.
- شاخه منابع اطلاعات (IRB)
این شاخه برنامهریزی، هدایت و مدیریت عملیات فنی NCBI، از جمله سیستمهای رایانهای مورد استفاده برای تحقیق و توسعه و همچنین سیستمهای رایانهای مورد استفاده برای دسترسی به پایگاههای اطلاعاتی عمومی را بر عهده دارد. همچنین ارائه پشتیبانی فنی به کارکنان NCBI و ارائه پشتیبانی برای کاربران خارجی خدمات شبکه NCBI را انجام میدهد. نظارت بر عملیات شبکه برای NCBI و هماهنگی با سایر سازمانهای دولتی برای دسترسی ملی و بینالمللی به خدمات NCBI نیز بر عهده این شاخه است. علاوه بر این، سازماندهی نمایشها و کارگاههای آموزشی برای جامعه زیست پزشکی به منظور ترویج استفاده از خدمات اطلاعاتی NCBI را انجام میدهد. همچنین برنامهریزی، توسعه و مدیریت قراردادهای دولتی و توافقنامههای همکاری برای خرید تجهیزات و خدمات در حمایت از عملکردهای اطلاعاتی NCBI را بر عهده دارد. به عنوان رابط خدمات پشتیبانی کاربر برای آژانسهای درگیر در پروژههای ژنوم عمل میکند. در نهایت، تحقیق و توسعه کاربردی، مشاوره فنی و هدایت و شناسایی نیازهای کاربران را انجام میدهد. همچنین نظرسنجیهایی برای ارزیابی استفاده از نرمافزار توسعهیافته توسط NCBI در جامعه کاربری زیستشناسی انجام میدهد و با سایر سازمانهای دولتی و منابع اطلاعات زیستشناسی برای تسهیل توسعه مخازن داده در NCBI هماهنگی میکند. یک هیئت مشاوران علمی دو بار در سال برای بررسی برنامهها و فعالیتهای تحقیقاتی مرکز تشکیل جلسه میدهد.
تحقیقات پایه NCBI
NCBI دارای یک گروه تحقیقاتی چند رشتهای متشکل از دانشمندان کامپیوتر، زیستشناسان مولکولی، ریاضیدانان، بیوشیمیدانان، پزشکان پژوهشی و زیستشناسان ساختاری است که بر روی تحقیقات پایه و کاربردی در زیستشناسی مولکولی محاسباتی تمرکز دارند. این پژوهشگران نه تنها سهم مهمی در علم پایه دارند، بلکه بهعنوان منبعی برای روشهای جدید برای فعالیتهای تحقیقاتی کاربردی نیز عمل میکنند. آنها با هم مشکلات اساسی زیستپزشکی را در سطح مولکولی با استفاده از روشهای ریاضی و محاسباتی مطالعه میکنند. این مشکلات شامل سازماندهی ژن، تحلیل توالی و پیشبینی ساختار میشود.
پایگاههای اطلاعاتی و نرمافزارهای NCBI
NCBI چهارده بخش یا پایگاه اطلاعاتی بنیادی دارد که هر کدام از این پایگاههای اطلاعاتی، خود شامل چندین پایگاه اطلاعاتی جزئیتر هستند.
- مواد شیمیایی و زیستسنجی
- داده و نرم افزار
- DNA & RNA
- Assembly
- BioCollections
- BioProject (formerly Genome Project)
- BioSample
- Consensus CDS (CCDS)
- Database of Short Genetic Variations (dbSNP)
- GenBank (پایگاه داده توالی ژنتیکی NIH)
- Influenza Virus
- NCBI Pathogen Detection Project
- Nucleotide Database
- PopSet
- Probe
- RefSeqGene
- Reference Sequence (RefSeq)
- Sequence Read Archive (SRA)
- Third Party Annotation (TPA) Database
- دامنه ها و ساختارها
- ژنها و حالت
- BioProject (formerly Genome Project)
- ClinVar
- Consensus CDS (CCDS)
- Database of Genotypes and Phenotypes (dbGaP)
- Gene
- Gene Expression Omnibus (GEO) Database(یک مخزن داده های ژنومیک کاربردی عمومی)
- Gene Expression Omnibus (GEO) Datasets(مجموعه دادههای حالت ژن و فراوانی مولکولی)
- Gene Expression Omnibus (GEO) Profiles
- Genes and Disease
- Genetic Testing Registry (GTR)
- Online Mendelian Inheritance in Man (OMIM)
- RefSeqGene
- ژنتیک و پزشکی
- Bookshelf
- ClinVar
- ClinicalTrials.gov
- Database of Genotypes and Phenotypes (dbGaP)
- Gene
- GeneReviews
- Genes and Disease
- Genetic Testing Registry (GTR)
- HIV-1, Human Protein Interaction Database
- Influenza Virus
- MedGen
- NCBI Pathogen Detection Project
- Online Mendelian Inheritance in Man (OMIM)
- PubMed
- PubMed Central (PMC)(شامل مقالات تمام متن)
- RefSeqGene
- Retrovirus Resources
- SARS CoV
- Virus Variation
- ژنوم ها و نقشه ها
- Assembly
- BioProject (formerly Genome Project)
- Database of Genomic Structural Variation (dbVar)
- Genome
- Genome Reference Consortium (GRC)
- HIV-1, Human Protein Interaction Database
- Influenza Virus
- NCBI Pathogen Detection Project
- Nucleotide Database
- PopSet
- Probe
- Retrovirus Resources
- SARS CoV
- Sequence Read Archive (SRA)
- Trace Archive
- Viral Genomes
- Virus Variation
- همسانی(جانور/گیاه شناسی)
- ادبیات(پیشینه)
- پروتئین ها
- تجزیه و تحلیل توالی
- تاکسونومی(ردهبندی)
- یادگیری و آموزش
- تغییر
منابع اطلاعاتی محبوب NCBI
NCBI مسئولیت پایگاه اطلاعاتی توالی DNA GenBank را در اکتبر ۱۹۹۲ بر عهده گرفت. کارکنان NCBI با آموزش پیشرفته در زیستشناسی مولکولی، پایگاه اطلاعاتی را از توالیهای ارسالشده توسط آزمایشگاههای فردی و از طریق تبادل داده با پایگاههای اطلاعاتی توالی نوکلئوتیدی بینالمللی، آزمایشگاه زیستشناسی مولکولی اروپا (EMBL) و پایگاه اطلاعاتی DNA ژاپن (DDBJ) ایجاد میکنند. علاوه بر GenBank، NCBI از انواع مختلف پایگاههای اطلاعاتی برای جوامع پزشکی و علمی پشتیبانی میکند. این موارد شامل Online Mendelian Inheritance in Man (OMIM)، پایگاه اطلاعاتی مدلسازی مولکولی (MMDB) از ساختارهای پروتئینی سهبعدی، یک نقشه ژن از ژنوم انسان، مرورگر طبقهبندی و پروژه آناتومی ژنوم سرطان (CGAP) در همکاری با مؤسسه ملی سرطان است.
جستجو و بازیابی در NCBI
Entrez سیستم جستجو و بازیابی NCBI است که به کاربران دسترسی یکپارچه به دادههای توالی، نگاشت، طبقهبندی و ساختاری را میدهد. Entrez همچنین نماهای گرافیکی از توالیها و نقشههای کروموزومی را ارائه میدهد. یک ویژگی قدرتمند و منحصر به فرد Entrez توانایی بازیابی توالیها، ساختارها و مراجع مرتبط است.
پیشینه مجلات از طریق پابمد PubMed – یک رابط جستجوی وب که دسترسی به بیش از ۳۷ میلیون استناد مجله در MEDLINE را فراهم میکند و حاوی لینکهایی به محتوای متن کامل از PubMed Central و یا مقالات کامل در وبسایتهای ناشران شرکتکننده است- در دسترس است.
BLAST برنامهای برای جستجوی شباهت توالی است که در NCBI توسعه یافته و در شناسایی ژنها و ویژگیهای ژنتیکی نقش اساسی دارد. BLAST میتواند جستجوهای توالی را در برابر کل پایگاه داده DNA در کمتر از ۱۵ ثانیه اجرا کند. ابزارهای نرمافزاری اضافی ارائه شده توسط NCBI شامل: Open Reading Frame Finder (ORF Finder)، Electronic PCR و ابزارهای ارسال توالی، Sequin و BankIt هستند.
دسترسی به پایگاههای اطلاعاتی NCBI از چه طریق امکانپذیر است؟
تمام پایگاههای اطلاعاتی و ابزارهای نرمافزاری NCBI از طریق وب یا FTP در دسترس هستند. NCBI همچنین دارای سرورهای ایمیل است که راه جایگزینی برای دسترسی به پایگاههای اطلاعاتی برای جستجوی متن یا جستجوی مشابهت توالی ارائه میدهد.
آموزش در NCBI
NCBI با حمایت از جلسات، کارگاهها و سخنرانیها، ارتباطات علمی در زمینه رایانهها، به عنوان کاربردی در زیستشناسی و ژنتیک مولکولی، را تقویت میکند. یک برنامه بازدیدکنندگان علمی برای تقویت همکاری با دانشمندان خارج از سازمان ایجاد شده است. موقعیتهای پژوهشگر پسادکتری به عنوان بخشی از برنامه تحقیقاتی درون سازمانی NIH در دسترس هستند.
منبع