مدخل الي (biocoundictor)

مدخل الي (biocoundictor)

| مقدمه

السلام عليكم , سنتحدث اليوم عن مخزن الخوارزميات الاشهر والاهم في مجال المعلوماتيه الحيويه وهو مخزن ال (Bioconductor) , وهو عبارة عن مشروع حر ومفتوح المصدر لتطوير البرمجيات لتحليل وفهم البيانات الجينية الناتجة عن التجارب المختبرية في البيولوجيا الجزيئية , كما تحدثنا من قبل انه من المستحيل التعامل مع البيانات البيولوجيه الكبيره يدويا او بالنظر لذلك نلجا الي لغات البرمجه الاحصائه مثل (R) كما تحدثنا في مقال سابق

يعتمد Bioconductor في المقام الأول على لغة برمجة (R) الإحصائية ، ولكنه يحتوي على مساهمات بلغات برمجة أخرى , لديه إصدارين كل عام يتبعان الإصدارات نصف السنوية من R ، والتي تتوافق مع الإصدار الذي تم إصداره من (R) ، وإصدار تطوير ، والذي يتوافق مع إصدار تطوير R اي انه مرتبط كثيرا بلغة R , بالإضافة إلى ذلك ، هناك عدد كبير من حزم التعليقات التوضيحية الجينية المتوفرة بشكل رئيسي

بدأ المشروع في خريف عام 2001 ويشرف عليه الفريق الأساسي (Bioconductor) ، ومقره في مركز فريد هوتشينسون لأبحاث السرطان ، مع أعضاء آخرين قادمين من مؤسسات دولية

| الخصائص الرئيسيه

تحتوي كل حزمة من Bioconductor على نقوش قصيرة تكون واحدة على الأقل ، وهي عبارة عن مستند يوفر وصفًا نصيًا وموجها لوظائف الحزمة , العديد منها عبارة عن “كيفيه” بسيطة مصممة لتوضيح كيف يمكن إنجاز مهمة معينة باستخدام برنامج هذه الحزمة. يقدم آخرون نظرة عامة أكثر شمولاً على الحزمة أو قد يناقشون حتى القضايا العامة المتعلقة بالحزمة

| الأساليب الإحصائية والرسوم البيانية

يهدف مشروع Bioconductor إلى توفير الوصول إلى مجموعة واسعة من الأساليب الإحصائية والرسومية القوية لتحليل البيانات الجينومية

تتوفر حزم التحليل من أجل :

  • pre-processing Affymetrix
  • Illumina
  • cDNA array data
  • plotting genomic data

بالإضافة إلى ذلك ، يوفر نظام حزم R نفسه تطبيقات لمجموعة واسعة من التقنيات الإحصائية والرسومية الحديثة ، بما في ذلك النمذجة الخطية وغير الخطية ، والتحليل العنقودي ، والتنبؤ ، وإعادة التشكيل ، وتحليل السلاسل الزمنية

سنقوم الان بتثبيته ع بيئة عمل R لبدأ العمل بها


 source (http://www.bioconductor.org/biocLite.R)

> biocLite("Biobase")

| الحزم

الان دعنا نتحدث عن بعض الحزم التي يوفرها Bioconductor , ثم تحميل الحزمة باستعمال دالة biocLite مثلا للتعامل مع السلاسل واحداثيات الجينات يمكننا تحميل حزمة GenomicRanges كالتالي


biocLite("GenomicRanges")

للحصول على شرح لأي دالة من الدوال يمكنك استعمال أمر help و اسم الدالة مثلا:


  help(hist)

في هذا المثال تعمل هذه الحزمه علي تمثيل ومعالجة الفواصل والمتغيرات الجينومية المحددة على طول الجينوم , تلعب دورًا مركزيًا عندما يتعلق الأمر بتحليل بيانات التسلسل ذي الإنتاجية العالية (مثل بيانات NGS) , تستطيع الدخول علي (Bioconductor) من اي متصفح ويب خاص بك , مرحلة استخدام المشروع هي مرحله متقدمه في المعلوماتيه الحيويه حيث اننا هنا لا نستخدم ادوات جاهزه اونلاين , نحن نتعامل مع بيانات كبيره في المعلوماتيه الحيويه

لتعلم التعامل مع (Bioconductor) اليك مجموعتين من الكورسات احدهم توفره جامعة هارفارد (احد اكبر الجامعات في العالم) وهو كورس موجود علي منصة الكورسات المعروفه (EDX) ويتحدث الكورس عن تحليل بيانات الجينوم باستخدام حزم خاصه من (Bioconductor) ولكن لا تبدا في هذا الكورس وانت في المستوي (صفر) في المعلوماتيه الحيويه وعلم الجينوم وبرمجة (R) حيث يستخدم الكورس البرمجه في تحليل البيانات وهو الطبيعي والمعتاد والمتوقع ,و الكورس لا يجعلك تتعلم التعامل مع البرمجه ولكن جعلك تتعرف كيف تحلل البيانات بواسطة البرمجه وحزم (Bioconductor) , ولكن اذا كان لديك خلفيه في الجينوم وسلسلته ولديك خلفيه في استخدام برمجة (R) يمكن ان تحصل علي هذه الرحله العلميه الجميله والشيقه مع اساتذة من جامعة هارفارد ..

تستطيع ان تحصل علي الكورس من هنا : Introduction to Bioconductor

علي الجانب الاخر يوفر موقع (datacamp) الشهير في علوم البيانات كورس خاص بال (Bioconductor) مع شرح مبسط وبعض الامثله علي استخدام بعض البيانات البسيطه في تحليل جينوم الفطريات مع وجود بيئه برمجيه خاصه بالموقع , ويعد هذا الموقع احد اهم المواقع في تحليل البيانات في العالم ان لم يكن اهمهم , ولكن ما يعيب هذا الموقع ان معظم الكورسات الموجوده عليه بمبالغ ماديه تقترب من (30) دولار امركي , بخلاف ذلك هو افضل موقع لتعلم علوم البيانات في العالم , يبدا الكورس بتعريف (Bioconductor) وينتهي بوصولك الي مرحله جديده في استخدمه وكالعاده تذكر انه يجب عليك ان يكون لديك خلفيه برمجيه في لغة (R)

يمكنك الحصول علي الكورس من هنا : Introduction to Bioconductor

في المرات القادمه سنتطرق اكثر الي تحليل البيانات باستخدام الحزم الموجوده علي (Bioconductor) , اتمني ان يكون المقال نال علي استحسانكم واستطاع ان يفيد من يقرا في هذا المجال ..

Share this post

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.


Justin Pugh Authentic Jersey