دراسة دبلوم عالي في كلية العلوم تحلل احصائيا مجموعة بيانات باستخدام لغة R
نوقشت في قسم علوم الحاسوب بكلية العلوم جامعة بغداد دراسة الدبلوم العالي الموسومة “تحليل حزمة البيانات إحصائيا باستخدام تطبيق R للطالب علي محمد علي واشراف الدكتور عماد جاسم محمد .
وهدف البحث الى اجراء تحليل احصائي لمجموعة بيانات باستخدام لغة R بوصف ان البحث يعتمد التجريب في المجالات العلمية المبنية على الملاحظة والتحليل والقياس على مستودعات البيانات. وبالتالي، أدى تقدم البحث والتطوير إلى تعزيز أهمية الوصول لهذه البيانات. خطوة البداية في استكشاف أي مقدار كبير من البيانات هي تحليل البيانات الاستكشافي (EDA) الذي يبدأ بالفهم الأساسي للبيانات وصياغة العوامل التي يجب التركيز عليها.
واستنتج البحث وجود تتشابه في عمليات التحليل الأساسية بمعظم عمليات تحليل مجموعات البيانات مع بعض الاختلافات الطفيفة في خصوصية كل بيانات، وهذا ما وجد في تحليل مجموعة البيانات المستخدمة، كما ان الخوارزميات تعطي قراءات مختلفة وفقًا للبيانات المختلفة وقد تختلف النتائج ببساطة عن طريق تغيير بعض المعطيات الأساسية في الخوارزمية كما هو الحال في تحديد مقدار الثقة في خوارزمية التقويم المتقاطع أو تحديد الرقم الأولي في خوارزمية الاختبار، الذي يؤدي استخدام أكثر من خوارزمية لنفس الهدف إلى تغيير المخرجات والنتائج التي استند عليها القرار ومدى مرونته.