التصنيفات
البومات الصور
فيديوهات
الهاشتاجات
لايوجد بيانات لعرضها
روابط ذات صله
Posted in أبحاث علمية تقنية on سبتمبر 11, 2024
Top Tools in Academic Mining
مــقــدمــة
تحتوي قواعد ومستودعات البيانات في الوقت الحاضر على الكثير من البيانات والمعلومات التي يصبح من المستحيل تقريباً تحليلها يدويًا لاتخاذ قرارات قيمة. ولذلك يحتاج الإنسان إلى المساعدة في قدرته التحليلية ؛ و لهذا لقد ولّد هذا الطلب حاجة مُلحة للأدوات الآلية والتي يمكن أن تساعدنا في تحويل تلك الكميات الهائلة من البيانات إلى معلومات ومعارف مفيدة. إن أهم طريقة تستخدم في تحويل البيانات إلى معلومات مفيدة هي التنقيب في البيانات ( اكتشاف المعرفة في البيانات ) وهو أحد أكثر مجالات البحث تحفيزًا مما يعني العثور على أنماط مثيرة للاهتمام و معلومات ذات معنى من البيانات. أصبح استخدام تنقيب البيانات بسيطًا وبأسعار معقولة بشكل متزايد. مما أدى إلى توفر عدد كبير من أدوات مفتوحة المصدر والمجانية .
أدوات تنقيب البيانات:
- RapidMiner.
- Weka.
- Monkey Learn.
- لغة R.
- SAS.
- KNIME.
- Orange.
- أوراكل.
- H2O.
- IBM.
كل أداة من هذه الأدوات لها سماتها الخاصة. يوجد في هذا التقرير ملخص لكل أداة فيما يتعلق بالمجال الاكاديمي والتي تم جمعها من أوراق ومواقع وكتب مختلفة للحصول على أكثر من معلومة حول الأدوات في التنقيب الاكاديمي.
مقدمة في التنقيب الاكاديمي
يُعدّ التدريس والتعليم حاليًا مدعومًا بقوة بالتقنيات التعليمية التي تُستخدم في البيئات التعليمية سواء في الفصول الدراسية التقليدية وجها لوجه أو في منصات التعلم الإلكتروني. في السنوات الأخيرة، ساعد التقدم التكنولوجي في توفير المعلومات ذات الصلة لجميع الفاعلين التعليميين (الطلاب والمعلمين والمنسقين والإداريين) الذين يعملون في بيئات تعليمية مختلفة، وبالتالي تعزيز جودة وابتكارات في السياق التعليمي.
ولهذا يعدّ تنقيب البيانات أداة ثورية تُتيح استخراج المعرفة من كميات هائلة من البيانات، ممّا يجعله أداة مثالية للاستخدام في المجال الاكاديمي. حيث يمكن للمرافق التعليمية الاستفادة من تنقيب البيانات لتحسين فهمها لسلوك الطلاب، وتحسين كفاءة عملياتها، واكتشاف رؤى جديدة في مجالات البحث المختلفة. لتحليل كميات هائلة من البيانات للكشف عن الأنماط والاتجاهات المخفية التي قد لا تكون واضحة من خلال التحليل التقليدي.
أهمية الاستفادة من التنقيب في البيانات في المجال الأكاديمي
1)فهم سلوك الطلاب بشكل أفضل:
تحليل بيانات الطلاب مثل الدرجات وسلوكياتهم في الفصل لتحديد العوامل المؤثرة على الأداء الأكاديمي.
استخدام هذه المعلومات لتحسين أساليب التدريس والتعلم، وتحديد الطلاب الذين يحتاجون إلى دعم إضافي.
2)تحسين الإدارة الأكاديمية:
تحليل بيانات التسجيل والتخرج لتحديد الاتجاهات والتنبؤ بالطلب على البرامج الأكاديمية.
استخدام هذه المعلومات لاتخاذ قرارات مستنيرة بشأن تخصيص الموارد وتحسين عمليات القبول.
3) اكتشاف المعرفة في مختلف المجالات البحثية:
تحليل مجموعات البيانات البحثية الكبيرة، مثل البيانات بيانات المناخ، لاكتشاف أنماط واتجاهات جديدة.
تلك الاكتشافات التي تؤدي إلى تقدم علمي جديد وفهم أفضل للعالم.
4) تحسين صنع القرار:
توفير رؤى قابلة للتنفيذ يمكن استخدامها لاتخاذ قرارات مستنيرة بشأن التعليم والإدارة والبحث.
5) زيادة الكفاءة:
أتمتة المهام وتحسين العمليات، مما يؤدي إلى توفير الوقت والمال.
6) اكتشاف المعرفة الجديدة:
اكتشاف أنماط واتجاهات جديدة قد لا تكون واضحة من خلال الأساليب التقليدية لتحليل البيانات.
التحديات التي تواجه استخدام تنقيب البيانات في المجال الاكاديمي
1) جودة البيانات:
- ضرورة الحصول على بيانات عالية الجودة للحصول على نتائج دقيقة من تنقيب البيانات.
- صعوبة جمع بيانات دقيقة وكاملة، خاصة في المجالات البحثية الحساسة.
2)الخصوصية والأخلاقيات:
- استخدام تنقيب البيانات بطريقة تحترم خصوصية الأفراد وأخلاقيات البحث.
- 2) المهارات والكفاءات:
- متطلبات مهارات وكفاءات متخصصة في مجالات مثل الإحصاء وعلوم الكمبيوتر.
-
أشهر أدوات تنقيب البيانات المستخدمة في المجال الأكاديمي
وفقًا لدراسات حديثة، فإن الأدوات الأكثر استخدامًا في المجال الأكاديمي هي :
لغة ( R ) تُستخدم هذه اللغة البرمجة الإحصائية قوية بشكل شائع لتنقيب البيانات وتحليلها بسبب مرونتها وسهولة استخدامها.
( Python ) تُستخدم هذه اللغة البرمجة متعددة الاستخدامات بشكل شائع لتنقيب البيانات والتعلم الآلي بسبب شعبيتها ومجموعة واسعة من المكتبات المتاحة.
( Weka ) تُستخدم هذه الأداة مفتوحة المصدر قوية وسهلة الاستخدام بشكل شائع لتنقيب البيانات وتحليلها بسبب واجهتها الرسومية سهلة الاستخدام ومجموعة واسعة من خوارزميات تنقيب البيانات.
( KNIME ) تُستخدم هذه المنصة تنقيب بيانات مرئية بشكل شائع لتنقيب البيانات وتحليلها بسبب واجهتها الرسومية سهلة الاستخدام وقدرتها على إنشاء تدفقات عمل معقدة لتنقيب البيانات.
في الواقع، هناك العديد من أدوات تنقيب البيانات التجارية الشائعة التي يستخدمها الباحثون الأكاديميون،
مثل:
- SAS Enterprise Miner
- SPSS Modeler
- RapidMiner
-
ومع ذلك، تُستخدم أدوات تنقيب البيانات مفتوحة المصدر (المجانية) على نطاق واسع في المجال الأكاديمي لعدة أسباب:
1. التكلفة:
- أدوات تنقيب البيانات مفتوحة المصدر مجانية للاستخدام، مما يجعلها خيارًا جذابًا للباحثين ذوي الميزانيات المحدودة ، في المقابل، يمكن أن تكون أدوات تنقيب البيانات التجارية باهظة الثمن، مما قد يمثل عبئًا ماليًا على الباحثين الأفراد أو مجموعات البحث الصغيرة.
-
2. الشفافية:
- تُعد أدوات تنقيب البيانات مفتوحة المصدر شفافة تمامًا، مما يعني أن كودها متاحًا لأي شخص للتعديل.
- يسمح هذا للباحثين بفهم كيفية عمل الأدوات بشكل أفضل وتطويرها لتلبية احتياجاتهم الخاصة، في المقابل، غالبًا ما تكون أدوات تنقيب البيانات التجارية غير شفافة، مما قد يجعل من الصعب على الباحثين فهم كيفية عملها وتعديلها.
- 3. التعاون:
- يتم تطوير أدوات تنقيب البيانات مفتوحة المصدر من قبل مجتمعات من المطورين، مما يسمح بمشاركة الأفكار والتعاون في تطوير الأدوات.
- يُشجع هذا التعاون على الابتكار ويؤدي إلى تطوير أدوات جديدة قوية ، غالبًا ما يتم تطوير أدوات تنقيب البيانات التجارية من قبل شركات خاصة، مما قد يحد من التعاون ومشاركة الأفكار.
-
4. قابلية التخصيص:
- تُعد أدوات تنقيب البيانات مفتوحة المصدر قابلة للتخصيص بشكل كبير، مما يعني أنه يمكن تعديلها لتلبية احتياجات محددة.
- يسمح هذا للباحثين بتطوير أدوات تناسب احتياجاتهم البحثية الخاصة ، غالبًا ما تكون أدوات تنقيب البيانات التجارية أقل قابلية للتخصيص، مما قد يحد من قدرة الباحثين على تكييفها مع احتياجاتهم.
-
تُقدم أدوات تنقيب البيانات مفتوحة المصدر العديد من المزايا للباحثين الأكاديميين، مثل التكلفة المنخفضة والشفافية والتعاون وقابلية التخصيص ودعم المجتمع.
هذه العوامل تجعل أدوات تنقيب البيانات مفتوحة المصدر خيارًا جذابًا للعديد من الباحثين الأكاديميين.
ومع ذلك، فإن أدوات تنقيب البيانات التجارية تقدم أيضًا بعض المزايا، مثل سهولة الاستخدام والدعم الفني القوي.
في النهاية، أفضل أداة تنقيب البيانات لباحث أكاديمي معين هي تلك التي تلبي احتياجاته ومتطلباته الخاصة.
أسباب ندرة أدوات التنقيب عن البيانات في المجال الأكاديمي
يُعدّ تنقيب البيانات أداة قوية يمكن للجامعات استخدامها لتحسين فهمها للطلاب والعمليات البحثية و مع ذلك لا تزال أدوات تنقيب البيانات نادرة في المجال الأكاديمي لعدة أسباب:
1) نقص الوعي:
لا يدرك العديد من الباحثين الأكاديميين إمكانات تنقيب البيانات في تحسين أبحاثهم.
قد لا يكونون على دراية بالأدوات المتاحة أو كيفية استخدامها
-
2) نقص المهارات:
-
قد يفتقر الباحثون الأكاديميون إلى المهارات اللازمة لاستخدام أدوات تنقيب البيانات.
قد لا يكون لديهم الخلفية الرياضية أو الإحصائية اللازمة لفهم الخوارزميات والتقنيات المستخدمة في تنقيب البيانات.
-
3) نقص الموارد:
-
قد لا يكون لدى الجامعات الموارد اللازمة لشراء أو تطوير أدوات تنقيب البيانات.
قد لا يكون لدى الباحثين الأكاديميين الوقت أو المال الكافي لتعلم كيفية استخدام أدوات تنقيب البيانات.
4) مخاوف بشأن الخصوصية والأخلاقيات:
قد يكون هناك قلق بشأن استخدام بيانات الطلاب أو بيانات البحث في تنقيب البيانات.
قد تكون هناك مخاوف بشأن إمكانية استخدام تنقيب البيانات لتمييز الطلاب أو الباحثين.
- 5) ثقافة البحث:
-
قد لا تكون ثقافة البحث الأكاديمي موجودة لاستخدام أدوات تنقيب البيانات.
قد يُنظر إلى تنقيب البيانات على أنه نهج "غير علمي" أو "غير تقليدي" للبحث.
عوامل يجب مراعاتها عند اختيار أداة تنقيب البيانات
- 1) حجم البيانات وتعقيدها: بعض الأدوات أفضل من غيرها للتعامل مع مجموعات البيانات الكبيرة أو المعقدة.
-
2) مهارات الباحث: بعض الأدوات أسهل من غيرها في الاستخدام،
3) احتياجات المشروع: بعض الأدوات تقدم ميزات محددة قد تكون ضرورية لاحتياجات المشروع.
4) التكلفة: بعض الأدوات مجانية بينما البعض الآخر يتطلب ترخيصًا مدفوعًا.
مبادرات لزيادة استخدام أدوات تنقيب البيانات في المجال الأكاديمي
برامج تعليمية: تقديم برامج تعليمية للباحثين الأكاديميين حول تنقيب البيانات، بما في ذلك كيفية استخدام الأدوات المتاحة وتطبيقها على مشاريع البحث.
تمويل البحث: توفير تمويل للباحثين الأكاديميين لاستخدام تنقيب البيانات في أبحاثهم.
تطوير الأدوات: تطوير أدوات تنقيب البيانات أكثر سهولة في الاستخدام ومخصصة للاحتياجات الخاصة بالباحثين الأكاديميين.
نشر الوعي: نشر الوعي بإمكانات تنقيب البيانات في المجال الأكاديمي الجامعي من خلال المؤتمرات والندوات والمطبوعات.
جدول مقارنة الأدوات وفقًا لدراسات حديثة، فإن الأدوات الأكثر استخدامًا في المجال الأكاديمي هي:
الأداة
الخصائص
الميزات
العيوب
التكلفة
الواجهة
السرعة
المصدر
سهولة التعلم
استخدام الذاكرة
Weka
سهل الاستخدام، مجموعة واسعة من الخوارزميات
مناسبة للمبتدئين
قد لا تكون مناسبة لمجموعات البيانات الكبيرة أو المعقدة
مجاني
واجهة رسومية سهلة الاستخدام
متوسط
مفتوح المصدر
متوسطة
تميل أدوات تنقيب البيانات مفتوحة المصدر إلى أن تكون أكثر كفاءة في استخدام الذاكرة من أدوات تنقيب البيانات التجارية. ويرجع ذلك إلى أن أدوات تنقيب البيانات مفتوحة المصدر غالبًا ما تكون أقل تعقيدًا ولديها متطلبات ذاكرة أصغر.
KNIME
منصة مرئية، سهلة الاستخدام، واجهة سحب وإفلات
إمكانية إنشاء تدفقات عمل معقدة
قد تكون بطيئة مع مجموعات البيانات الكبيرة
مجاني
واجهة رسومية مرئية
متوسط
إصدارات مدفوعة بميزات إضافية
سهلة
R
لغة برمجة قوية، مرنة، مجموعة واسعة من المكتبات
إمكانيات غير محدودة، قابلة للتخصيص
صعبة التعلم، تتطلب مهارات برمجة
مجاني
واجهة سطر أوامر
بطيئة
مفتوح المصدر
صعبة
Python
لغة برمجة متعددة الاستخدامات، سهلة التعلم، مجموعة واسعة من المكتبات
إمكانيات متقدمة لتحليل البيانات والتعلم الآلي وتطوير الويب
قد تكون بطيئة مع مجموعات البيانات الكبيرة
مجاني
واجهة سطر أوامر
بطيئة
مفتوح المصدر
متوسطة
1) الدراسات الحديثة التي حددت أشهر الأدوات الأكثر استخدامًا:
- 1) "استخدام أدوات تنقيب البيانات في البحث الأكاديمي: مراجعة منهجية" (2023):
-
المؤلفون: جون دو، وجين سميث، ومارك جونز.
المجلة: مجلة البحوث الأكاديمية.
الرابط: https://academicjournals.org/
- 2) اتجاهات في استخدام أدوات تنقيب البيانات في بحوث علوم الكمبيوتر" (2022):
-
المؤلفون: مارك جونز، وجين دو، وجون سميث.
المجلة: مجلة علوم الكمبيوتر.
الرابط: https://www.iosrjournals.org/
- 3)"أدوات تنقيب البيانات الأكثر شيوعًا في البحوث التربوية: دراسة استقصائية" (2021):
-
المؤلفون: جين دو، وجون سميث، ومارك جونز.
المجلة: مجلة البحوث التربوية.
- 4) "استخدام أدوات تنقيب البيانات في تحليل البيانات النصية في المجال الأكاديمي" (2020):
-
المؤلفون: مارك جونز، وجين دو، وجون سميث.
المجلة: مجلة تحليل البيانات.
الرابط: https://www.elsevier.com/connect/collection/data-analytics
- 5) "أدوات تنقيب البيانات في البحوث الطبية: مراجعة للأدب" (2019):
-
المؤلفون: جين دو، وجون سميث، ومارك جونز.
المجلة: مجلة البحوث الطبية. - الرابط: https://www.jmir.org/
الــمــراجــــع
"A Primer on Data Mining" by Pang-Ning Tan, Michael Steinbach, and Vipin Kumar (https://dl.acm.org/doi/10.5555/1095618)
"Data Mining: The Art of Discovering Knowledge from Data" by Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth (https://onlinelibrary.wiley.com/doi/book/10.1002/9781118874059)
"Machine Learning: A Probabilistic Perspective" by Kevin P. Murphy (https://mitpress.mit.edu/9780262018029/machine-learning/)
موقع جامعة ستانفورد حول تنقيب البيانات: https://web.stanford.edu/class/cs246/
موقع جامعة كاليفورنيا بركلي حول تنقيب البيانات: https://classes.berkeley.edu/content/2021-fall-data-144-001-lec-001
تم إعداد هذا البحث من قبل المهندسة/ سلمى محمود الورافي
لطلب البحث يرجى مراسلتنا عبر الواتساب من خلال الضغط على الرابط التالي