Welcome to Machinfy Academy

bootstrapping between Machine learning and statistics

blog image

Bootstrapping

bootstrapping between Machine learning and statistics!
في عندنا حاجة مهمة جدا في جزئية ال resampling في ال statistics
وفي نفس الوقت بنستخدمها في ال MLكتير مثل ما موجود في ألجوريزم random forest وبالأخص random forest classifier
طب إزاي نقدر نطبق
الفكرة هي في طريقة الإستخدام!

بمعني إن يعتبر كل ال statistics techniques concept مستخدمة في ال ML بس نقطة الإستخدام او التوظيف بتفرق ودي النقلة اللي بينهم.
نيجي بقا للتوضيح في نقطة ال bootstrapping

In statistics:
is a resampling technique used to estimate statistics on a population by sampling a data set with replacement
طب يعني ايه الكلام ده ؟
لنفترض إن عندي داتا فيها
10 row وليكن
[0,1,2,3,4,5,6,7,8,9]

-فأنا هسحب منها sample بنفس حجم الداتا الأصلي اللي هو 10 row بس مع شرط ال replacement او التكرار
-يعني لو الداتا عندي فيها رقم 20 في الاندكس رقم 3 فأنا اقدر اسحب مثلا رقم 2 ده اكتر من مرة في ال sampling الواحد نفسه

[sample 1: [0,0,2,0,4,0,6,0,0,9

[sample 2:[0,1,6,3,9,5,6,6,9,9

[sample 3:[0,1,6,3,3,3,3,7,8,9
وبعد كدا بجيب مثلا المتوسط الكلي وبنقارنه بمتوسط الداتا الأصلية

Bootstrapping
Bootstrapping

ووفقا للدراسات والابحاث اللي اتعملت في الموضوع ده في الطريقة دي بتقدر تخرج Parameter     estimation   افضل من اني اشتغل عالداتا الاصلية نفسها.

In Machine learning :
معروف برضة بإسم bagging وده هتلاقية في ” random forest classifier ”
أقدر اقول بتعريف بسيط
It helps in avoiding overfitting and improves the stability of machine learning algorithms.

ليه استخدمات كتيرة ومن أهمها يقدر يساعدنا في overfitting في الداتا
وده بيبان جدا في ال (Random forest algorithm(RF

Bootstrapping
Bootstrapping

لما أجي أطبق الألجوريزم ده فأنا بلجأ لأكتر من طريقة منها بقا طريقة
Bagging or Bootstrapping
في ال random forest عبارة عن مجموعة من الtrees مع بعض وفي النهاية باخد القرار بتاعي
بس لما كنت بشتغل علي ال trees كنت م
بيتم بطرق كتيرة منها طريقة ال Bagging or Bootstrapping
إني بحدد trees مختلفة من الداتا مع شرط اللي replacement اللي وضحناه فوق

واحسب accuracy عن طريق إن بحسب المتوسط لكل tree لوحدها وبعدها بجيب المتوسط الكلي للإحتمالية اللي ظهرتلي والطريقة دي بتجيب نتيجة كويسة جدا.

وفي استخدمات تانية ليه متواجدة مش بس علي ال random forest process

اتمني تكون الفكرة وضحت ببساطة ^

Leave a Reply

Your email address will not be published.