مفاهیم مقدماتی آمار و توزیع نرمال

مفاهیم مقدماتی آمار و توزیع نرمال
مفاهیم مقدماتی آمار و توزیع نرمال

در نخستین مقاله‌ از سری مقالات مرتبط با آمار و ریاضی به شرح و  بررسی «مفاهیم مقدماتی آمار و توزیع نرمال» می‌پردازیم.

در صورت برقراری شرایط معاملات الگوریتمی در بازار هدف برای سنجش بازده استراتژی‌های معاملاتی می‌توانید از سفارش کد پایتون، سفارش کد mql و … برای کد کردن و بهینه یابی استراتژی‌های خود استفاده کنید. و در عین حال سوای امکان سفارش اکسپرت می‌توانید از سفارش اندیکاتور برای دریافت یک نمایش گرافیکی از محاسبات استراتژی خود بهره ببرید.

– – –

مفاهیم آماری در بررسی و آنالیز بازار سهام، بورس، آتی سکه، بازارهای جهانی و ارز بسیار پرکاربرد هستند. داده‌ها به‌خودی‌خود چیزی بیشتر از اعداد نیستند، اما با استفاده از مفاهیم و روش آماری می‌توانیم این داده‌های خام را درک کنیم و از آن‌ها بهره‌ی مورد نیاز را ببریم. در مقاله‌ی پیش رو به معرفی مفاهیم مقدماتی آمار خواهیم پرداخت و در مقالات بعدی به‌تفصیل روش‌های متعدد آماری و کاربردهای متنوع آن در بازار را توضیح خواهیم داد.

آمار توصیفی

آمار توصیفی روشی برای توضیح مشخصات داده‌ها است. رسم نمودارهای توصیفی مانند انواع هیستوگرام‌ها و نمودارهای دایره‌ای، محاسبه مقادیری مانند میانگین، واریانس میانه، مد و …. که حاکی از مشخصات کلی جامعه است ابزارهایی است که در آمار توصیفی مورداستفاده قرار می‌گیرد. در آمار توصیفی هیچ‌گونه تجزیه‌وتحلیلی بر روی‌داده صورت نمی‌پذیرد و تلاش بر آن است تا با نمایش ویژگی‌های داده‌ها شناخت مناسبی نسبت به آن پیدا کنیم.

آمار استنباطی

چنانچه به جای مطالعه و بررسی کل جامعه که معمولاً غیرقابل‌دسترس است، به بررسی و تجزیه‌وتحلیل نمونه‌ای از جامعه بپردازیم آن‌گاه آمار استنباطی به ما کمک خواهد کرد.

در اغلب مواقع جوامع آن‌قدر وسیع هستند که دسترسی به‌ تمامی اطلاعات جامعه امکان‌پذیر نیست و یا هزینه بسیار زیادی برای جمع‌آوری اطلاعات باید در نظر گرفت، به همین دلیل با استفاده از روش‌های موجود در آمار استنباطی و بررسی بخشی از جامعه به شناخت جامعه می‌پردازیم. برای مثال ما نمی‌توانیم میانگین وزن جامعه را در اختیار داشته باشیم زیرا که این امر مستلزم توزین تمامی افراد جامعه است، اما می‌توانیم با استفاده از روش‌های موجود در آمار استنباطی و بررسی بخشی از جامعه (نمونه)، با درصد خطای قابل قبولی، میانگین جامعه را شناسایی کنیم.

جامعه و نمونه

وقتی در مورد جامعه آماری صحبت می‌کنیم منظور ما تمامی عناصر موجود در جامعه است. برای مثال جامعه ساکنین شهر تهران یعنی تک‌تک افراد ساکن در شهر تهران، اما وقتی در مورد نمونه‌ای از جامعه صحبت می‌کنیم یعنی اینکه به بخشی از جامعه که با روشی مشخص انتخاب‌شده است اشاره می‌کنیم. زمانی از نمونه‌گیری استفاده می‌کنیم که دسترسی به‌تمامی عناصر جامعه امکان‌پذیر نبوده و یا پرهزینه باشد.

برای مثال وقتی به بررسی داده‌های بورس می‌پردازیم اطلاعات ما محدود به چهار مقدار قیمت باز شدن، قیمت بسته شدن ، بالاترین قیمت و پایین‌ترین قیمت خواهد بود و از اطلاعات دیگر بهره‌مند نیستیم، بنابراین در بررسی بازار ناچاریم از نمونه‌ای که در اختیارداریم استفاده کنیم.

در واقع بنیان بخش اعظم سیستم‌های معاملاتی،  سیستم‌های مدیریت سرمایه و الگوریتم‌های بهینه‌یابی همین داده‌های آماری ست. با فرص حصول یک سیستم مدیریت‌سرمایه‌ی مناسب با استفاده از مبانی آموزش تحلیل تکنیکال و تحلیل فاندامنتال آن چه که برای کسب بهترین نتیجه در معاملات ضروری است تسلط بر مبانی آموزش مدیریت سرمایه گذاری و ریسک و آموزش بهینه یابی است. در هر یک می‌توان از سفارش کد نیز استفاده کرد. (سفارش کد مدیریت سرمایه و سفارش کد بهینه یابی) و از نرم افزار مدیریت سرمایه و نرم افزار بهینه یابی نیز بهره برد.

پارامترها و آماره‌های نمونه

یک پارامتر ابزاری برای اندازه‌گیری مقادیری است که در آمار توصیفی استفاده می‌گردد. برای مثال میانگین یک پارامتر است وقتی‌که در جامعه استفاده می‌گردد. پارامترهای متعددی در آمار توصیفی وجود دارند: میانگین، واریانس، مد و میانه که همه این‌ها مقادیری هستند که برای شناخت و ارائه توضیح درباره جامعه یا نمونه مورد استفاده قرار می‌گیرند. یک پارامتر تمامی خصوصیات جامعه را توضیح می‌دهد.

وقتی از یک پارامتر برای اندازه‌گیری مقادیر موردنظر در نمونه استفاده می‌کنیم در حقیقت ما در حال ایجاد یک آماره هستیم زیرا مقادیر محاسبه‌شده در نمونه، مختص نمونه است و برای شناخت جامعه ملزم هستیم که از روش‌های موجود در استنباط آماری استفاده کنیم.

انواع داده‌ها

  • داده‌های اسمی

    همان‌طور که از نام‌گذاری آن مشخص است این نوع داده‌ها در مورد اسم، صفت یا ویژگی داده‌ها هستند و نمی‌توان آنها را به‌صورت عدد در نظر گرفت و یا عملیات ریاضی بر روی آنها انجام داد. برای مثال یک عدد بنز + یک عدد پیکان معنی خاصی نخواهد داشت.

  • داده‌های رتبه‌ای

    مقیاس رتبه‌ای یا ترتیبی نسبت به مقیاس‌های اسمی پیشرفته‌تر هستند و در آنها می‌توان شدت و ضعف یک ویژگی را بررسی کرد. این نوع از متغیرها مربوط به داده‌هایی هستند که در یک نظام سلسله مراتبی، رتبه ویژگی مورد بررسی را نشان می‌دهند اما اندازه دقیقی از ویژگی را نمایش نمی‌دهند.

  • داده‌های فاصله‌ای

    این نوع مقیاس از انواع پیشین که در بالا بدان اشاره شد پیشرفته‌تر است و در آنها می‌توان علاوه بر دارا بودن ویژگی موردنظر مقادیر کمی یا کیفی آن را نیز مشاهده کرد. برای مثال نمرات دانشجویی از این نوع هستند. نمره 17 از 20 کمتر است و فاصله آنها باهم 3 نمره است.

  • داده‌های نسبی

    این نوع از داده‌ها دقیق‌ترین و بهترین داده‌ها هستند و علاوه بر سطوح مقادیر تعیین سطوح و مقادیر یک متغیر و فاصله بین مقادیر موجود می‌توان از شاخص‌های دیگری مانند میانگین هندسی و ضریب پراکنش نیز استفاده کرد. داده‌هایی مانند میزان پول، قد، وزن و …. از این نوع هستند.

توزیع فراوانی

توزیع فراوانی در آمار، اقتصاد، علوم مهندسی و همچنین در بازار خلاصه‌سازی پرسودی از داده‌ها است. با استفاده از توزیع فراوانی می‌توانیم تمام ویژگی‌ها و خصوصیات یک جامعه را به‌خوبی تعریف کنیم و همواره بتوانیم با شناخت کامل داده‌ها رفتار آنها را بررسی و پیش‌بینی کنیم. توزیع فراوانی مشاهدات و عناصر موجود را طبقه‌بندی نموده و فراوانی مشاهدات را برحسب هر طبقه توضیح می‌دهد. در توزیع این کار به‌صورت درصد یا عدد نمایش داده می‌شود.برای اینکه با توزیع بیشتر آشنا شویم یک مثال از توزیع می‌زنیم:

توزیع نرمال

یکی از مهم‌ترین و اساسی‌ترین توزیع‌ها در آمار، توزیع نرمال است. این توزیع از دسته توزیع‌های پیوسته است. به‌طورکلی بسیاری از اتفاقات طبیعی مانند باران را می‌توان با توزیع نرمال توضیح داد.

پارامترهای توزیع نرمال را در بالا مشاهده می‌کنید. توزیع نرمال دارای میانگین و واریانس مشخص است و معروف‌ترین توزیع نرمال که در آزمون‌های آماری مورداستفاده قرار می‌گیرد توزیع نرمال استاندارد با میانگین صفر و واریانس یک است.

نمودار توزیع نرمال به شکل زیر است:

01-مفاهیم مقدماتی آمار و توزیع نرمال
01-مفاهیم مقدماتی آمار و توزیع نرمال
02-مفاهیم مقدماتی آمار و توزیع نرمال
02-مفاهیم مقدماتی آمار و توزیع نرمال

 

نمودارهای بالا مربوط به چهار توزیع نرمال با میانگین‌ها و واریانس‌های مختلف است. خط قرمزرنگ نمایانگر توزیع نرمال استاندارد است.

در توزیع نرمال انتظار داریم که بیشتر داده‌ها در اطراف میانگین قرار بگیرند و هرچه از میانگین فاصله می‌گیریم تعداد داده‌ها کمتر باشد. تقریباً 68 درصد کل اعدادی که از یک توزیع نرمال گرفته می‌شوند در فاصله برابر یا کمتر از یک انحراف معیار از میانگین قرار دارند. در فاصله دو انحراف معیار از میانگین 95 درصد داده‌ها قرار می‌گیرند.

با همین استدلال است که اندیکاتور باند بولینگر ساخته می‌شود.

– – –

در صورت برقراری شرایط معاملات الگوریتمی در بازار هدف، سوای این بحث که می‌توان استراتژی‌های معاملاتی خود را به وسیله‌ی سفارش کد پایتون یا سفارش کد mql و سفارش اکسپرت کد کرد و در پروسه‌ی بک تست اعتبار سنجی نمود. همچنین می‌توان از طریق سفارش اندیکاتور به آن‌ها یک جنبه‌ی نمایشی نمایان‌تری برای تسهیل تحلیل در سابقه‌ی نماد داد.

– – –

در مقاله‌ی بعدی به بررسی «دریافت پیام صحیح یک اندیکاتور» می‌پردازیم.

لینک یک دوره‌ی ویدیویی کوتاه انگلیسی برای آشنایی با مفاهیم پایه‌ای آمار

می‌توانید از محصولات مجموعه‌ی جهان‌بورس درحوزه‌ی بهینه‌یابی(Optimize) دیدن فرمایید.

0 0 رای ها
امتیازدهی به مقاله
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
سبد خرید
هیچ محصولی در سبد خرید وجود ندارد!
خرید را ادامه دهید