امروزه یکی از مهمترین منابع اولیه برای شرکتها وجود دادههای عظیم و معنیدار است که میتواند یک شرکت و سازمان را در جهت صحیح و برای رسیدن به اهدافش هدایت کند. بهطورکلی تنها دادههای خام نیستند که برای شرکتها ارزش میآفریند بلکه اطلاعات و الگوهای نهفته درون این دادهها است که استراتژی شرکتها را میتوانند تغییر دهند. یافتن این الگوها و کشف اطلاعات از دادهها بهصورت دستی ممکن نیست و علوم نوینی همچون دادهکاوی و یادگیری ماشین و یادگیری عمیق قادر به کشف پیچیدگی و عمق در دادهها میباشد. ازاینرو یادگیری ماشین یکی از فیلدهای مطالعاتی است که کامپیوتر بدون هیچ برنامهریزی صریحی و فارغ از الگوریتمهای از قبل تعریفشدهای قادر به یادگیری باشد. این تعریف غیررسمی نشان میدهد که یادگیری ماشین زیرمجموعه هوش مصنوعی است. که در چند دهه گذشته در بسیاری از رشتهها مانند: حسابداری، پزشکی، فیزیک ذرات، زبانشناسی و علوم اعصاب کاربرد داشته است. همچنین درزمینۀ خودروهای بدون سرنشین، سیستم تشخیص گفتار، تشخیص چهره و شناخت ژنوم انسانی و غیره بهکاررفته است، اساس یادگیری ماشین، استفاده از مجموعه مشاهدات برای کشف یک فرایند اساسی است.
به تعریف تام میشل در یادگیری ماشین یک برنامه کامپیوتری میگوید از تجربهE یاد بگیر و باتجربه به دست آورده بهگونهای وظیفه T را انجام بده که کارایی آن بالا باشد فاز برای یافتن مدل یادگیری ماشین مطرحشده است. ازاینرو برای یافتن مدل الگوریتم یادگیری سه فاز طی میگردد. فاز اول تعلیم به کمک دادههای آموزشی است که با استفاده از دادههای که در اختیارداریم مدل را تعلیم داده و تعلیم دادن مدل به معنای یافتن مناسبترین پارامترها برای مدل است و معمولاً به کمک الگوریتمهای بهینهسازی و تابع هزینه پارامتر با کمترین خطا کشف میشوند. فاز بعدی فاز اعتبارسنجی است که معمولاً بهترین مدل انتخاب میگردد و فاز آخر که فاز تست است مدل پس از تعلیم و میزان شدن پارامترهایش، در این فاز عملکرد آن مورد ارزیابی قرار میگیرد و قدرت پیشی بینی مدل بر رویدادههای جدید سنجیده میشود. یادگیری ماشین راه طولانی را طی کرده است تا بخشی از زندگی روزمره امروزی ما شود. امروزه رد پای آنها را میتوان از دستیارهای شخصی در تلفنهای همراه مانند: سیری در تلفن هوشمند شرکت اپل و کورتانا در ویندوزفون های شرکت مایکروسافت تا برنامههای کاربردی امنیتی سایبری مشاهده کرد. اما امروزه مدل قدرتمندتری از یادگیری ماشین به نام یادگیری عمیق مورداستفاده قرارگرفته است. فاز تعلیم مهمترین واصلیترین بخش در شبکههای یادگیری عمیق است که یادگیری عمیق را متمایز کرده است. یادگیری عمیق بهطور چشمگیری در بسیاری از فرایندها ازجمله، تشخیص گفتار، تشخیص چهره، تشخیص اشیاء و زمینههای دیگر مانند کشف ژنوم کاربرد دارد. ازجمله مدلهای شبکه عصبی عمیق میتوان به الگوریتمهای خود رمزنگار، شبکه باور عمیق، شبکه عصبی کانولوشنی ، شبکه عصبی بازگشتی را نام برد. ازجمله مزایای یادگیری عمیق میتوان استخراج خودکار ویژگیها در دادههای پیچیده و با ابعاد بالا ، دقت بسیار بالا، و قدرت تعمیم بالا آن نام برد. الگوریتم یادگیری شبکه کانولوشنی به پردازش دادههای اصلی و خام محدود میشود ، چند دهه است که سیستم یادگیری ماشین نیازمند روشی است که از دادههای خام با ابعاد سیار بالا مانند تصاویر بتواند برداری از ویژگیها را استخراج کند تا الگوریتم بتواند با استفاده از این ویژگیها دستهبندیها را انجام دهد. مهمترین جنبه در یادگیری عمیق آن است که این ویژگیها توسط انسانها طراحی نشدهاند بلکه الگوریتمهای یادگیری عمیق این ویژگیها را از دادهها استخراج میکنند. یادگیری عمیق برای مسائلی که به کمک روشهای یادگیری ماشین بهترین عملکرد خود را نشان ندادهاند مزایای بسیاری دارد. همچنین در تشخیص الگوهای پنهان در دادههای با ابعاد بالا بسیار قدرتمند عمل کرده است. بهطورکلی با رشد و پیشرفت فناوری اطلاعات ، دادهها نرخ رشد افزایشی داشتهاند و از طرفی دانش پنهانشده در این دادهها به سازمانها و شرکتها کمک کرده است تا گام بعدی خود را برای رسیدن به اهداف خود را صحیح بردارند که یادگیری ماشین سهم عظیمی در کشف و استخراج روابط پنهان در دادهها دارد و هنگامیکه دادهها ابعاد بالاتری پیداکردهاند یادگیری عمیق پیشی گرفته و دانش با دقت و حساسیت بالاتری استخراج میگردد.