سلام
خب اونجا هم توضیح داده شده بود که چرا شبکه های کانولوشن عمیق شدن.
البته باید اینو بدونید که LeNet5 هم که وقتی اومده بود بعنوان یه معماری عمیق شناخته میشد. اما امروز شناخته نمیشه بخاطر اینکه معماری های عمیقتری اومدن و خیلی چیزها به همین خاطر تغییر پیدا کرده .
دلیل اینکه چرا بوجود اومدن بر میگرده به تلاش محققا در پیاده سازی ساختار مغز در شناسایی اشیاء. که اینا هم بطور خاص ازاواخردهه 50 میلادی با فعالیت های hubel & wiesel روی ویژوال کورتکس مغز گربه شروع شد برای اینکه بفهمن بینایی تو پستانداران به چه شکل هست. این دوتا محقق
تحقیقاتی رو روی مغز گربه شروع کردن و با نشون دادن پترنهای خاصی به گربه نتایج جالبی رسیدن اونا فهمیدن که در لایه های اولیه مغز نورن ها به لبه ها حساسیت نشون میدن و در لایه های بعدی به تصاویر سطح بالاتر. یه کلیپ جالب از کار اونها رو میتونید اینجا ببینید :
https://www.youtube.com/watch?v=8VdFf3egwfg اون صداهایی هم که میشنوید فعال سازی نورون های مغزی گربه است که الکترودهای برق به مغزش وصل شده!
تحقیقات این دو نفر اطلاعات خیلی زیادی از مغز انسان و نحوه فعالیت ویژوال کورتکس مغز ارائه کرد و باعث شد جایز نوبل رو هم دریافت کنن. یکی از چیزهایی که این دونفر فهمیده بودن این بود که ساختار محلی تصاویر در مغز حفظ میشه.نکته بعدی ای که فهمیده بودن این بود که که سلسله مراتبی از سلولها وجود داره که باعث میشه بعضی از نورونها در یک سطح خاص به جهت های خاص حساسیت نشون بدن.
بعد از ارائه تحقیقات جالب این ها بعضی ها سعی کردن که اینو مدلش کنن. اولین نمونه هم نئوکاگنیترون فوکوشیما تو دهه 80 میلادی بود که یه معماری سلسله مراتبی ساخته بود و بصورت Unsupervised سعی در آموزشش میکرد. که البته چون بک پراپگیشن هنوز معرفی نشده بود موفق نبود. بعد از اون یان لیکون بود که با ایده گرفتن از فوکوشیما و استفاده از الگوریتم بک پراپگیشن معماری شبکه های کانولوشن رو ایجاد کرد و تونست به موفقیت چشم گیری دست پیدا کنه .
پس دلیلشون تقلید از معماری مغز انسان نحوه تشخیص اشیاء در اون بود . بعدا با تحقیقات بیشتر دیدن که auditory cortex (کورتکش مخصوص به حس شنوایی) و همینطور لامسه هم عینا مثل visual cortex کار میکنن. طی یکسری آزمایش مثلا اومدن محققا اترابط گوش با auditory cortex رو قطع کردن و عوضش چشم رو بهش متصل کردن و دیدن که طرف شروع به دیدن کرد! همین کار رو با بخش مربوط به پوست و.. کردن و دیدن یک ساختار انگار داره برای همه بخشا بخوبی کار میکنه . و از اینجا ایده ها شروع شد و شبکه ها تو حوزه های دیگه هم مورد استفاده قرار گرفتن به غیر از تصاویر و....