رویکردهای مدلسازی شناختی در کنترل سیستم های پویا
دانیل وی. هولت 1* و ماگدا عثمان 2
1 گروه روانشناسی، دانشگاه هایدلبرگ، هایدلبرگ، آلمان
2 گروه روانشناسی بیولوژیکی و تجربی، دانشکده علوم زیستی و شیمی، دانشگاه کوئین مری لندن، لندن، بریتانیا
بسیاری از تصمیم گیری های انسانی در موقعیت های پویا اتفاق می افتد که در آن تصمیم گیرندگان باید تعدادی از عناصر مرتبط به هم را کنترل کنند (کنترل سیستم های پویا). اگرچه در سالهای اخیر پیشرفتهایی در جهت ارزیابی تفاوتهای فردی در عملکرد کنترل صورت گرفته است، فرآیندهای شناختی زیربنای کاوش و کنترل سیستمهای پویا هنوز به خوبی درک نشدهاند. در این مقاله دیدگاهها، سهم رویکردهای مختلف در مدلسازی شناخت در کنترل سیستمهای پویا، از جمله یادگیری مبتنی بر نمونه، مدلهای اکتشافی، مدلهای پیچیده مبتنی بر دانش و مدلهای یادگیری علی را بررسی میکنیم. نتیجه میگیریم که هر رویکرد دارای نقاط قوت خاصی در مدلسازی جنبههای خاصی از شناخت در کنترل سیستمهای پویا است. به خصوص،
معرفی
مدیریت سیستم های پویا یک نیاز رایج در زندگی روزمره است، از راه اندازی یک دستگاه فنی جدید تا مدیریت یک شرکت یا درک پویایی روابط اجتماعی. پیشرفت قابل توجهی در جهت ارزیابی کنترل سیستم های پویا (DSC) به عنوان یک مهارت شناختی، به ویژه در زمینه های آموزشی حاصل شده است ( OECD، 2014 ؛ شوپک و فیشر، 2015).). با این حال، به نظر می رسد توسعه نظریه های شناختی که فرآیندهای ذهنی زیربنای این مهارت را توصیف و توضیح می دهند، عقب مانده است. در این مقاله دیدگاهها، ما بررسی میکنیم که چه مدلهای محاسباتی شناختی میتوانند به درک بهتر فرآیندهای شناختی مختلف درگیر در DSC کمک کنند. برای این منظور، ما به طور خلاصه چندین رویکرد به مدلسازی شناختی در DSC را مرور میکنیم، نقاط قوت و ضعف نسبی آنها را خلاصه میکنیم، و با آنچه که به عنوان مسیرهای امیدوارکننده برای تحقیقات آینده درک میکنیم، نتیجهگیری میکنیم.
کنترل سیستم های پویا را می توان به عنوان شکلی از تصمیم گیری پویا تعریف کرد که به (1) یک سری تصمیمات مرتبط (2) در تعامل با یک سیستم پویا که حالت های عدم قطعیت ذهنی را القا می کند (3) با هدف دستیابی (و حفظ) نیاز دارد. وضعیت هدف و/یا کاوش در سیستم و مسیرهای ممکن عمل (همچنین رجوع کنید به ادواردز، 1962 ؛ عثمان، 2010 ). عدم قطعیت ذهنی ممکن است ناشی از نوسانات تصادفی سیستم باشد اما همچنین دانش محدود از ساختار سیستم و پویایی آن ( عثمان، 2010 ). در تحقیقات شناختی، DSC معمولاً با استفاده از ریزجهانهای شبیهسازیشده کامپیوتری مورد بررسی قرار میگیرد ، که تمرکز مقاله حاضر است (اما به Klein et al., 1993 مراجعه کنید.، برای یک رویکرد متفاوت). ریزجهانها ویژگیهای شناختی مرتبط موقعیتهای DSC را تقلید میکنند (مانند اطلاعات محدود، بازخورد تاخیری، فشار زمان) که در یک محیط معقول معنایی مانند مدیریت یک شرکت یا مبارزه با آتشسوزی جنگل قاببندی شدهاند ( برهمر و دورنر، 1993 ؛ گونزالس و همکاران، 2005 ) . .
در این مقاله، اصطلاحات مدل شناختی یا مدل محاسباتی ( شناخت ) به هر توضیح مکانیکی از فرآیندهای شناختی اشاره دارد که به اندازه کافی مشخص شده باشد تا امکان اجرای مبتنی بر رایانه را فراهم کند که پیشبینیهای کمی از رفتار، مراحل پردازش شناختی یا فعالیت عصبی را به همراه داشته باشد ( لواندوفسکی و فارل، 2011). مدلهای محاسباتی کامل بودن مفهومی را اعمال میکنند، زیرا تمام ویژگیهای مربوط به عملکرد یک نظریه باید برای اجرای محاسباتی آن صریح باشد. علاوه بر این، مدلهای محاسباتی پیشبینیهای دقیقی از الگوهای داده ایجاد میکنند که میتوانند بهطور تجربی آزمایش شوند، که اغلب نظریههای بیان شده به صورت کلامی قادر به انجام آن با همان سطح دقت نیستند. مدلهای پیادهسازیشده بهعنوان برنامههای رایانهای نیز میتوانند برای کاوش مبتنی بر شبیهسازی استفاده شوند تا بررسی کنند که چگونه تنظیمات پارامترهای مختلف، مفروضات در مورد فرآیندهای شناختی، یا خواستههای کار شبیهسازی شده بر رفتار مدل تأثیر میگذارند. برای درمان جامع مدلسازی محاسباتی در شناخت – از جمله چالشها و مشکلات آن – لطفاً به لواندوفسکی و فارل (2011) مراجعه کنید.
اکنون سهم رویکردهای مختلف در مدلسازی شناخت در DSC را با مثالهای انتخاب شده در نظر خواهیم گرفت. بررسی مختصر ما با پارادایمهای مدلسازی نسبتاً ساده و ناب دانش آغاز میشود و به سمت رویکردهایی که استراتژیها و ساختارهای دانش پیچیدهتر را شامل میشوند، حرکت میکند (برای یک نمای کلی به جدول 1 مراجعه کنید ).
میز 1
www.frontiersin.org
جدول 1. رویکردهای اساسی به مدل سازی شناختی در کنترل سیستم های پویا (DSC).
یادگیری مبتنی بر نمونه
مدلهای یادگیری مبتنی بر نمونه (IBL) مسلماً یکی از موفقترین رویکردها برای مدلسازی شناختی در DSC بودهاند. آنها بر اساس یک اصل ساده مشابه با یادگیری تقویتی هستند: اقدامات کنترلی که منجر به یک نتیجه موفقیت آمیز می شوند در حافظه تقویت می شوند و بنابراین به احتمال زیاد در صورت مواجهه با وضعیت مشابه در آینده به خاطر سپرده می شوند و اجرا می شوند ( گونزالس و همکاران، 2003 ) . . کاربرد این اصل یادگیری در DSC را می توان به Berry and Broadbent’s (1984) ردیابی کرد.نیمه کار بر روی کسب دانش در سیستم های پویا در کار ساده فریبنده آنها، تولید یک کارخانه قند شبیه سازی شده باید با تعدیل تعداد کارگران در محدوده هدف نگه داشته می شد. با کمال تعجب، اکثر شرکت کنندگان قادر به توصیف شفاهی ساختار سیستم با وجود اینکه قادر به کنترل آن بالاتر از سطح شانس بودند، نبودند. به عنوان توضیح، برودبنت و همکاران. (1986)پیشنهاد کرد که افراد ممکن است نمونههایی از ترکیبهای موقعیت-عملی را که تجربه کردهاند در حافظه ذخیره کنند (به عنوان مثال، استخدام X کارگر زمانی که تعداد فعلی کارگران Y و تولید فعلی Z است). تصمیم گیری بعدی به نوبه خود مبتنی بر بازیابی خاطرات نمونه مشابه با موقعیتی است که با آن مواجه می شویم. مواردی که به طور مکرر با نتایج موفقیت آمیز مرتبط هستند (مثلاً رسیدن به تولید هدف) در حافظه تقویت می شوند و به تدریج شروع به تسلط بر رفتار می کنند، اگرچه هیچ بازنمایی کلامی از ساختار سیستم شکل نگرفته است.
یک مدل محاسباتی IBL از کار کارخانه قند توسط Taatgen و Wallach (2002 ؛ همچنین رجوع کنید به Dienes and Fahey، 1995 ) با استفاده از معماری شناختی ACT-R اجرا شده است ( اندرسون و همکاران، 2004 ). هر نمونه به عنوان یک واحد در حافظه اعلامی که وضعیت فعلی، عمل و نتیجه را رمزگذاری میکند، مدلسازی شد. در مواجهه با یک وضعیت سیستم معین، مدل به دنبال حافظههای نمونهای میگردد که شبیه به حالت فعلی هستند و در گذشته به نتیجه هدف منتهی شدهاند، با در نظر گرفتن تعداد دفعاتی که حافظه نمونه قبلاً بازیابی شده است. این مدل تنها به دو قانون تولید نیاز دارد و کاملاً با رفتار انسان مطابقت دارد. مدلی از کارخانه قند با تکیه بر مکانیزم یادگیری انجمنی مشابه توسط گیبسون و همکاران اجرا شد. (1997)با استفاده از شبکه عصبی مصنوعی این نشان می دهد که اصل یادگیری پایه مستقل از هر معماری مدل سازی خاصی است. IBL همچنین برای مدل سازی وظایف پیچیده تر مانند کنترل مجموعه ای از پمپ ها در یک کارخانه تصفیه آب شبیه سازی شده که در آن وضعیت سیستم در زمان واقعی تغییر می کند ( Gonzalez et al., 2003 ) استفاده شده است. این مدل شامل یک مکانیسم ترکیبی برای درونیابی اطلاعات در بین نمونههای مرتبط بود و در زمانی که حافظههای نمونه کافی نبود، به یک اکتشافی تصمیم ساده به عنوان بازگشتی متکی بود. یک پیادهسازی کلی از چارچوب IBL توسط دات و گونزالس (2012) در دسترس قرار گرفته است تا مدلسازی IBL را برای مدلسازان غیرمتخصص در دسترس قرار دهد.
یک رویکرد مشابه IBL توسط گلس و عثمان (2017 ؛ همچنین عثمان و همکاران، 2015 ) برای مدلسازی یادگیری در یک سیستم پویا ساده با متغیرهای ورودی و خروجی پیوسته استفاده شد. به جای تکیه بر معماری شناختی، نویسندگان یک الگوریتم یادگیری تقویتی همه منظوره را برای این کار تطبیق دادند ( ساتون و بارتو، 1998 ). این مدل تاریخچه تقویت متغیرهای ورودی را پس از هر آزمایش بسته به اینکه آخرین اقدام چقدر فاصله هدف را کاهش داد، به روز کرد. این منجر به رفتار مدل به طور گسترده ای شبیه به IBL می شود. گلس و عثمان (2017)به طور خاص بر روی مدلسازی تفاوتهای گروهی بین بزرگسالان جوان و مسن از نظر رفتار اکتشافی در مقابل رفتار بهرهکشی متمرکز شده است. آنها این ترجیح رفتاری را بر روی پارامتر نویز که بر انتخاب مقادیر ورودی تأثیر می گذارد، ترسیم کردند. یادگیری تقویتی همچنین برای مدلسازی تعارضات بین اهداف کوتاه مدت و بلند مدت و اینکه چگونه اطلاعات غیرقابل اعتماد بر یادگیری در کنترل پویا تأثیر می گذارد استفاده شده است ( گورکیس و لاو، 2009 ).
در مجموع، مدلهای یادگیری تقویتی و IBL با موفقیت برای توضیح جنبههای مختلف اکتشاف و کنترل در DSC مورد استفاده قرار گرفتهاند. مکانیسم اساسی ساده، از نظر شناختی قابل قبول است و تنها به چند فرض خاص کار نیاز دارد. با این حال، مدلهای IBL به شدت به در دسترس بودن بازخورد پیامد فوری و تکرار مکرر موقعیتهای تصمیم مشابه برای تسهیل یادگیری بستگی دارد، که نوع کار را که میتوان برای آن اعمال کرد محدود میکند (جدول 1 را ببینید ). علاوه بر این، مدلهای IBL نمیتوانند به راحتی توضیح دهند که چگونه افراد دانش صریح از ساختار علی یک سیستم را که عنصر مرکزی برخی از وظایف DSC است به دست میآورند (به عنوان مثال، Kluge، 2008 ؛ Wüstenberg و همکاران، 2012 ).
مدل های اکتشافی
رویکردهای مبتنی بر اکتشاف به DSC فرض میکنند که افراد برای کنترل سیستمهای پویا به استراتژیهای تصمیم گیری ساده از نوع قانون سرانگشتی تکیه میکنند. این استراتژیها یک نتیجه بهینه را تضمین نمیکنند، اما به دستیابی به نتایج معقول در طیف وسیعی از شرایط با تلاش شناختی محدود اجازه میدهند ( برهمر، 2005 ؛ شاه و اوپنهایمر، 2008 ). مشخصاً، راهبردهای اکتشافی نه مستلزم استدلال پیچیده و نه بازنمایی ذهنی دقیق از ساختار مسئله است. تحقیقات تجربی نشان داده است که اکتشافی می تواند رفتار تطبیقی را در بسیاری از موقعیت های تصمیم گیری و همچنین خطاها و سوگیری های رایج توضیح دهد ( گیلوویچ و همکاران، 2002 ؛ گیگرنزر و برایتون، 2009).). علاوه بر این، به دلیل سادگی، اکتشافیها به عنوان مدلهای شناختی پیادهسازی نسبتاً آسانی دارند (به عنوان مثال، Marewski و Mehlhorn، 2011 ).
استفاده از اکتشافی نیز به عنوان توضیحی برای رفتار تصمیم گیری در DSC پیشنهاد شده است (به عنوان مثال، برمر و الگ، 2005 ؛ کرونین و همکاران، 2009 ). یکی از بهترین نمونه های شناخته شده یک مدل اکتشافی محاسباتی در DSC، مدل تصمیم گیری استرمن (1989) در یک وظیفه مدیریت زنجیره تامین است. این مدل بر اساس اکتشافی لنگر انداختن و تنظیم است ( Tversky and Kahneman, 1974)) که شامل جایگزینی یک مقدار ناشناخته (مواد سفارش داده شده) با یک مقدار شناخته شده مرتبط (پیش بینی فروش)، تنظیم برای تأثیرات بیشتر (سطح موجودی فعلی) است. داده های شبیه سازی شده با استفاده از این اکتشافی، دقیقاً با رفتار انسان مطابقت دارد و نوسان مشخصه بین عرضه بیش از حد و کمبود را که از نادیده گرفتن تاخیرهای سیستم ناشی می شود، بازتولید می کند ( Sterman, 1989 ). وظیفه تنظیم دمای سردخانه ( Reichert و Dörner، 1988 ) چالش مشابهی را برای شرکت کنندگان ایجاد می کند، زیرا سیستم با تاخیر به ورودی های تغییر یافته پاسخ می دهد. رایچرت و دورنر (1988)این مدل نشان میدهد که چگونه شرکتکنندگان به تدریج کنترل سیستم را با اعمال تغییرات افزایشی در یک اکتشافی با کنترل تناسبی پس از تلاشهای ناموفق کنترل میآموزند. یک استراتژی اکتشافی تطبیقی مرتبط با مفهوم، یادگیری جهت دار است: اگر افزایش یک ورودی نتیجه را بهبود می بخشد، به افزایش آن ادامه دهید، در غیر این صورت آن را کاهش دهید. برای مثال، مدلهای محاسباتی یادگیری جهتدار برای مدلسازی رفتار در بازیهای اقتصادی پویا، مانند معمای زندانی چند دور یا بازی اولتیماتوم، استفاده شدهاند ( سلتن و استوکر، 1986 ؛ گروسکوپف، 2003 ).
مدلهای اکتشافی همچنین میتوانند با یادگیری تقویتی ترکیب شوند تا نحوه انتخاب افراد از بین استراتژیهای اکتشافی رقیب را شبیهسازی کنند. احتمال انتخاب یک استراتژی بستگی به نتایجی دارد که این استراتژی در گذشته ایجاد کرده است ( ارو و بارون، 2005 ). به عنوان مثال، گونزالس و همکاران. (2009) از این رویکرد برای مدلسازی زمان پاسخ در یک کار تشخیص راداری و تصمیمگیری پویا استفاده کرد. این مدل دادههای انسانی را و همچنین یک مدل جایگزین IBL برازش میدهد، اگرچه به شرایط کاری تغییر یافته به خوبی کمتر منتقل میشود. در مقابل، فوم و استوکو (2003) دریافتند که یک مدل یادگیری مبتنی بر استراتژی از کار کارخانه قند در شرایط تغییر یافته بهتر از مدل IBL متناظر Taatgen و Wallach (2002) عمل می کند.. به نظر می رسد که انتقال در موقعیت ها به جزئیات کار، نوع آموزش و استراتژی های اجرا شده بستگی دارد. یادگیری مبتنی بر استراتژی همچنین می تواند برای کارهای بسیار پیچیده مانند مبارزه با آتش سوزی شبیه سازی شده در جنگل اعمال شود ( De Obeso Orendain and Wood, 2012 ). در این مدل چهار استراتژی اکتشافی سطح بالا با هم رقابت کردند (به عنوان مثال، انداختن آب روی آتش یا ایجاد مانع برای مهار آتش)، که با جزئیات بسیار مدلسازی شدند. این مدل با موفقیت بازتولید کرد که چگونه شرایط متفاوت در مرحله آموزش بر ترجیحات استراتژی های خاص در انتقال بعدی تأثیر می گذارد.
در مجموع، چندین نمونه خوب از مدلهای مبتنی بر اکتشاف و مدلهای ترکیبی وجود دارد که به سؤالات نظری مرتبط در DSC (مثلاً تأخیر در رسیدگی، انتقال یادگیری) میپردازد. اگرچه مدلهای این نوع دانش بیشتر نسبت به مدلهای یادگیری خالص، دانش مربوط به کار را در بر میگیرند، اما معمولاً هنوز ساختار اولیه نسبتاً سادهای دارند. هنگامی که مدلهای اکتشافی با استراتژیهای پیچیدهتر و ساختارهای دانش انتزاعی گسترش مییابند، به تدریج به مدلهای پیچیده مبتنی بر دانش تبدیل میشوند که در ادامه به بررسی آنها خواهیم پرداخت.
مدل های پیچیده مبتنی بر دانش
مدل های پیچیده مبتنی بر دانش شامل ایجاد و تبدیل ساختارهای دانش انتزاعی همراه با راهبردهای شناختی پیچیده است. این با مفهوم مدل های ذهنی هدایت کننده استدلال و اعمال در DSC مطابقت دارد (به عنوان مثال، Brehmer، 1992 ). مدلهایی از این نوع اغلب بهعنوان سیستمهای تولید، به عنوان مثال، مجموعهای از قوانین if-then-که بر روی اشیاء دانش عمل میکنند یا رفتارهای بیرونی را آغاز میکنند، اجرا میشوند ( نیول و سیمون، 1972 ). این مکانیزم انعطافپذیر امکان بیان طیف وسیعی از استراتژیها تا عملکرد متخصص را به قیمت ایجاد مدلهای بسیار پیچیده و خاص در بسیاری از موارد فراهم میکند.
آنزای (1984) یکی از اولین مدل ها از این نوع را در زمینه ناوبری یک کشتی بزرگ شبیه سازی شده ارائه کرد که با تاخیر قابل توجهی پاسخ داد. بر اساس تجزیه و تحلیل پروتکل های کلامی، آنزای (1984) یک مدل سیستم تولیدی را طراحی کرد که به طور کیفی کسب دانش کنترل را در افراد تازه کار و متخصص به تصویر کشید. مطالعات بعدی نشان داد که چگونه رویکردهای سیستم تولید را می توان برای عملکرد مدل گسترش داد حتی در وظایف تصمیم گیری در زمان واقعی پیچیده مانند عملیات رادار یا پرواز با هواپیمای جت تجاری ( Schoelles and Gray, 2000 ; Schoppek and Boehm-Davis, 2004 ). . در مدلسازی وظایف کنترل بلادرنگ، معمولاً تأکید بر مدلسازی دوره زمانی عملکرد کنترل و خطاهای معمولی است.
یک کلاس متفاوت از وظایف DSC که به استدلال علمی برای کشف ساختار علی سیستمهای ناشناخته نیاز دارد، بهویژه در موج اخیر تحقیقات DSC با محوریت آموزشی مرتبط بوده است ( Herde et al., 2016 ). شوپک (2002) یک مدل شناختی ریزدانه را پیشنهاد کرد که قادر بود به طور سیستماتیک یک سیستم دینامیکی کوچک را بر اساس معادلات خطی کاوش و کنترل کند. این مدل یک نمایش ذهنی صریح از ساختار سیستم و مراحل محاسبه ذهنی را برای استخراج مقادیر ورودی گنجانده است. این استراتژی برای کنترل هر سیستم دینامیکی ساده بر اساس معادلات خطی به اندازه کافی کلی است ( Funke, 2001).). این مدل توانست اثرات درجات مختلف دانش سیستم و پیچیدگی استراتژیک را شبیه سازی کند و به طور مطلوب با نتایج داده های انسانی مقایسه شود ( Schopek, 2002 ). به طور مشابه، Schunn و Anderson (1998) یک رویکرد سیستم تولید را برای مدلسازی کار طراحی آزمایشهای علمی (با توجه به مجموعه محدودی از گزینههای طراحی) و نتیجهگیری در مورد روابط علی از نتایج شبیهسازی شده به کار بردند. این مدل با مدل سازی دانش حوزه مربوطه و استراتژی های اکتشافی آنها توانست تفاوت های عملکردی بین متخصصان و تازه کارها را با موفقیت به تصویر بکشد.
مزیت آشکار مدلهای مبتنی بر دانش پیچیده، توانایی آنها در توضیح این است که چگونه دانش سیستم علّی همراه با استراتژیهای استدلالی، اقداماتی را که افراد انجام میدهند، آگاه میسازد. تصور اینکه چگونه برخی از اشکال DSC میتوانند بدون توسل به استدلال و بازنمایی دانش انتزاعی توضیح داده شوند، بهعنوان مثال، برونیابی رفتار سیستم در موقعیتهای جدید یا آزمون فرضیهها و استنتاج قوانین در یادگیری اکتشافی، دشوار به نظر میرسد. با این حال، مدلهایی از این نوع اغلب نه ساده و نه ظریف هستند و نیاز به گنجاندن دانش قابلتوجه ویژه کار دارند ( تاتگن و اندرسون، 2010 ).
آموزش CaUsaL Bayesian
یکی دیگر از رویکردهای مدلسازی با تمرکز بر دانش ساختاری، استفاده از شبکههای بیزی برای مدلسازی یادگیری علی است ( Meder et al., 2010 ; Osman, 2017 ). شبکههای بیزی فرمالیسمی را برای بیان قدرت باور در فرضیههای علّی نشان میدهند و مکانیزمی اصولی مبتنی بر استنتاج بیزی برای بهروزرسانی باورها با در دسترس قرار گرفتن شواهد جدید ارائه میکنند ( هولیوک و چنگ، 2011 ). به عنوان مثال، Steyvers و همکاران. (2003)از شبکههای بیزی برای مدلسازی یادگیری علی انسانی از طریق مشاهده غیرفعال یک سیستم علی یا از طریق تعامل مستقیم با آن استفاده کرد. این به جنبه مرکزی DSC، کاوش سیستم و شکلگیری دانش ساختاری میپردازد، اگرچه این رویکرد هنوز برای وظایف DSC که نیاز به کنترل هدفمند دارند، اعمال نشده است.
از دیدگاه DSC، قدرت مدلهای بیزی یادگیری علی در نمایش دقیق ساختارهای علی و وابستگیهای احتمالی همراه با مکانیزمی برای بهروزرسانی این دانش از تجربه نهفته است. این باعث می شود که آنها رقیبی قوی برای توضیح اکتساب دانش ساختاری در وظایف DSC با تمرکز بر اکتشاف باشند (به عنوان مثال، Kluge، 2008 ؛ Wüstenberg و همکاران، 2012 ). رویکرد بیزی گزارشی رسمی از محیط علّی ارائه می دهد که از آن می توان با توجه به وضعیت دانش (شامل سطح عدم اطمینان) از جهان در آن زمان، یک مسیر عمل مناسب را استنتاج کرد ( عثمان، 2010 ، 2017 ).
ترکیب و سخنان پایانی
در پی پاسخ به این سوال که چه مدلسازی شناختی میتواند به تحقیقات DSC کمک کند، چندین رویکرد را در نظر گرفتهایم (جدول 1 را ببینید).). از نظر رویکردهای مدلسازی ناب دانش، IBL تعادل خوبی بین سادگی، معقول بودن شناختی و قدرت توضیحی برای طیف وسیعی از وظایف DSC ایجاد میکند. از جنبه منفی، IBL الزامات سختگیرانه ای دارد (به عنوان مثال، در دسترس بودن بازخورد، تصمیمات مکرر) و نمی تواند به راحتی کسب دانش علّی یا برون یابی را به شرایط ناآشنا توضیح دهد. مدلهای اکتشافی هیچ الزامات وظیفه جهانی ندارند و میتوانند با مکانیسمهای یادگیری ترکیب شوند تا به سازگاری مشابه مدلهای IBL دست یابند. با این حال، از آنجایی که اکتشافات موثر بر بهره برداری از ساختار محیط تکیه می کنند، یافتن اکتشافی نامزد مناسب برای یک کار معین می تواند چالش قابل توجهی باشد و هر مدل مبتنی بر اکتشاف خاص فقط برای یک جایگاه خاص قابل استفاده است ( Marewski and Schooler, 2011 ).
مدل های پیچیده مبتنی بر دانش احتمالاً خاص ترین نوع مدل هستند. آنها به فرضیات قوی در مورد ساختارهای دانش و رویه های شناختی مورد استفاده توسط تصمیم گیرندگان نیاز دارند. اگر این اطلاعات در دسترس باشد، میتوان عملکرد متخصص ماهر، استراتژیهای استدلال دقیق و کسب دانش ساختاری صریح را مدلسازی کرد، به عنوان مثال، از طریق آزمون فرضیههای فعال. با توجه به مدلسازی دانش علی، مدلهای بیزی یادگیری علی جایگزین جالبی ارائه میکنند.
آنها حساب یکپارچه ای برای بازنمایی و به روز رسانی دانش علی در یک چارچوب منسجم، از جمله نمایش عدم قطعیت معرفتی ارائه می دهند. با این حال، این مدلها تاکنون مستقیماً برای کنترل مدل در وظایف DSC میکروجهان اعمال نشدهاند.
همانطور که بحث ما نشان می دهد، هر رویکرد مدل سازی دارای نقاط قوت و ضعف خاص خود است که آن را برای وظایف مدل سازی خاص مناسب می کند. بنابراین برای محققین مهم به نظر می رسد که رویکرد مدلسازی را انتخاب کنند که با سؤال تحقیق مطابقت داشته باشد و با وظیفه مدلسازی مناسب باشد. برای مثال، مدلسازی فرآیند کسب دانش علی صریح در سیستمهای پویا ساده از طریق آزمون فرضیهها (به عنوان مثال، Wüstenberg و همکاران، 2012 ) به طور طبیعی بر روی مدلهای پیچیده مبتنی بر دانش یا مدلهای بیزی یادگیری علّی نقشهبرداری میکند، اما احتمالاً زمانی که با مشکلاتی مواجه میشود. با یک چارچوب IBL نزدیک شد.
به طور کلی، ما فکر میکنیم که نظریههای به سرعت در حال پیشرفت در یادگیری علی و مدلهای ترکیبی که استراتژیهای اکتشافی را با یادگیری تقویتی ترکیب میکنند، پتانسیل دستنخورده قابلتوجهی را برای مدلسازی شناختی در DSC ارائه میدهند. یادگیری علی مستقیماً به موضوع اصلی وظایف DSC با تمرکز بر کاوش علی می پردازد (به عنوان مثال، استیورز و همکاران، 2003 ). با این حال، برای شبیهسازی مدلهای عملکرد کامل کار از این نوع، باید با گنجاندن تعامل با کار، توسعه داده شود. مدلهای ترکیبی به نوبه خود ممکن است برای مدلسازی رفتار در وظایف تصمیمگیری پیچیده مناسبتر باشند (به عنوان مثال، دانر و همکاران، 2011 )، که در آن کاهش اطلاعات (با هدایت اکتشافی) و انطباق تدریجی استراتژی برای عملکرد کار مرکزی هستند.
علاوه بر این، ما پیشنهاد میکنیم که مدلهای محاسباتی مبتنی بر مفروضات فرآیندی قابل قبول شناختی (مانند یادگیری تقویتی، استفاده از اکتشافات ساده، بهروزرسانی دانش بیزی) میتواند به عنوان معیاری برای ارزیابی عملکرد انسان در DSC استفاده شود (به Brehmer، 2005 مراجعه کنید ). این در تضاد با استفاده از بهینه سازی ریاضی یا استراتژی های منطقی بهینه به عنوان معیاری برای عملکرد است (به عنوان مثال، ساگر و همکاران، 2011 ). تعریف استراتژی های منطقی بهینه در DSC جای خود را دارد، برای مثال هنگام طراحی سیستم های پشتیبانی تصمیم. با این حال، از منظر رفتاری، سؤال «چه چیزی حداکثر ممکن است» اغلب کمتر از «آنچه برای انسان است» مرتبط است.ممکن است، با توجه به واقعیت های اطلاعات ناقص و ظرفیت شناختی محدود ( کلین، 2002 ).
در نتیجه، به نظر میرسد مدلهای محاسباتی شناخت مسیر امیدوارکنندهای را برای پیشبرد تحقیق و توسعه نظریه در DSC ارائه میدهند. رویکردهای محاسباتی با موفقیت برای مدلسازی طیفی از پدیدههای شناختی در حوزههای مختلف DSC مورد استفاده قرار گرفتهاند. نقاط شروع امیدوارکننده برای پیشرفتهای بیشتر شامل پیشرفتهای اخیر در یادگیری علی و مدلهای ترکیبی است که اکتشافی ساده را با مکانیسمهای یادگیری تقویتی ترکیب میکند. مدلسازی محاسباتی فرآیندهای شناختی در DSC همچنان یک چالش سازنده است که درک ما از رفتار انسان را در محیطهای پویا پیچیده بررسی میکند – و به طور ایدهآل آن را افزایش میدهد.
نحوه درک و مدلسازی سیستمهای پویا پیچیده
مقدمه ای بر سیستم دینامیک، کم ارزش ترین تکنیک شبیه سازی
تصویر توسط نویسنده
Yبا استارتاپ خود وارد بازار می شوید و محصول شما دنیا را مختل می کند. شما چنان موفقیت بزرگی دارید که نمی توانید تقاضای فوق العاده را برآورده کنید. شرکت های بزرگ با کاهش قیمت محصولات خود و تقلید از رویکرد شما نسبت به ورود شما به بازار واکنش نشان می دهند. شما پیشنهاداتی از شرکت های چندملیتی دریافت می کنید تا یا استارت آپ خود را بخرید یا تولید را برون سپاری کنید.
و شما به تنهایی باید تصمیم بگیرید.
شما خوشحال خواهید شد که آینده را در هر یک از سناریوهای مختلف بدانید. اما دنیا پیچیده است!
چه کاری باید انجام دهید؟
ما در دنیای پیچیده ای زندگی می کنیم و تغییرات دائمی داریم. کوتاه مدت مانند سقوط بازار مالی که در عرض چند ساعت اتفاق می افتد، یا تغییرات بلندمدت مانند رشد جمعیت زمین.
مشکلات دینامیکی پیچیده در بسیاری از زمینه ها یافت می شود. به عنوان مثال می توان به تغییرات محیطی مانند تغییرات آب و هوا، کشاورزی مانند تولید و عرضه مواد غذایی، تغییرات و تأثیرات فناوری، توسعه اجتماعی-اقتصادی، یا عملیات بیمارستان اشاره کرد.
درک تصویر بزرگ و درک پویایی سیستم های پیچیده دشوار است.
تفکر معمول ما برای دریافت درک سیستم های پیچیده، تفکر تحلیلی به اصطلاح “علت ریشه ای” است. این تفکر خطی است که در آن فرض می شود که نتیجه بر اساس یک توالی خطی از اقدامات یا تصمیمات است.
گرافیک توسط نویسنده
یک اثبات ریاضی معمولاً به طور مکرر از این ترتیب پیروی می کند.
اما همه ما می دانیم که واقعیت روزمره در زندگی ما متفاوت به نظر می رسد.
در دنیای واقعی، ما افراد دیگری را داریم که در آنها تعامل داریم، به اصطلاح عامل. شرکتها و شرکتهای چندملیتی ذکر شده در بالا از این قبیل نمایندگان هستند. ما (امیدواریم) از رفتار خود درس می گیریم و این بازخورد را در اقدامات جدید خود در نظر می گیریم. به طور مداوم در طول زمان و به صورت غیر خطی در حال تغییر است.
بنابراین، واقعیت (ساده شده) بیشتر شبیه این به نظر می رسد.
گرافیک توسط نویسنده
در حال حاضر این مثال ساده به موقعیت بسیار پیچیده ای منجر می شود و توانایی ما را برای درک آن تحت تأثیر قرار می دهد.
خیلی اوقات، فقط داده های پراکنده یا بدون داده در دسترس است، به طوری که تمام رویکردهای یادگیری ماشینی تبلیغاتی نمی توانند اعمال شوند. هیچ استارتاپی مثل شما قبلا وجود نداشت و شما هیچ مقایسه ای ندارید.
پس سوال اینجاست که آیا ریاضیات می تواند راه حل دیگری در مواجهه با چنین شرایطی ارائه دهد؟
System Dynamics – معمولاً مخفف SD را مییابید – چنین تکنیک شبیهسازی است که یک سیستم را بهعنوان یک کل در نظر میگیرد تا بخشهای مجزا مانند، به عنوان مثال، بیشتر روشهای علم داده طراحی شدهاند.
دینامیک سیستم یک رویکرد و متدولوژی است که مبتنی بر تئوری کنترل است.
تئوری کنترل با رفتار دینامیکی یک سیستم سر و کار دارد. ایده این است که یک به اصطلاح “کنترل کننده” متغیر ورودی را دستکاری می کند تا نتیجه مطلوب حاصل شود.
گرافیک توسط نویسنده
علاوه بر این، تئوری کنترل حلقه های بازخورد را ادغام می کند، به عنوان مثال، متغیرهای ورودی تا حدی توسط پاسخ های خروجی تعیین می شوند.
گرافیک توسط نویسنده
با این دو عنصر می توانیم سیستم های دینامیکی پیچیده ای را طراحی کنیم. یک مثال از فیزیک مدارهای الکتریکی متشکل از مقاومتها، سلفها و خازنها هستند که دینامیک («فلشها») با معادلات دیفرانسیل توصیف میشوند.
در مدیریت اتاق عمل بیمارستان، ما بسیاری از این عناصر را داریم:
عوامل: بیماران، پزشکان، جراحان، کارکنان پرستاری و غیره.
متغیرهای ورودی: بیماران برنامه ریزی شده و اورژانس، ظرفیت برنامه ریزی شده (در دسترس) (اتاق عمل، تجهیزات، کارکنان، تخت ها، …)، ساعات کاری اتاق های عمل، مسیرهای حمل و نقل بیمار و تجهیزات، و غیره
کنترل کننده: ظرفیت واقعی (اتاق عمل، تجهیزات، پرسنل)، نوع و شدت جراحی ها، وضعیت بیمار، زمان تمیز کردن اتاق عمل بین دو عمل و غیره.
خروجی مطلوب: بهترین میزان موفقیت سلامت، بیمار راضی، سود مالی برای بیمارستان و غیره.
مدیریت اتاق عمل چنین بیمارستانی را چگونه برنامه ریزی می کنید؟
Jay W. Forrester، مهندس کامپیوتر و استاد دانشکده مدیریت اسلون MIT، در اواخر دهه 1950 رویکرد دینامیک سیستم را توسعه داد.
او بر اساس پیشینه مهندسی و علمی خود، یک رویکرد مبتنی بر مدل را برای مطالعه محاسباتی دینامیک پیچیده، یعنی سیستمها و سازمانهای وابسته به زمان ایجاد کرد. او با این مدل ها زنجیره تامین و فرآیندهای تولید را مطالعه کرد. و او می تواند نشان دهد که نه نیروهای بازار، بلکه شیوه های مدیریتی باعث ایجاد چرخه در فرآیندها می شود.
برخلاف باور عمومی که مدیران با استعداد شرکت ها را به سمت موفقیت هدایت می کنند، او با مدل های خود نشان داد که انسان تنها یک بازیکن در یک بازی پیچیده است. البته این باعث نشد که او دوستان زیادی پیدا کند.
با این وجود، به دلیل ویژگی جامع دینامیک وابسته به زمان، دیدگاه بلندمدت، بازخوردها و تأخیرهای زمانی یکپارچه، و ترکیب غیرخطیها، مدلها در بسیاری از زمینهها اتخاذ شدهاند.
این رویکرد همچنین حاوی عناصر عینی و ذهنی است. زمانی که داده در دسترس باشد، متغیرها و وابستگی ها را تعیین می کند. زمانی که هیچ داده ای در دسترس نباشد، افراد می توانند آن ها را بر اساس قضاوت تخصصی خود تعریف کنند.
بیایید اکنون به جزئیات این رویکرد بپردازیم.
نمودار حلقه علّی
نمودار حلقه علّی، تجسم یک سیستم پویا است که متغیرها و نحوه ارتباط آنها را نشان می دهد (به عنوان مثال، تصویر عنوان را ببینید).
نمودارهای حلقه علّی از چهار عنصر تشکیل شده است.
متغیرها،
پیوند بین متغیرها (“فلش”)،
علامت پیوند (“مثبت”، به عنوان مثال، اثرات تقویت کننده، یا “منفی”، به عنوان مثال، کاهش اثرات)، و
علامت یک حلقه در سیستم (نوع رفتار سیستم)
متغیرها و فلش ها
متغیرها مقادیری هستند که ممکن است تغییر کنند یا تغییر کنند. به عنوان مثال می توان به ظرفیت تولید در ساعت، یا نرخ خرابی ماشین، سهمیه ماهیگیری یا کیفیت آب در مطالعات زیست محیطی اشاره کرد.
متغیرها با فلش به هم متصل می شوند.
هر فلش یک اثر از یک متغیر به متغیر دیگر را نشان می دهد. تأثیر می تواند مثبت یا منفی باشد.
یک اثر مثبت به این معنی است که اولی، یعنی متغیر ورودی، متغیر دوم را یا با کاهش یا تسریع متغیر دوم تقویت می کند. یک اثر منفی به این معنی است که متغیر ورودی متغیر دوم را تخلیه می کند.
گرافیک توسط نویسنده
در مورد صف، هرچه مشتریان بیشتری وارد شوند، زمان انتظار تا ارائه خدمات بیشتر است. بنابراین، اثر افزایش می یابد. از طرف دیگر، هرچه مشتریان بیشتری ترک کنند، زمان انتظار کوتاهتر می شود که اثر کاهشی دارد.
بازخورد و حلقه علّی
تعریف : زمانی که یک عنصر از یک سیستم به طور غیرمستقیم خود را در سیستم تحت تأثیر قرار می دهد، حلقه بازخورد یا حلقه علّی نامیده می شود .
به نظر می رسد پس از آن مانند این.
گرافیک توسط نویسنده
تعریف: حلقه باز یک زنجیره خطی از علل و معلول است که به خود بسته نمی شود.
برای مثال می توانید به قانون جدیدی که توسط دولت معرفی شده است فکر کنید که بر تصمیم گیری شما تأثیر می گذارد. معمولاً هیچ بازخوردی از تصمیم گیری شما به قانون جدید وجود ندارد.
گرافیک توسط نویسنده
حلقه های بازخورد مثبت و منفی
اکنون می توانیم هر فلش را در یک حلقه گاه به گاه با علامت مربوط به تأثیر آن نشان دهیم. این نوع رفتار سیستم پویا را به ما می دهد.
یک مثال گویا تخم مرغ و مرغ است. هر چه تعداد تخم ها بیشتر باشد، جوجه های بیشتری وجود خواهند داشت. و هر چه جوجه ها بیشتر زندگی کنند، تخم های بیشتری گذاشته و از تخم بیرون می آیند. بنابراین، هر متغیر دیگری را تقویت می کند. چنین حلقه بازخوردی خود تقویت کننده نامیده می شود و با علامت R و جهت نیرو مشخص می شود.
گرافیک توسط نویسنده
حالا جوجه ها در کنار جاده ای شلوغ زندگی می کنند و گاهی از آن جاده عبور می کنند. متأسفانه تعدادی از آنها کشته می شوند. بنابراین، وقتی جوجههای بیشتری وجود داشته باشند، بیشتر میخواهند از جاده عبور کنند. از طرفی با عبور از خیابان تعداد جوجه ها کم می شود. هر دو اثر باعث متعادل شدن تعداد جوجه ها می شود. چنین حلقه بازخوردی متعادل کننده یا خود تصحیح کننده نامیده می شود و با علامت B مشخص می شود.
گرافیک توسط نویسنده
مثال در دنیای واقعی
وقتی همه این تکنیک ها را کنار هم بگذاریم، می توانیم یک سیستم پویا برای یک ارائه دهنده آموزش زبان بین المللی داشته باشیم. ارائهدهنده آموزش سنتی زبان رو در رو خود را با آموزش آنلاین و کلاسهای ویژه برای افراد بالای ۶۵ سال ارتقا داده است و میخواهد تأثیر آن را بر تجارت اصلی فعلی خود بداند.
اولین مدل ساده به این شکل بود.
گرافیک توسط نویسنده
این بخش اول سیستم را طراحی می کند.
می توان آن را به صورت مستقل و بدون ترجمه بعدی به مدل استفاده کرد. نمودارهای حلقه علّی این مزیت را دارند که سیستم های پیچیده را به صورت بصری نشان می دهند. ما را مجبور می کند در سناریوهای پویا متفاوت فکر کنیم و باعث می شود که تعاملات و پویایی ها را درک کنیم.
اغلب، شما تنها یک راه حل برای چنین سیستمی پیدا نمی کنید. سیستم ها وابستگی های متقابل زیادی دارند. برخی واضح هستند، برخی فقط توسط متخصصان شناخته می شوند و تعداد کمی را فقط می توان حدس زد.
بنابراین، مهمترین ارزش نمودارهای حلقه علّی این است که باید از طریق تمام گزینههای ممکن مختلف فکر کنید که سیستم چگونه میتواند باشد. این شما را از نظر ذهنی برای غافلگیری آماده می کند و واکنش ها را پیش بینی می کند.
یک شرکت بیمه از آن برای طراحی مجدد فرآیند خسارت از دیدگاه تجربه مشتری و بهبود آن استفاده کرد. یک بخش دولتی آن را برای شناسایی تأثیرات استراتژی مکان یابی جدید بر درآمد مالیاتی اعمال کرد.
و استارت آپ ها از آن برای بحث در مورد استراتژی های ورود به بازار و پاسخ های سایر فعالان بازار استفاده می کنند. با آگاهی بصری از سناریوهای مختلف، فرد در موقعیت بسیار بهتری برای تصمیم گیری قرار می گیرد.
نمودار سهام و جریان
اکنون می خواهیم شبیه سازی انجام شود. ابتدا نمودار حلقه علّی را به نموداری به اصطلاح سهام و جریان ترجمه می کنیم.
گرافیک توسط نویسنده
نمودار سهام و جریان ها درک ساختاری یک سیستم پویا را توصیف می کند. این طراحی یک سیستم پویا را به یک مدل ریاضی تبدیل می کند.
از اجزا و خواص زیر تشکیل شده است:
سهام: اینها انباشته هستند و وضعیت یک سیستم را مشخص می کنند. سهام به سیستم ها اینرسی می دهد و به عنوان حافظه سیستم عمل می کند. بنابراین، حاوی اطلاعات بر اساس اقدامات و تصمیمات است.
جریان ها: جریان ها تغییر سهام را در بازه های زمانی اندازه گیری می کنند، یعنی نرخ تغییر یک جوراب در هر لحظه است.
شیرها: شیرها تنظیم کننده جریان هستند. آنها داده های ورودی را می گیرند و این ورودی را به یک خروجی با یک پویایی خاص تبدیل می کنند.
منابع و سینک ها: آنها سهامی را نشان می دهند که خارج از مرز مدل هستند. همیشه فرض بر این است که آنها ظرفیت نامحدودی دارند و هرگز محدودیتی برای سیستم نیستند.
دینامیک مدل با معادلات دیفرانسیل وابسته به زمان توصیف می شود.
گرافیک توسط نویسنده
بیایید به یک مثال ساده از یک صف نگاه کنیم. مشتریان با نرخ ورود مشخص (بسته به زمان) به ایستگاه خدمات میرسند و باید منتظر خدمات باشند. بر اساس ظرفیت خدمات، مشتریان با نرخ خروج (بسته به زمان) خروج میکنند.
چنین صفی می تواند یک فروشگاه مواد غذایی باشد که در آن فرکانس مشتری در طول روز متفاوت است و ظرفیت خدمات، تعداد صندوق های نقد باز است. اما می تواند یک فروشگاه آنلاین نیز باشد، و ظرفیت سرویس، ظرفیت سرور یا حمل و نقل محموله در سراسر جهان است، و ظرفیت سرویس، نرخ توان عملیاتی کانال سوئز است.
یک مدل صف ساده به این شکل است.
گرافیک توسط نویسنده — بالا: مدل سهام و جریان. پایین: نمودار حلقه علّی مربوطه
دینامیک توسط متغیرهای به اصطلاح کمکی اضافه می شود .
بنابراین، بیایید فرض کنیم که نرخی که مشتریان می توانند با آن پردازش شوند به این بستگی دارد
تعداد خدمات شخصی،
بهره وری شخصی (مشتری در هر ساعت پردازش می شود)،
مقدار ساعات کار در هفته
اینها همه متغیرهای کمکی مدل صف هستند.
ما آنها را در مدل ساده خود ادغام می کنیم.
گرافیک توسط نویسنده
حلقه های بازخورد متعادل هستند زیرا اثر نرخ خروج مشتری بر زمان انتظار مشتری منفی است و اثرات مثبت متغیرهای کمکی را تصحیح می کند.
اکنون میتوانیم به مدیریت اتاق عمل یک بیمارستان برگردیم. مدلسازی چنین سیستم پیچیدهای نیازمند چندین بخش فرعی مدلسازیشده از سیستم است که از طریق دینامیک وابسته به زمان به هم متصل شدهاند.
مدل با داده های فعلی اعمال می شود و نتایج مدل با سیستم دنیای واقعی مقایسه می شود. زمانی که مدل با واقعیت مطابقت داشت – تست های آماری روی متغیرهای کلیدی انجام می شود – می توانید بازی با مدل را شروع کرده و سیستم را بهینه کنید – کاری که ما انجام داده ایم.
گرافیک توسط نویسنده
نرم افزار
چندین نرم افزار شبیه سازی تخصصی در بازار وجود دارد. System Dynamics Society نرم افزار مدل سازی اصلی را در صفحه اصلی خود فهرست می کند.
من با چندین نرم افزار پرکاربرد کار کردم: PowerSim، STELLA، Vensim و AnyLogic.
PowerSim، STELLA، و Vensim بر روی مدلسازی دینامیک سیستم خالص تمرکز دارند. Vensim یک “نسخه یادگیری شخصی” دارد که می تواند به صورت رایگان برای اهداف آموزشی استفاده شود. من Vensim را کاربرپسندترین ابزار با قدرت محاسباتی خوب می دانم. بنابراین، اگر می خواهید مدل های System Dynamics خالص را انجام دهید، من آن را توصیه می کنم.
AnyLogic یک نسخه یادگیری شخصی برای اهداف آموزشی نیز دارد. این مزیت را دارد که از مدلهای System Dynamics، مدلسازی رویداد مبتنی بر عامل و گسسته، و مدلهای ترکیبی در میان آنها پشتیبانی میکند. اگر میخواهید مدلهای بیشتری را بررسی کنید، AnyLogic را انتخاب کنید.
همچنین PySD موجود است. این یک کتابخانه در پایتون برای اجرای مدل های System Dynamics است. اما من هرگز با آن کار نکردم. بنابراین، با خیال راحت آن را امتحان کنید.

