این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
دوشنبه 24 آذر 1404
پژوهشنامه پردازش و مدیریت اطلاعات
، جلد ۳۸، شماره ۳، صفحات ۹۴۵-۹۷۹
عنوان فارسی
ارائه یک چارچوب مفهومی برای پیشپردازش و بهبود کیفیت نگارههای رویداد در فرایندکاوی
چکیده فارسی مقاله
در دنیای پیچیده امروز حیات سازمانها و کسبوکارها بدون شناخت و استفاده کارآمد از دادهها امکانپذیر نخواهد بود. فرایندکاوی با ترکیب روشهای یادگیری ماشین و مفاهیم مدیریت فرایندهای کسبوکار تلاش دارد دانش نهان مربوط به چگونگی اجرای فرایندها را از دادههای ذخیرهشده در سامانههای اطلاعاتی استخراج نماید. اولین گام در فرایندکاوی، فعالیت کشف فرایند است که امکان مدلسازی فرایندها بر مبنای دادههای رویداد ورودی را فراهم میسازد. اما استفاده از این مزیت بدون وجود دادههای مناسب و باکیفیت فراهم نخواهد شد، زیرا هر گونه تحلیل بر پایه دادههای با کیفیت پایین منجر به ایجاد بینش و تصمیمات نامناسبی میشود که بر عملکرد سازمان یا کسبوکار تأثیر منفی خواهد گذاشت. هدف این پژوهش ارائه یک چارچوب مفهومی جدید برای پیشپردازش دادههای ورودی به روشهای کشف فرایند است تا کیفیت مدل فرایند نهایی بهبود یابد. چارچوب مفهومی پیشنهادی با استفاده از یک روش پژوهش کیفی بر اساس نظریه دادهبنیاد پدید آمده است. بدین منظور، 102 پژوهش مرتبط با حوزه کیفیت داده در فرایندکاوی مورد بررسی قرار گرفته و مهمترین چالشهای کیفیت داده در این زمینه پس از پالایش و یکپارچهسازی آنها از ادبیات شناسایی شدهاند که شامل: «رویدادهای آشفته/ کمتکرار»، «رویدادهای پرت»، «رویدادهای ناهنجار»، «مقادیر گمشده»، «قالب زمانی نادرست»، «برچسبهای زمانی مبهم»، «فعالیتهای مترادف» و «اندازه و پیچیدگی» است. در ادامه، گامهای اساسی برای پیشپردازش و پاکسازی مناسب دادهها تعیین شدهاند که دربرگیرنده فعالیتهای «ترمیم»، «کشف ناهنجاری»، «پالایش» و «کاهش ابعاد» میشوند. سپس، چارچوب مفهومی نهایی بر پایه مشکلات کیفیت داده و فعالیتهای پاکسازی شناساییشده ایجاد شده است. برای بررسی عملکرد چارچوب پیشنهادی از چهار مجموعه داده استاندارد برگرفته از فرایندهای واقعی استفاده شده است. این دادهها در مرحله اول بهصورت خام و در مرحله دوم پس از انجام پیشپردازش توسط چارچوب معرفیشده به چهار الگوریتم متداول کشف فرایند اعمال شدهاند. نتایج نشان داد که پیشپردازش دادههای ورودی منجر به بهبود معیارهای کیفیت مدل استخراجشده از الگوریتمهای کشف فرایند میشود. همچنین، برای سنجش اعتبار چارچوب پیشنهادی، عملکرد آن با سه روش پیشپردازش «نمونهبرداری»، «پیشپردازش آماری» و «انتخاب نمونه اولیه» مقایسه شده که برایندها بیانگر کارایی بهتر رویکرد پیشنهادی بوده است. نتایج پژوهش حاضر میتواند بهعنوان یک رهیافت کاربردی توسط متخصصان و تحلیلگران داده و کسبوکار در پروژههای فرایندکاوی مورد استفاده قرار گیرد.
کلیدواژههای فارسی مقاله
سامانههای اطلاعاتی، مدیریت فرایندهای کسبوکار، فرایندکاوی، کیفیت داده، پیشپردازش نگاره رویداد،
عنوان انگلیسی
A Conceptual Framework for Preprocessing and Improving Quality of Event Log in Process Mining
چکیده انگلیسی مقاله
In today's challenging world, organizational growth is not possible without the efficient use of data. Process mining uses machine learning methods and business process management concepts to extract hidden knowledge about business processes from data stored in information systems. Process Discovery is the first step in process mining. The main goal of process discovery is to transform the event log into a process model. However, using process discovery methods will not be possible without appropriate data because any analysis based on low-quality data will lead to poor insights and bad decisions that will negatively affect the performance of the organization or business. This paper aims to provide a new conceptual framework for preprocessing data input into process discovery methods to improve the quality of the extracted model. The proposed conceptual framework has been developed using a qualitative research process based on grounded theory. For this purpose, 102 articles related to the domain of data quality in process mining were reviewed, and the most critical challenges of data quality in this field have been identified after filtering and integrating them from the literature, including “noisy/infrequent events”, “outlier events”, “anomalous events”, “missing values”, “incorrect time format”, “ambiguous timestamps”, “synonymous activities”, and “size and complexity”. Then, the basic steps for data preprocessing and cleaning tasks are defined, which include the activities of “repair”, “anomaly detection”, “filtering”, and “dimensional reduction. The final preprocessing framework then builds on data quality issues and identified activities. Four standardized datasets derived from real-world processes were used to assess the proposed framework's performance. Firstly, these data are raw, and secondly, four standard process discovery algorithms are applied after preprocessing by the introduced framework. The results showed that the preprocessing of the input data leads to the improvement of the model quality criteria extracted from the process discovery algorithms. Furthermore, to evaluate the validity of the proposed framework, its performance was compared with three preprocessing methods: “sampling”, “statistical preprocessing”, and “prototype selection”, which the results indicate better efficiency of the proposed approach. The results of this study can be used as guidelines by data and business analysts to identify and resolve data quality problems in process mining projects.
کلیدواژههای انگلیسی مقاله
سامانههای اطلاعاتی, مدیریت فرایندهای کسبوکار, فرایندکاوی, کیفیت داده, پیشپردازش نگاره رویداد
نویسندگان مقاله
احمد صالحی |
دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
محمد اقدسی |
دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
توکتم خطیبی |
دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
مجید شیخ محمدی |
دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران
نشانی اینترنتی
https://jipm.irandoc.ac.ir/article_698594_2ef16dfeabc0dcaf8e0b687a7ba93946.pdf
فایل مقاله
فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات