این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
رایانش نرم و فناوری اطلاعات، جلد ۴، شماره ۴، صفحات ۰-۰

عنوان فارسی ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها
چکیده فارسی مقاله افزایش روزافزون داده­ها در پایگاه داده­ها، نیاز به روش­های بهینه برای آنالیز داده­ها را افزایش داده است. بیشتر مطالعات، بر روی پیداکردن الگوهای کاربردی در پایگاه داده­ها متمرکز شده­اند. این مطالعات برای کاربردهای تشخیص فعالیت مجرمین در تجارت الکترونیک و تشخیص انحرافات نسبت به کاربردهای دیگر مفیدتر واقع شده است. الگوریتم­های زیادی برای تشخیص داده­های پرت ارائه شده است، اما اکثر این الگوریتم­ها بر روی داده­های ایستا کارایی دارند. داده­های جریانی، داده­های پیوسته و نامحدودی هستند که در طول زمان، تغییر توزیع خواهند داشت. این تغییر توزیع، باعث افزایش نرخ مثبت- کاذب و عدم کارایی الگوریتم­های موجود می­شود. در این مقاله، الگوریتمی جهت شناسایی داده های پرت، با استفاده از روش تقسیم جریان داده­ها به قطعه­های مساوی و محاسبه ضریب ناهنجاری محلی برای داده­ها و استفاده از لیستی برای داده­های پرت کاندید ارائه داده ایم تا علاوه بر شناسایی داده­های پرت، نرخ مثبت-کاذب پایینی داشته باشد. نتایج بدست آمده بر روی مجموعه داده­های مصنوعی و حقیقی، نشان می­دهد که الگوریتم ارائه شده، باعث کاهش قابل توجه نرخ مثبت-کاذب و افزایش دقت شده و نسبت به الگوریتم های دیگر کارایی بهتری دارد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها
چکیده انگلیسی مقاله افزایش روزافزون داده­ها در پایگاه داده­ها، نیاز به روش­های بهینه برای آنالیز داده­ها را افزایش داده است. بیشتر مطالعات، بر روی پیداکردن الگوهای کاربردی در پایگاه داده­ها متمرکز شده­اند. این مطالعات برای کاربردهای تشخیص فعالیت مجرمین در تجارت الکترونیک و تشخیص انحرافات نسبت به کاربردهای دیگر مفیدتر واقع شده است. الگوریتم­های زیادی برای تشخیص داده­های پرت ارائه شده است، اما اکثر این الگوریتم­ها بر روی داده­های ایستا کارایی دارند. داده­های جریانی، داده­های پیوسته و نامحدودی هستند که در طول زمان، تغییر توزیع خواهند داشت. این تغییر توزیع، باعث افزایش نرخ مثبت- کاذب و عدم کارایی الگوریتم­های موجود می­شود. در این مقاله، الگوریتمی جهت شناسایی داده های پرت، با استفاده از روش تقسیم جریان داده­ها به قطعه­های مساوی و محاسبه ضریب ناهنجاری محلی برای داده­ها و استفاده از لیستی برای داده­های پرت کاندید ارائه داده ایم تا علاوه بر شناسایی داده­های پرت، نرخ مثبت-کاذب پایینی داشته باشد. نتایج بدست آمده بر روی مجموعه داده­های مصنوعی و حقیقی، نشان می­دهد که الگوریتم ارائه شده، باعث کاهش قابل توجه نرخ مثبت-کاذب و افزایش دقت شده و نسبت به الگوریتم های دیگر کارایی بهتری دارد.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله آرش مزیدی | arash mazidi
shiraz university

سازمان اصلی تایید شده: دانشگاه شیراز (Shiraz university)

محمدهادی صدرالدینی | mohammadhadi sadreddini


هومن تحیری | hooman tahayori



نشانی اینترنتی http://jscit.nit.ac.ir/index.php/jscit/article/view/Vol.4_No.4_3
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات