این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
صفحه اصلی
درباره پایگاه
فهرست سامانه ها
الزامات سامانه ها
فهرست سازمانی
تماس با ما
JCR 2016
جستجوی مقالات
پنجشنبه 4 دی 1404
پردازش علائم و داده ها
، جلد ۱۳، شماره ۴، صفحات ۴۳-۶۲
عنوان فارسی
استخراج ویژگیهای ساختاری فایلهای کامپیوتری مبتنی بر تحلیل و ارزیابی آماری
چکیده فارسی مقاله
فایلها مهمترین منبع ارائه اطلاعات به صورتهای مختلف از قبیل متن، صوت، تصویر، صفحات وب و غیره هستند؛ تحلیل و آنالیز فایلها به منظور شناخت و بررسی ویژگیها و خصوصیات منحصربهفرد آنها، یکی از مسائل بسیار مهم در زمینه حریم خصوصی، امنیت اطلاعات، شناسایی نوع فایلها، تحلیل ساختاری کدها و غیره میباشد. در این مقاله با تحلیل و آنالیز آماری بر روی محتوای باینری فایلها مبتنی بر مدل n-gram، ویژگیها و خصوصیات مختلف یک فایل مورد بررسی قرار گرفته است. علاوه بر این به منظور کاهش حجم محاسبات و حافظه مورد نیاز مدل n-gram، از خوشهبندی لغات استفاده شده و محتوای هر فایل در دو حالت کامل و بلوکبندی شده مورد تجزیه و تحلیل قرار گرفته است. در حالت کامل ویژگیهایی همچون آنتروپی، فراوانی، TF-IDF، خود همبستگی و در حالت بلوکی، ویژگیهایی همچون نرخ آنتروپی، بعد فرکتال، فاصله و غیره بررسی شده است. نتایج بررسیها نشان داده ویژگیهای استخراج شده در روش اول به خوبی میتوانند خصوصیات منحصر به فرد فایلهای jpg، mp3، swf و html را منعکس نمایند. ویژگیهای استخراج شده در روش دوم نیز به خوبی میتوانند خصوصیات فایلهای doc، html و pdf را منعکس نمایند.
کلیدواژههای فارسی مقاله
عنوان انگلیسی
Feature Extraction of Computer Files Structure by Statistical Analysis
چکیده انگلیسی مقاله
Files are the most important sources of information presentation in various formats such as texts, audio, video, images, web pages, etc. …; (in-depth) analysis of files for the purpose of recognition and investigating their unique properties (or characteristics) is one of the most significant issues in the field of personal security safety, information security, file-type identification, codes structuration analysis etc…. Statistical analytic methodology of working on the binary files contents based on the n-gram model has been opted for in the present paper in order to full investigate all the different aspects of a file’s range of characteristics. Moreover, to reduce down the calculations volume and the n-gram model peculiar to the needed amount of memory, use has been made of word clustering. Later on analysis has been conducted on both files’ contents in two states of “blocking” and “full”: it is to be noted that in the “full” case such characteristics as Chi-square, Auto-correlation, Weighted term frequency-Inverse document frequency (TF-IDF), Fractal dimension etc … have been brought under comprehensive study; while in the “blocking” case, other properties like the entropy rate, the distance, etc … have been delved into. The gained results indicate that the extracted characteristics in the first method could well easily reflect the unique properties belonging to jpg, mp3, swf and html files; and in the second method, are able to clearly well reflect doc, html and pdf files properties.
کلیدواژههای انگلیسی مقاله
نویسندگان مقاله
مجید وفایی جهان | majid vafaei jahan
mashhad
مشهد
نشانی اینترنتی
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-359-1&slc_lang=fa&sid=fa
فایل مقاله
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-402467.pdf
کد مقاله (doi)
زبان مقاله منتشر شده
fa
موضوعات مقاله منتشر شده
مقالات پردازش دادههای رقمی
نوع مقاله منتشر شده
پژوهشی
برگشت به:
صفحه اول پایگاه
|
نسخه مرتبط
|
نشریه مرتبط
|
فهرست نشریات