این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۴، شماره ۳، صفحات ۳-۲۲

عنوان فارسی ارائه روشی پویا جهت پاسخ به پرس‌وجوهای پیوسته تجمّعی اقتضایی
چکیده فارسی مقاله جریان‌های داده دنباله‌های نامتناهی، سریع، متغیر با زمان و با نرخ ورود انفجاری از عناصر داده هستند که به‌طورمعمول نیاز دارند به‌صورت برخط و به‌طورتقریبی بی‌درنگ پردازش شوند. بر این اساس، الگوریتم‌های پردازش جریان‌های داده و اجرای پرس‌وجوها روی جریان داده‌ها بیش‌تر تک‌گذره هستند. اجرای این الگوریتم‌های تک‌گذره با محدودیت‌ها و چالش‌هایی از قبیل محدودیت در حافظه، زمان‌بندی، و دقت پاسخ‌ها مواجه است. این چالش‌ها به‌ویژه در شرایطی که پرس‌وجوی مورد نظر از قبل تعیین و مشخص نشده باشد و به‌صورت اقتضایی، پس از ارسال جریان داده ارائه شود، به‌مراتب جد‌ی‌تر و حل آن‌ها دشوارتر خواهد بود. در این مقاله، برای پردازش پرس‌وجوهای تجمعی که به‌طور پیوسته روی جریان‌های داده اجرا خواهند شد و البته به‌طور اقتضایی ارائه می‌شوند، راه حلی مبتنی بر ساختار درختواره و نگهداشت نتایج تجمعی معرفی شده است.  نکته مهم در این روش، برقراری برخط بودن در تمام مراحل ساخت، نگهداری و بهره‌برداری از درخت است. برای تأمین برخط بودن فرایند پاسخ به پرس‌وجو، کافی است تمامی پاسخ‌های محتمل را نگهداری کنیم؛ اما برای حفظ برخط‌بودن فرایند ساخت و نگهداری درخت، با توجه به ویژگی‌های ذاتی جریان داده ناچاریم برخی پاسخ‌ها را نگهداری کنیم. بدین ترتیب، هدف و مسئله اساسی آن است که دست‌کم پاسخ‌های انتخابی برای ذخیره‌ در قالب درختواره را به مجموعه پاسخ‌های مورد نیاز برای پرس‌وجوهای اقتضایی رسیده نزدیک‌تر کنیم. ساختار درخت تجمعی پیشوندی پیشنهادی که به‌صورت پویا ایجاد، نگهداری، مدیریت و در پردازش پرس‌وجوها استفاده می‌شود، تشریح و صحت عملکرد آن به‌صورت عملی مورد ارزیابی قرار گرفته که نتایج حاکی از کارآمد‌بودن آن برای به‌کارگیری در پردازش برخط پرس‌وجوهای پیوسته تجمعی اقتضایی روی جریان‌های داده است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Providing a Dynamic Technique for Answering Ad-hoc Continuous Aggregate Queries
چکیده انگلیسی مقاله Data Streams are infinite, fast, time-stamp data elements which are received explosively. Generally, these elements need to be processed in an online, real-time way. So, algorithms to process data streams and answer queries on these streams are mostly one-pass. The execution of such algorithms has some challenges such as memory limitation, scheduling, and accuracy of answers. They will be more important and serious, chiefly if the queries are not predefined but Ad-hoc, and also should be executed after data stream tuples are gone. Countinous aggregate queries are types of queries with some special characteristics making it possible to perform more specific, efficient qeury processing techniques, specifiaclly beneficient for ad-hoc ones. In this paper, a dynamic efficient techinque is proposed for answering the ad-hoc continiues aggregate queries over data streams. The main idea of the proposed technique is to generate and handle an efficiet tree data structure as the synopse, in the form of  Dynamic Prefix Aggregate Tree. In general, the two following approaches can be used to calculate any function such as ; either implementation of an algorithm for the calculation of function f, or storing the answers of function f for all possible states. When the algorithm runtime is high, the second method strengthened by proper selection of indices can return a proper answer in a very short time (even ). But the major problem of the second method is the total number of possible answers which can be very high and also can be out of the possible storage capacity and processing potential within a certain acceptable time period. For example, suppose that the cardinality of each of the parameters of  is 10. In this case, the total number of possible states will be . As it is evident, the total number of states increases with the number of parameters and their cardinalities.When the total number of states is so great that generating answers with respect to consumed time and space is impossible, a more convenient, practical method should be employed. This more practical approach can be the storing of some of the answers (selectively) with respect to the following conditions: Obtaining un-stored answers from the set of stored answers. Higher probability of utilizing stored answers (i.e. higher probability of submitting requests from stored set). Eliminating (not storing) null answers. The same idea can be implemented for online and almost real time processing of queries, so that by receiving each tuple, all possible answers get obtained and stored. By doing so, in the time of need (when answering to an ad-hoc query) stored answers will be used instead of calculating each answer. Accordingly, some answers are stored in a tree structure to be used at the right time. In this paper, in order to answer ad-hoc continuous aggregate queries over data streams, a method is proposed that uses a tree structure for storing the aggregate results. The important point in this method is that all steps of the construction, maintenance and using of the tree must be online. For these purposes, it is enough to keep all possible answers. But to apply an online construction and maintenance of tree, we must keep some answers, according to the inherent features of data streams. In this way, the main goal is to choose the answers possessing the most overlap with responses answers of received ad-hoc queries. The proposed method, creates the tree structure and maintains it dynamically to answer ad-hoc aggregate continuous queries over data streams. For this purpose, queries at instant  are modeled as in form of , where  or  (when , the aggregate over the whole sliding window is returned) and  is the size of sliding window and  (when , the aggregate over the whole  is returned). In order to increase the overlapping, a statistical task is performed on a dimensions of the received queries. In this way, dimensions are determined with the highest, lowest request. When , means that there is no request for this dimension. Therefore, we select and store the answers related to the dimension with highest request, and ignore those with the lowest. Obviously, these answers should be obtained and presented using stored answers. As the request for dimensions may change, the tree structure must be dynamically constructed and maintenance that will be presented this dynamic structure in this paper. Experimental evaluattion of the proposed method shows that, using the proposed Dynamic Aggregate Tree for ansering countinous Ad-hoc aggregate queies is more cost-effective, in terms of response time and memory usage.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله مهدی مسافری |
شرکت جویا افزار ماندگار پرسیا

علی اصغر صفایی | ali safaei
tmu
دانشگاه تربیت مدرس
سازمان اصلی تایید شده: دانشگاه تربیت مدرس (Tarbiat modares university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-926-2&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-570065.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش داده‌های رقمی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات