Experimenting with Big Data Computing for Scaling Data Quality-Aware Query Processing

Item request has been placed!

Item request cannot be made.

Processing Request

اقرأ أكثر حفظ في قائمتي

المؤلفون: Cisneros Cabrera, Sonia; Michailidou, Anna; Sampaio, Sandra; Sampaio, Pedro; Gounaris, Anastasios
المصدر:
Cisneros Cabrera , S , Michailidou , A , Sampaio , S , Sampaio , P & Gounaris , A 2021 , ' Experimenting with Big Data Computing for Scaling Data Quality-Aware Query Processing ' , Expert Systems with Applications , vol. 178 , 114858 . https://doi.org/10.1016/j.eswa.2021.114858
الموضوع:
Big data computing; Data quality-aware queries; Empirical evaluation
نوع التسجيلة:
article in journal/newspaper
اللغة:
English

معلومة اضافية
- الموضوع:
  2021
- Collection:
  The University of Manchester: Research Explorer - Publications
- نبذة مختصرة :
  Combining query processing techniques with data quality management approaches enables enforcement of quality constraints, such as timeliness, accuracy and completeness, as part of ad-hoc query specification and execution, improving the quality of query results. Despite the emergence of novel data quality processing tools, there is a dearth of studies assessing performance and scalability in the execution of data quality assessment tasks during query processing. This paper reports on an empirical study aiming to investigate the extent to which a big data computing framework (Spark) can offer significant gains in performance and scalability when executing data quality querying tasks over a range of computational platforms including a single commodity multi-core machine and a cluster-based platform for a wide range of workloads. Our results show that substantial performance and scalability gains can be obtained by using optimized data science libraries combined with the parallel and distributed capabilities of big data computing. We also provide guidelines on choosing the appropriate computational infrastructure for executing DQ-aware queries.
- File Description:
  application/pdf
- Relation:
  https://research.manchester.ac.uk/en/publications/83890c64-d43e-46d5-bcdd-3bb1230a60a6
- الرقم المعرف:
  10.1016/j.eswa.2021.114858
- الدخول الالكتروني :
  https://research.manchester.ac.uk/en/publications/83890c64-d43e-46d5-bcdd-3bb1230a60a6
  https://doi.org/10.1016/j.eswa.2021.114858
  https://pure.manchester.ac.uk/ws/files/189219601/ESWAmanuscriptFinalAccepted04032021.pdf
  http://www.scopus.com/inward/record.url?scp=85104299912&partnerID=8YFLogxK
  https://www.mendeley.com/catalogue/00423c5d-db22-3542-a971-17120b3b70fd/
- Rights:
  info:eu-repo/semantics/openAccess
- الرقم المعرف:
  edsbas.388C2ED2

تعليقات

No Comments.

Experimenting with Big Data Computing for Scaling Data Quality-Aware Query Processing

اتصل بنا

اتبع