ابرداده اطلاعات با حجم بالا، سرعت بالا و یا تنوع بالای با ارزشی هستند که به پردازش اطلاعات مقرون به صرفه و قالبهای نوآورانه نیاز دارند که ارتقای بینش، تصمیمگیری و پردازش خودکار را فراهم کنند.
دادههای با موارد زیاد (سطر) قدرت آماری برتری را به ارمغان میآورد در حالیکه داده با پیچیدگی بیشتر (ویژگی یا ستون بیشتر) ممکن است به نرخ بالاتری از خطای کشف نادرست منجر شود.
چالشهای ابرداده عبارتند از گرفتن داده، ذخیرهسازی داده، تحلیل داده، جستجو، به اشتراکگذاری، انتقال، مصورسازی، پرس و جو، بهروزرسانی، امنیت اطلاعات و منابع داده
ابرداده در اصل با سه مفهوم کلیدی همراه بوده است.
حجم، تنوع و سرعت
هنگامی که ابردادهها را به کار میگیریم ممکن است نمونهگیری نکنیم اما به سادگی آنچه را رخ میدهد میبینیم و دنبال میکنیم.
بنابراین ابرداده غالبا شامل دادههای با اندازههایی هستند که از ظرفیت نرمافزارهای مرسوم برای پردازش در زمان و با ارزش قابل قبول، فراتر هستند.