علم داده یک دانش میانرشتهای است که برای استخراج دانش و بینش از بسیاری از دادههای ساختاری و بدون ساختار از روشهای عملی، فرآیندها، الگوریتمها و سیستمها استفاده میکند. علم داده به علومی چون data mining (داده کاوی) و Big Data (اَبَر دادهها) مرتبط است.
علم داده «مفهوم یکی کردن علم آمار، تحلیل داده، یادگیری ماشین و روشهای مرتبط با آنها برای نیل به درک و تحلیل پدیدهای واقعی با داده است.
علم داده تکنیکها و تئوریهای برگرفته از حوزههای بسیاری را در چارچوب ریاضیات، آمار، علوم کامپیوتری و علوم اطلاعاتی به خدمت میگیرد.
جیم گری برنده جایزه تورینگ،علم داده را به عنوان «الگوی چهارم علم» تصور میکند ( تجربی، تئوری، محاسباتی و اکنون دادهمحور) و ادعا میکند «همه چیز درباره علم تحت تاثیر فناوری اطلاعات و سیل دادهها در حال تغییر است.»