علم داده (به انگلیسی: Data science)، دانشی میانرشتهای است که به استخراج دانش و آگاهی از مجموعهای داده و اطلاعات میپردازد. این علم از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روشهای موجود در حوزههای مختلف علمی بنا شدهاست. برخی از این حوزهها عبارتند از: ریاضیات، آمار، علوم کامپیوتر، مهندسی داده، بازشناخت الگو و… هدف اصلی علم داده، استخراج مفهوم از دادهها و تولید محصولات دادهمحور است.
آقایان توماس دونپورت و دی جی پاتیل در سال ۲۰۱۲ در مقالهای به نام «علم داده: جذابترین شغل قرن بیست و یکم»، متخصصین علم داده را به این شکل تعریف میکنند: کسانی که میدانند چگونه میتوانند از انبوه اطلاعات بدون ساختار، پاسخهای سؤالهای کسبوکار را پیدا کنند. همچنین، استنتون در سال ۲۰۱۳ علم داده را به این صورت تعریف میکند: علم داده، رشتهای در حال ظهور است که به جمعآوری، آمادهسازی، تحلیل، بصریسازی، مدیریت و نگهداشت اطلاعات در حجم بالا میپردازد. همچنین، دریسکول در سال ۲۰۱۴ علم داده را به عنوان مهندسی عمران دادهها تعریف میکند. متخصص علم داده دانشی کاربردی از دادهها و ابزارها دارد و همچنین درک تئوریکی دارد که مشخص میکند چه چیزی از نظر علمی ممکن است.