Data adalah "Kuantitas, karakter, atau simbol dengan pengolahan yang dilakukan oleh komputer, yang dapat disimpan dan ditransmisikan dalam bentuk sinyal listrik dan dicatat pada medan magnet, optik, atau mekanis media perekaman."
Jadi, "Big Data" adalah istilah yang digunakan untuk menggambarkan pengumpulan data yang sangat besar dalam ukuran namun tumbuh secara eksponensial dengan/berdasarkan waktu. Singkatnya, data tersebut sangat besar dan kompleks yang tidak ada alat manajemen data tradisional yang dapat menyimpan atau memproses secara efisien.
Kategori "Big Data" :
- Structured (Terstruktur)
Data yang dapat disimpan, diakses dan diproses dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama periode waktu tertentu, para pakar dalam ilmu komputer telah mendapatkan kesuksesan besar dalam mengembangkan teknik untuk bekerja dengan jenis data seperti ini (di mana format data dikenal lebih dahulu) dan juga menurunkan nilai dari data itu. Namun, sekarang, kita memiliki masalah ketika ukuran data tersebut tumbuh pada tingkat yang sangat besar, total ukuran data meningkat menjadi zettabyte.
*1021 bytes sama dengan 1 zettabyte atau satu miliar terabytes.