"大(Big)數據"是一(One)個(Indivual)體量特别大(Big),數據類别特别大(Big)的(Of)數據集,并且這(This)樣的(Of)數據集無法用(Use)傳統數據庫工具對其内容進行抓取、管理和(And)處理。
"大(Big)數據"首先是指數據體量(volumes)?大(Big),指代大(Big)型數據集,一(One)般在(Exist)10TB?規模左右,但在(Exist)實際應用(Use)中,很多企業用(Use)戶把多個(Indivual)數據集放在(Exist)一(One)起,已經形成了PB級的(Of)數據量;其次是指數據類别(variety)大(Big),數據來(Come)自多種數據源,數據種類和(And)格式日漸豐富,已沖破了以(By)前所限定的(Of)結構化數據範疇,囊括了半結構化和(And)非結構化數據。
接着是數據處理速度(Velocity)快,在(Exist)數據量非常龐大(Big)的(Of)情況下,也能夠做到(Arrive)數據的(Of)實時(Hour)處理。最後一(One)個(Indivual)特點是指數據真實性(Veracity)高,随着社交數據、企業内容、交易與應用(Use)數據等新數據源的(Of)興趣,傳統數據源的(Of)局限被打破,企業愈發需要(Want)有效的(Of)信息之力以(By)确保其真實性及安全性。