
O tema Big Data é associado muitas vezes ao uso de ferramentas específicas, como Hadoop e Spark, no entanto, esta relacionado ao processo de evolução do uso de dados. Algumas ferramentas são muito características deste conceito, por ter sido criadas para este fim, mas adquiri-las ou instala-las não significa que a organização tenha um Big Data.
Conforme Hurwitz (2013), o Big Data não é simplesmente uma ferramenta ou uma tecnologia. É sobre como todas as tecnologias serão reunidas utilizando o que elas têm de melhor, no momento certo, e na informação correta – não importando que foi gerada por uma pessoa, máquina ou na web.
Um processo só é caracterizado como Big Data se ele tiver as seguintes características: volume, velocidade e variedade. Que são nomeadas por diversos autores como V’s do Big Data.
Volume
O volume é a primeira e principal característica, é toda quantidade de informações disponíveis, gerada por pessoas ou máquinas. O termo Big Data está associado a grandes datasets.
Através de uma pesquisa em 2013 identificou-se que o total de 4,4 zettabytes de dados digitais e estima-se que em 2020 se chegará em 44 zettabytes (WHITE, 2015).
Velocidade
Hurwitz (2013) define de maneira simples, que a velocidade é o quão rápido a informação pode ser processada.
A velocidade é fundamental para o Big Data, a velocidade representa muito bem a evolução do uso dos dados, já que foram desenvolvidas diversas ferramentas com intuito que as informações sejam disponibilizadas de maneira mais rápida e precisa.
Se for feita uma analogia com um avião fica claro que se ao pousar os instrumentos de bordo devem apresentar a maior quantidade e precisão de informações necessárias para esta manobra, ou seja, se as informações para tomada de decisões chegarem depois que a decisão for tomada, neste caso a aterrissagem, elas não farão mais sentido.
Variabilidade
A variabilidade é representada pelo fato do Big Data conseguir buscar informações de diversas origens e formatos.
Os formatos de dados são classificados como estruturados, semi-estruturados e não estruturados.
Conforme Taurion (2013), estimasse que 90% de todas as informações disponíveis são dados não estruturados.
Referências
HURWITZ, Judith et al. Big Data for Dummles. Ed. John Wiley & Sons, Inc. 2013.
TAURION, Cezar. Big Data. Rio de Janeiro: Brasport Livros e Multimídia Ltda, 2013.
WHITE, Tom. Hadoop: The Definitive Guide. 4ª Ed. O’Reilly Media, Inc. 2015.
Show…. ?????????
Obrigado!