O que é Ciência de Dados (Data Science)
Data Science é uma área de atuação profissional que apesar de ter sua origem reconhecida dentro da tecnologia da informação é considerada interdisciplinar, permeando áreas de conhecimento como matemática, estatística, ciência da informação, processos de negócio e mídias digitais. Pode ser resumida como um conjunto métodos, práticas e sistemas científicos para extrair conhecimento ou insights de dados estruturadas ou não estruturadas. É a arte de extrair conclusões a partir de grande volumes de dados.
Outras formas de definir-se a ciência de dados (Data Science):
- Um processo de tomada de decisão
- Um conceito para unificar estatísticas, análise de dados e seus métodos relacionados
- O processamento e o uso de ferramentas para extrair informações a partir dos dados
- Uma prática que apoia a gestão do conhecimento
- Significa entender e analisar fenômenos reais a partir de dados
- Observação, captura, curadoria, estudo, compartilhamento, retenção, transmissão e visualização de grandes volumes de dados
- "Um quarto paradigma da ciência (empírica, teórica, computacional e agora orientada por dados). Tudo sobre a ciência está mudando devido ao impacto da tecnologia da informação e o dilúvio de dados." - Jim Gray, vencedor do prêmio Turing de 1998
A Ciência de Dados tem uma relação direta com o conceito de Big Data: graças a os grandes volumes de dados gerados a partir de várias fontes nos dias de hoje, demandou-se a necessidade de desenvolver novas ferramentas e métodos de coleta e análise de dados, uma vez que os mecanismos tradicionais tornaram-se incapazes de atender a esta necessidade.
A Ciência de Dados (Data Science) e o Big Data
Por muito tempo, o Big Data foi considerado apenas uma palavra da moda, mas não é mais. Sua percepção - explicita ou implícita, consciente ou inconscientemente - é legítima dentro das organizações que estão buscando no mercado de trabalho profissionais com capacidades analíticas.
Ciência de dados, portanto, pode ser também entendida como fazer análise de Big Data, utilizando-se técnicas cada vez mais avançadas para tratamento de grande volume de dados como registros pessoais, bancos de dados, informações de mídias / redes sociais, comércio, documentos de texto, dentre outros infinitas fontes de informações, inimaginavelmente crescentes.
O mundo corporativo demanda por novas tecnologias, métodos e práticas que solucionem a preparação, extração e disponibilização dos dados, sejam eles:
- Estruturados ou não
- Em padrões semelhantes ou diferentes
- De fontes semelhantes ou diferentes
- Em tamanhos e formatos compartíveis ou não
Outros Campos de estudos relacionados à Ciência de Dados (Data Science)
- Matemática
- Estatística
- Ciência da Computação
- Data mining
- Machine learning
- Data Analytics
- Deep learning
- Gestão do Conhecimento
- Social Midia Analyics
- Gestão de TI
- Segurança da Informação
O gráfico da imagem a seguir, reproduzido no site da ITGI ilustra alguns segmentos envolvidos com o tema de Ciência de Dados
Perfil Ciência de Dados - Fonte: site da ITGI
Tendência
Pode-se afirmar que - sem sombra de dúvidas - a Sata Science é uma das áreas de atuação que se destacam no quesito tendência no mundo profissional. O gráfico abaixo, obtido através de uma pesquisa ao Google Trends, ilustra este fenômeno no decorrer de 05 anos, entre 2013 e 2017.