O que é Ciência de Dados (Data Science)


Data Science é uma área de atuação profissional que apesar de ter sua origem reconhecida dentro da tecnologia da informação é considerada interdisciplinar, permeando áreas de conhecimento como matemática, estatística, ciência da informação, processos de negócio e mídias digitais. Pode ser resumida como um conjunto métodos, práticas e sistemas científicos para extrair conhecimento ou insights de dados estruturadas ou não estruturadas. É a arte de extrair conclusões a partir de grande volumes de dados.

Outras formas de definir-se a ciência de dados (Data Science):

  • Um processo de tomada de decisão
  • Um conceito para unificar estatísticas, análise de dados e seus métodos relacionados
  • O processamento e o uso de ferramentas para extrair informações a partir dos dados
  • Uma prática que apoia a gestão do conhecimento
  • Significa entender e analisar fenômenos reais a partir de dados
  • Observação, captura, curadoria, estudo, compartilhamento, retenção, transmissão e visualização de grandes volumes de dados
  • "Um quarto paradigma da ciência (empírica, teórica, computacional e agora orientada por dados). Tudo sobre a ciência está mudando devido ao impacto da tecnologia da informação e o dilúvio de dados." - Jim Gray, vencedor do prêmio Turing de 1998

A Ciência de Dados tem uma relação direta com o conceito de Big Data: graças a os grandes volumes de dados gerados a partir de várias fontes nos dias de hoje, demandou-se a necessidade de desenvolver novas ferramentas e métodos de coleta e análise de dados, uma vez que os mecanismos tradicionais tornaram-se incapazes de atender a esta necessidade.

A Ciência de Dados (Data Science) e o Big Data


Por muito tempo, o Big Data foi considerado apenas uma palavra da moda, mas não é mais. Sua percepção - explicita ou implícita, consciente ou inconscientemente - é legítima dentro das organizações que estão buscando no mercado de trabalho profissionais com capacidades analíticas. 

Ciência de dados, portanto, pode ser também entendida como fazer análise de Big Data, utilizando-se técnicas cada vez mais avançadas para tratamento de grande volume de dados como registros pessoais, bancos de dados, informações de mídias / redes sociais, comércio, documentos de texto, dentre outros infinitas fontes de informações, inimaginavelmente crescentes. 

O mundo corporativo demanda por novas tecnologias, métodos e práticas que solucionem a preparação, extração e disponibilização dos dados, sejam eles:

  • Estruturados ou não
  • Em padrões semelhantes ou diferentes
  • De fontes semelhantes ou diferentes
  • Em tamanhos e formatos compartíveis ou não

Outros Campos de estudos relacionados à Ciência de Dados (Data Science)


  • Matemática
  • Estatística
  • Ciência da Computação

  • Data mining
  • Machine learning
  • Data Analytics
  • Deep learning
  • Gestão do Conhecimento 
  • Social Midia Analyics
  • Gestão de TI
  • Segurança da Informação

O gráfico da imagem a seguir, reproduzido no site da ITGI ilustra alguns segmentos envolvidos com o tema de Ciência de Dados


Perfil Ciência de Dados - Fonte: site da ITGI

Tendência


Pode-se afirmar que - sem sombra de dúvidas - a Sata Science é uma das áreas de atuação que se destacam no quesito tendência no mundo profissional. O gráfico abaixo, obtido através de uma pesquisa ao Google Trends, ilustra este fenômeno no decorrer de 05 anos, entre 2013 e 2017. 

Mais sobre Ciência de Dados (Data Science)