Trabalho e Formacao

Para CIO da Caesb, ciência de dados é estratégia empresarial

Em entrevista, Oséias Gomes, que é mestre em computação aplicada pela UnB, aponta a importância do investimento na área com técnicas de aprendizado de máquinas

Ana Isabel Mansur*
postado em 25/08/2019 14:16
A utilização estratégica de dados pode ser o diferencial para uma empresa se tornar bem-sucedida. A ciência de dados, ou data science, inclui análise, treinamento de máquinas, processos, conhecimentos, resolução de problemas e programação. A geração e o consumo de dados não param de crescer. Com a indústria 4.0, nome pelo qual a revolução industrial que a internet trouxe é conhecida, isso só tende a aumentar. De acordo com levantamento da IDC Brasil, empresa de consultoria de dados, em 2025, serão quase 5 mil interações diárias orientadas por dados por pessoa.
Em 2017, eram 300 contatos por dia. Diante desse cenário, espera-se que, até 2020, 80% das organizações iniciem o desenvolvimento de competências no campo da alfabetização em dados. Oséias Gomes, diretor de tecnologia da informação (CIO, na sigla em inglês) da Companhia de Saneamento Ambiental do Distrito Federal (Caesb), esclarece a crescente importância e o diferencial da análise de dados, além dos motivos que devem torná-la prioridade para o bom funcionamento de uma empresa.

O que é data science?
As empresas têm grande quantidade de dados, estruturados ou não, que impactam diariamente os negócios, o que chamamos de big data. A ideia é entender esses dados. O processo de análise pode gerar informações. O cientista de dados aproveita o poder das informações para impulsionar a inovação utilizando essas saídas.

O que faz o cientista de dados?
É o indivíduo que faz uso do poder computacional e da estatística para criar modelos matemáticos e comunicar descobertas. Ele reúne dados e extrai informações a partir dos processos e sistemas computacionais.

E onde entra a mineração de dados?
A mineração de dados é justamente o que um cientista de dados faz. É um processo automático de descobertas de informações úteis em um grande repositório de dados.

O senhor pode dar um exemplo de aplicação?
Alguém quer fazer uma viagem e outra pessoa tem um carro livre. Ao fim, haverá um indivíduo com um aplicativo na mão, solicitando um veículo, mas, por trás disso, tem a aplicação da ciência de dados, que faz a melhor descoberta e comunica os interessados. Há, além das pessoas envolvidas, um mapeamento do local, considerando distâncias e localização. A união de todos esses dados leva ao encontro do carro disponível mais próximo da pessoa que solicitou. É o uso da ciência de dados pelas empresas para oferecer um serviço. A empresa prestadora não tem os carros, ela conta com a análise dos dados oferecidos. Boa parte das companhias usam a ciência de dados para fazer descobertas de interesses comuns e otimizar preços.

Como os profissionais da área se dividem nas empresas?
Já existem firmas que têm um cientista de dados para cada segmento ou ramo de atuação. O papel deles é fazer análises, que incluem dizer quem são as pessoas mais propensas a comprar determinado produto, elaborar os perfis delas, e dar direcionamentos. A ideia é usar a ciência de dados para fazer aquilo que a mente humana, sozinha, não consegue. A máquina faz com facilidade o que uma pessoa leva muito tempo para executar, usando a tecnologia para encontrar e destacar justamente aquilo que destoa do restante. Imagine uma pilha de relatórios que é colocada na frente de um gestor para que ele tome uma decisão. Ele levará muito tempo para analisar todos os documentos para, depois, com a mente cansada e, talvez já distante de todos os dados analisados, tomar uma decisão. A ciência de dados presta ajuda para agilizar e alavancar a identificação do que é relevante para a empresa.

A ciência de dados é nova?
O termo data science, ciência de dados, é novo. É uma área que está surgindo por conta da convergência das novas tecnologias. Fazia-se antes, com outras técnicas. Mas, com essa nomenclatura e características, é uma atividade nova.

Qual a participação do ser humano na análise de dados?
É o indivíduo que vai construir os modelos que as máquinas vão seguir. No futuro, as pessoas vão treinar as máquinas e ensiná-las a melhor maneira de tirar proveito dos modelos.

O aprendizado das máquinas não depende de seres humanos?
A aprendizagem de máquina, o machine learning, é um tipo de inteligência artificial que utiliza dados para treinar um sistema. A aprendizagem de máquinas, então, é a aplicação de um modelo com o objetivo de levar a máquina a pensar como um humano. As vantagens incluem, por exemplo, detecção de fraudes, previsão de demanda, sistemas de recomendação e até veículos autônomos. O machine learning, quando aplicado ao grande volume de dados de uma empresa, pode alavancar de maneira exponencial os objetivos dela. Os gestores que não compreenderem isso já ficaram para trás, porque a maior parte do que acontece em uma empresa não pode ser compreendido por um relatório ou uma consulta. Nós não sabemos, sequer, quais perguntas devem ser feitas. Daí surge outro termo, a descoberta de dados, data discovery, que nada mais é que a compreensão de que o material enterrado nos dados de uma empresa pode significar o aumento de sua produtividade ou a sua ruína.

As pessoas deverão se preocupar com o risco de serem trocadas por máquinas?
Deve-se considerar o diferencial. Em um futuro muito próximo, nós vamos ter inovações na área. Pessoas vão elaborar, treinar e programar máquinas. Vamos nos perguntar: depois que o carro foi inventado, parou-se de andar a cavalo? Não, mas o carro passou a ser mais usado. Depois que o avião foi feito, deixou-se de usar o carro? Também, não. São inovações que vão surgindo. Cada uma ainda tem a sua função. Se eu quero ir de Brasília ao Rio de Janeiro e estou com pressa, não vou de carro. Vou usar um avião. Mas para passear em um bosque, melhor ir a cavalo.

Como o senhor aplica a ciência de dados no seu trabalho?
Eu assumi como CIO da Caesb há dois meses. A Caesb vem trabalhando já com essa organização de dados há um tempo, mas, a partir de agora, o data science será um dos focos.

DESAFIOS

Confira desafios que travam a pulverização da ciência de dados::

- Escassez de profissionais qualificados: as empresas precisam de cientistas de dados para operar seus sistemas de aprendizado de máquina, e os profissionais com essas habilidades estão entre os mais procurados. Mas capacitar um cientista de dados pode levar tempo.

- Falta de cultura baseada em dados: embora a maioria dos executivos compreenda os benefícios potenciais da tomada de decisão baseada em dados e da tecnologia de aprendizado de máquina, fazer com que todos em uma grande empresa mudem sua mentalidade pode ser um processo demorado.

- Requisitos de infraestrutura: sistemas avançados de aprendizagem de máquina funcionam melhor em aparelhos específicos, que exigem muito espaço de armazenamento e capacidades de rede adequadas para mover os dados para aplicativos e vice-versa.

- Dilemas éticos: a inteligência artificial está se tornando mais parecida com a humana, mas falta o senso de moralidade, característico das pessoas. Alguns especialistas pedem que as empresas de tecnologia assegurem que os sistemas de inteligência artificial sigam um conjunto rigoroso de regras éticas, a fim de evitar que cometam crimes e prejudiquem os seres humanos.

- Medo: muitas pessoas acham a ideia de inteligência artificial, em geral, ou de aprendizado de máquina, em particular, perturbadora. Elas se preocupam que os computadores assumam seus empregos ou representem uma ameaça existencial para a humanidade.

Fonte: Data Science Academy, plataforma de ensino a distância

Estude!

O Centro Universitário Iesb foi o primeiro a lançar graduação em ciência de dados no país. A Escola de Matemática Aplicada da Fundação Getulio Vargas (FGV EMAp), no Rio de Janeiro, acaba de lançar graduação no ramo, que começará em 2020. Além dessas, outras instituições oferecem cursos superiores e de pós-graduação na área.

Quem é?

Oséias Gomes é graduado em publicidade e propaganda pelo Centro Universitário Iesb, pós-graduado em gestão da segurança da informação e mestre em computação aplicada pela Universidade de Brasília (UnB). Consultor e ministrante de treinamento de banco de dados da Microsoft, é professor de computação da Iscon. Já foi consultor em Tecnologia da Informação e Comunicação de Dados do Sebrae (Serviço Brasileiro de Apoio às Micro e Pequenas Empresas) e assessor de tecnologia da informação da Emater (Empresa de Assistência Técnica e Extensão Rural do DF). Criou o Projeto Joshua, considerada a maior enciclopédia do mundo da Bíblia, e fundou uma loja on-line que, depois, vendeu para uma multinacional.

Estude!

Confira opções de cursos superiores e de pós-graduação em ciências de dados

Graduação

1) Centro Universitário Iesb ; Brasília (DF) [www.iesb.br]

Ciência de dados e inteligência artificial
Modalidade: presencial
Duração: quatro anos
Carga horária: 2.880 horas (oito semestres de 360 horas)
Investimento: mensalidades entre R$ 837,21 e R$ 937,17


2) Escola de Matemática Aplicada da Fundação Getulio Vargas (FGV Emap) ; Rio de Janeiro (RJ) [www.emap.fgv.br]

Ciência de dados
Modalidade: presencial
Duração: quatro anos
Carga horária: 2.610 horas
Investimento: mensalidades de R$ 3 mil

3) Centro Universitário Padre Anchieta (Unianchieta) ; Jundiaí (SP) [www.anchieta.br ]

Ciência de dados
Modalidade: presencial
Duração: oito semestres
Investimento: não informado

4) Centro Universitário Unidombosco (UniDBSCO) ; Curitiba (PR) [www.unidombosco.edu.br]

Ciência de dados e inteligência artificial
Modalidade: presencial
Duração: quatro anos
Carga horária: 3.180 horas
Investimento: mensalidades de R$ 950

5) Cruzeiro do Sul Virtual (FSG) [ www.cruzeirodosulvirtual.com.br]

Ciência de dados
Modalidade: tecnológico a distância
Duração: quatro semestres
Investimento: não informado

Pós-graduação



*Estagiária sob supervisão da subeditora Ana Paula Lisboa

Tags

Os comentários não representam a opinião do jornal e são de responsabilidade do autor. As mensagens estão sujeitas a moderação prévia antes da publicação