A Inteligência Artificial é um campo que captura a imaginação na imprensa e no domínio público, com uma visão de máquinas que nos apoiam no dia a dia. Mas até que ponto estamos perto disso na vida cotidiana dos negócios? A resposta é muito próxima, mas com um passo chave intermediário.

Em 2016, o Gartner cunhou o termo “Citizen Data Scientist” (CDS), significando uma pessoa “que cria ou gera modelos que usam análise avançada de diagnóstico ou recursos preditivos e prescritivos, mas cuja função principal de trabalho está fora do campo de estatística e análise. O Gartner também previu que o CDS ultrapassará os cientistas de dados na quantidade de análises avançadas que eles produzem, até 2019. Até recentemente essa previsão parecia imprecisa, mesmo que apenas pela data, não pelo resultado.

No entanto, o recente anúncio do Google sobre o lançamento do Beta-Stage de sua plataforma AutoML, e a publicidade subsequente, reacendeu a discussão sobre a futura mudança para um ambiente de CDS. Essencialmente, o AutoML fornece um algoritmo de aprendizado de máquina ideal para usos comerciais específicos. Tudo o que o usuário precisa fornecer são dados rotulados; dados com um resultado que o algoritmo pode usar para aprender. Nenhum conhecimento de ciência de dados é necessário. O AutoML está atualmente focado na classificação de imagens e tradução de linguagem natural, mas os planos para expandir a capacidade para outros tipos de problemas de negócios estão bem encaminhados.

Não há dúvida de que a previsão do Gartner acabará se concretizando, e pode haver pessoas lendo este artigo, que já estão empolgadas com o uso da IA ​​para apoiar seu trabalho; capacidade de desbloqueio que atualmente reside apenas no domínio dos cientistas de dados, em suas vidas comerciais cotidianas.

Aí reside um problema com o conceito de CDS: expectativa. Ainda estamos nos primeiros dias de progresso em direção ao CDS, e o foco atual está muito no domínio de tarefas fixas e repetitivas. No entanto, a expectativa do usuário provavelmente superará rápida e amplamente a capacidade, pelo menos a curto prazo.

Os usuários corporativos geralmente desejam estender soluções fornecendo dados diferentes ou usando-os para diferentes tipos de decisões. Isso está bem dentro dos limites das soluções e das tecnologias subjacentes, mas pode exigir o suporte de cientistas especialistas em dados, pois os limites são esticados e novos dados exigem configuração.

O conceito de aprendizado de máquina tem muitas facetas diferentes, e o que funciona para um tipo de problema de negócios pode não funcionar para outro. Por exemplo, a quantidade de dados e o período de tempo que os dados exigem para “aprender” um problema podem diferir entre problemas que, na primeira revisão, parecem muito semelhantes. Um usuário empresarial pode aprender isso por meio de tentativa e erro, mas é muito mais produtivo, para o usuário e seus negócios, obter a experiência de um cientista de dados para definir a estratégia de treinamento correta.

Ideação, a formação de novas idéias ou conceitos, é o maior objetivo e, paradoxalmente, o maior desafio para o conceito de CDS. Pense em dar a alguém um carro esportivo novo e brilhante e, em seguida, dizer-lhes que eles só podem levá-lo para o trabalho, em vez de explorar o país. O motorista pode tentar encontrar a rota mais interessante e diversificada para o trabalho, mas eles ainda chegam no mesmo lugar.

Como a jornada em direção ao CDS se desdobrará? Indubitavelmente, a longo prazo, as soluções se tornarão mais flexíveis e dinâmicas para realizar a definição completa do CDS. No curto prazo, no entanto, exigimos que os cientistas de dados se envolvam ativamente e apoiem o CDS em desenvolvimento dentro do negócio. O instrutor de condução para ajudar o motorista a usar o carro esportivo em estradas rurais.

Assim, pelo menos a curto prazo, precisamos expandir nossa definição de ciência de dados para pensar em ciência de dados como um serviço, essencialmente “Conhecimento como um Serviço”, como um próximo passo crítico no caminho para o verdadeiro Cientista de Dados Cidadão.

Fonte: insideBIGDATA