Por dentro das regras de gerenciamento de dados da Qlik

Mike Capone, CEO da Qlik, fala da transição de sua empresa em uma de gestão de dados, sua tração em APAC e o que faz para colocar a análise de dados nas mãos de mais trabalhadores

Por Aaron Tan, TechTarget – Tradução de Vitor Lacerda. 

A aquisição empresas de software de inteligência empresarial e análise por gigantes da tecnologia na última década lançou uma sombra sobre o futuro de companhias independentes que desenvolvem ferramentas para ajudar empresas a compreender amontado de dados.

No entanto, o interesse nessas empresas por figurões como Salesforce, que fechou sua aquisição do Tableau por 15,7 bilhões de dólares em Agosto de 2019, ressalta a crescente importância das ferramentas de análise de dados à medida que mais empresas se interessam pela tomada de decisão baseada em dados.

Essas ferramentas, entretanto, não mais só ingerem dados de fontes e oferecem visualizações de dados sofisticados para ajudar trabalhadores a compreendê-los. Por um lado, os colaboradores da Qlik  agora oferecem uma enorme quantidade de recursos de gerenciamento de dados, desde curadoria e catalogação de dados até rastreamento de linhagem de dados.

Durante sua visita a Cingapura, Mike Capone, CEO da Qlik, discute a transição da empresa para o gerenciamento de dados, sua tração na região da Ásia-Pacífico e o que está fazendo para colocar a análise de dados nas mãos de mais trabalhadores. 

Conte-nos mais sobre a tração da Qlik na Ásia-Pacífico. Estando aqui em Cingapura, você obviamente vê muito potencial de crescimento nesta região, certo?

Mike Capone: Esta é uma parte incrivelmente forte do mundo onde temos uma presença forte. Com nosso foco em dados e análise, estamos no lugar certo, na hora certa.

Como você já pode provavelmente perceber, não há um executivo sênior no mundo que não está avaliando dados e análises para melhorar sua empresa. Nos últimos dias, eu me encontrei com os ministros governamentais, grandes bancos e universidades, uma vez que o interesse é generalizado, não apenas em Cingapura, mas também em toda a Ásia.

Embora a Qlik seja pioneira em análise visual, o mundo mudou bastante. Nossa visão agora não é somente visualizar pequenos conjuntos de dados, mas reunir conjuntos massivos de dados de diferentes fontes, curá-los e, em seguida, alavancar ferramentas de análise e machine learning para ajudar os usuários a entender os dados. É um momento inovador para nós e, como você provavelmente já sabe, nós fizemos algumas aquisições nos últimos dezoito meses para aumentar nossas capacidades.

Quais são os pontos críticos para o crescimento da Qlik na região?

Capone: Cingapura é claramente um dos principais mercados. Com base em nosso estudo sobre alfabetização em dados, Cingapura está no topo da lista de países no que diz respeito ao uso corporativo de dados na tomada de decisões informadas.

Japão é outro mercado onde nós vemos crescimento e temos uma forte presença. China também está pronta – ela pode ter começado atrás de todos, mas está alcançando-os muito rapidamente. Não há um país na Ásia onde não estamos fazendo negócio, mas esses três são provavelmente os mercados mais críticos no momento para nós.

Você pode falar sobre a curva de adoção para análise de dados aqui na Ásia? Dependendo da maturidade de uma empresa, algumas podem começar com ferramentas tradicionais de inteligência empresarial e desenvolverem-se nelas, enquanto outras podem ir direto para ferramentas como as da Qlik.

Capone: Existem três ondas para isso. A primeira onda foi gerada por relatórios de TI, que foi o que empresas como Cognos e Bussines Objects entregaram. Essas companhias foram adquiridas por companhias maiores, e a inovação meio que se perdeu no caminho.

A geração posterior foi mais centrada ao usuário, pois as empresas procuravam capacitar os colaboradores com ferramentas de análise de dados. O problema, contudo, foi que os dados ainda estavam bloqueados nos sistemas operacionais, além de que o TI ainda estava envolvido no processamento de solicitações para retirar os dados desses sistemas.

A onda mais recente, a que estamos vendo agora, é sobre desbloquear todos os dados com ferramentas mais recentes, como a tecnologia de change data capture, o catálogo de dados, como também ferramentas de empresas parceiras, como Snowflake e Amazon, com o intuito de democratizar o acesso aos dados. TI apenas se torna um facilitador para obter os dados e, em seguida, capacita os usuários com ferramentas de análise para acessar os dados por conta própria.

Dito isso, as empresas ainda lutam para garantir que seus dados estejam limpos. Estamos conversando sobre isso há muito tempo e ainda hoje é um problema. Você vê isso como um desafio contínuo?

Capone: Sim, isso ainda é um problema. Há muitos sistemas operacionais por aí com múltiplas fontes de dados. Eles podem até mesmo ser plataformas de consumidores nas quais os usuários, como eu e você, colocam informações que nem sempre são precisas.

A notícia boa é que as ferramentas agora permitem meios mais rápidos de limpar os dados, checar a veracidade deles e protegê-los. Cerca de um ano e meio atrás, nós adquirimos uma empresa chamada Podium Data, que oferece uma tecnologia que permite à TI configurar catálogos de dados e que os usuários verifiquem se seus dados estão precisos e limpos. É quase autopoliciamento, porque as pessoas podem destacar que uma fonte de dados está faltando determinados campos, por exemplo. Isso fornece um loop de feedback contínuo sobre os dados, algo que não existia antes.

Isto é parte de um plano maior para ir mais fundo no espaço de gerenciamento de dados?

Capone: Sim. Nós gastamos 560 milhões de dólares na aquisição de Attunity, uma empresa de gerenciamento de dados; portanto, passamos de apenas uma empresa de análise para uma plataforma de dados completa, com recursos de curadoria, catalogação e gerenciamento de data lake, além de machine learning e inteligência artificial (IA).

Nossa plataforma agora tem um produto chamado Replicate, que retira dados dos sistemas operacionais quase em tempo real. Ele captura as alterações, o que facilita seu gerenciamento sem agentes para que a velocidade dos sistemas operacionais não diminua.

Junto a isso, nós temos um produto chamado Compose, que é uma ferramenta de gerenciamento de data lake, oferecendo a capacidade de conformar modelos de dados e criar informações prontas para análises para usuários finais. 

Por fim, há a ferramenta de catalogação de dados, Catalyst, da qual eu falei, e Qlik Sense, nosso principal produto. A parte legal disso é que fizemos outra aquisição chamada Insight Bot, basicamente um produto de PLN (Processamento de Linguagem Natural) que permite aos usuários fazer perguntas sobre os dados em linguagem natural e obter não apenas as respostas, mas também sugestões sobre o que deveriam procurar.

O que você descreveu soa como os perímetros de sua estratégia de gerenciamento de dados. Você vai avançar em áreas como recuperação de desastres e backup e recuperação, que é o que alguns fornecedores de gerenciamento de dados fazem?

Capone: Não seremos nós, pelo menos a curto prazo. Embora você nunca deve dizer nunca, não é parte de nossa estratégia por agora. Existem muitos fornecedores de infraestrutura capazes de fazer esse tipo de trabalho. Nossa diferença está claramente em nossa habilidade de ajudar a entender os dados.

Vamos falar sobre a concorrência. Você acha que o investimento considerável da Salesforce na aquisição da Tableau é uma afirmação do mercado em que você está inserido? Você acha que empresas com a sua seriam capazes de agregar mais valor como parte de uma plataforma maior, talvez no futuro?

Capone: Eu só consigo olhar para trás na história. Eu fui CIO por muitos anos, como também estava presente durante a transição da Cognos e da Business Objects. Essa geração acabou não terminando muito bem, com a inovação diminuindo quando a transição aconteceu. Não vou especular no que a Salesforce vai fazer com o Tableau ou o o que o Google pensa em fazer com a Looker.

Porém, o que vou dizer é que o acordo do Tableau é uma afirmação de que nós estamos num bom espaço e eu certamente estou muito feliz com isso. E olha, é uma abordagem diferenciada. Aqueles são jogadores de grandes plataformas na nuvem, a estratégia deles será a de colocar os seus dados na plataforma deles. É o que eles fazem. É a estratégia de negócio deles que cria alguma viscosidade. Contudo, não é a nossa estratégia, então, isso cria um diferencial para nós.

Se você olhar para o que o Google e a Salesforce estão fazendo, Qlik é o maior fornecedor independente de análises em escala neste momento. Nossa estratégia é os seus dados. Nós somos completamente agnósticos. Estamos acima da Salesforce e da GCP (Google Cloud Plataform). Nós executamos na Amazon e na Azuere e nos seus datacentre. Nós também temos nossa própria nuvem. Minha mensagem aos clientes, o que ressoa muito bem, é que não há bloqueio. Negociamos com vocês do jeito que vocês querem negociar conosco.

Você pode aproveitar a nuvem e nós a abraçamos totalmente. Dito isso, nós o faremos no ritmo que você quer. Algumas empresas ainda não estão prontas. Nossos clientes podem se movimentar no próprio ritmo, o que é muito diferente do que o grupo competitivo está pregando no momento e isso é uma vantagem para nós.

Como os recursos de IA da Qlik se comparam aos recursos de IA integrada que estão cada vez mais sendo incorporados nos aplicativos de negócios?

Capone: Nós temos uma abordagem muito aberta com nossa tecnologia. Nós temos APIs abertos e grandes parceiras com empresas como a DataRobot. Se você tem um aplicativo de IA muito personalizado, ou se você quer escrever um pouco de código R ou código Python, nós conseguimos acomodá-los. Para casos de uso sofisticado, nos quais há recursos muito fortes da ciência de dados, você poder continuar.

O que nós trazemos é IA incorporada e machine learning para ajudar nossos usuários compreenderem os dados. Nós o chamamos de mecanismo cognitivo. Por exemplo, se você trouxer dois arquivos de dados discrepantes, nós não vamos procurar apenas por padrões nesses dados, mas também sugerir os porquês de um certo padrão existir e nortear os usuários num determinado caminho.

Agora, o que nos diferencia às outras tecnologias baladas? Não vou dar nome aos bois, mas algumas empresas podem ter vendido suas capacidades de IA além da conta. Quando extraímos inferências dos dados, nós informamos os motivos aos usuários.

Além disso, está a capacidade PNL. Você pode digitar perguntas sobre uma informação e o programa vai responder e sugerir algumas visualizações também. Nós chamamos de inteligência melhorada do que de inteligência artificial, pois estamos tentando ajudar os usuários a entenderem a informação do que substituí-los.

Quão flexível é a plataforma da Qlik no que concerne a acomodação de customizações que as empresas podem querer fazer para atender necessidades específicas?

Capone: O que nós tentamos fazer, particularmente agora que estamos nos aproximando mais de uma arquitetura em nuvem, é certificar que podemos manter e melhorar o software continuamente. Não temos muitos clientes que querem customizar o mecanismo núcleo do nosso produto.

O que temos é algo chamado Qlik Branch, nossa plataforma desenvolvedora que as pessoas podem usar para construir extensões da nossa tecnologia. Elas são isoladas para que, quando fizermos melhorias, elas ainda funcionarão. Se olhar a alguns dos relatórios de Gartner, nossa simpatia pelo desenvolvedor é um de nossos principais pontos forte. Nós temos uma comunidade na qual os desenvolvedores trocam ideias e compartilham códigos e nós contribuímos para a comunidade open source.

Você está vendo mais casos de uso da Internet das Coisas (IdC), principalmente em análises de streaming realizadas em dados coletados nos confins da rede?

Capone: Sim, vemos muito disso. Nós trabalhamos com uma empresa chamada mesur.io, a qual instrui plantações e o solo ao redor das plantações para ver quanta água elas precisam ou se elas estão muito secas. Nós também trabalhamos com juntas policiais para transmitir os dados de drones. A habilidade de fazer isso em tempo real numa alta velocidade é superimportante. 

Como que a sua infraestrutura funciona para suportar essa carga de trabalho? Você utiliza os provedores da nuvem ou possui uma combinação de infraestrutura de nuvem pública com seus próprios datacentres?

Capone: Nós usamos Amazon como nossa plataforma de hospedagem na nuvem para nossos produtos na nuvem, mas nós geralmente trabalhamos com o que o cliente deseja. Às vezes, os dados do sensor são transmitidos para algum data warehouse na Amazon ou na GCP e, então, os clientes executam nossas análises para extrair as conclusões desses dados.

Para resolver questões de soberania e segurança de dados, permitimos que nossos clientes implementem nossa tecnologia onde quiserem. Data Catalyst, nosso produto, tem um modelo de segurança robusto e recursos sofisticados em torno da linhagem de dados para que os clientes saibam quem acessou os dados e para onde eles foram. Então, se um usuário está fora de uma determinada região que pode acessar os dados, ele ou ela não conseguirá vê-los. Como você sabe, proteção de dados é um cenário em constante mudança, então tudo que podemos fazer é ser flexível.