Ao iniciar um novo ano, muitos de nós nos perguntamos como o futuro se parecerá em nossas respectivas indústrias. No que se refere a banco de dados, mais especificamente, temos acompanhado um aumento no interesse por bancos de dados NoSQL que variam do nicho ao mainstream, e que nos deixam com muitas escolhas a considerar. Na medida em que as empresas reavaliam seus modelos de negócios – incluindo a escolha de bancos de dados – em 2017 e além, convém lembrar que aquelas que não inovarem serão deixadas para trás.

A realidade é que as empresas serão substituídas se não atualizarem seus modelos de negócios. Em 1960, a vida média de uma empresa era de cerca de 65 anos; agora, estima-se que, até 2027 – ou seja, daqui apenas 10 anos! – 75% das 500 maiores empresas dos EUA serão substituídas.

A sobrevivência vem da inovação. Em 2027 e mesmo depois, as organizações que melhor aproveitarem os dados dentro da empresa têm uma possibilidade maior de sobreviverem no mercado. A necessidade das empresas serem capazes de tratar cada cliente com a experiência mais personalizada possível nunca foi tão importante quanto agora.

A informação é agora conectada e sintetizada para conduzir à tomada de decisão, direção e interação com o cliente. Isto é o que se pode chamar de empresa conectada: um sistema de pontos de dados entrelaçados, trabalhando juntos em um único tecido para ajudar as empresas a obter insights de conexões de dados.

Para alcançar status de empresa conectada e perceber o significado do banco de dados baseado em grafos, as empresas devem entender as opções de banco de dados que estão disponíveis. Atualmente, a paisagem é composta por três categorias, descritas abaixo, e que devem experimentar um crescimento nos próximos anos:

Bancos de dados relacionais (RDBMS)

Não chega a ser uma revelação, mas esta ainda é a tecnologia dominante e provavelmente permanecerá como tal. Inúmeras empresas e indústrias dependem de bancos de dados relacionais, e isso não deve mudar tão cedo.

Bancos de dados NoSQL Tier-One

Com o apoio contínuo dos desenvolvedores e o sucesso comercial, veremos um punhado de bancos de dados não-relacionais de nível 1, que estarão no topo dos rankings NoSQL. Além disso, até 2020 o crescimento dos bancos de dados de código aberto irá terceirizar seus concorrentes de código fechado. Também nesse momento, é provável que a maioria dos fornecedores NoSQL de nível 1 tenha produtos de código aberto e comunidades vibrantes que os apoiem. Provavelmente, haverá sobreposição desses fornecedores, oferecendo uma funcionalidade secundária com outros modelos de dados, o que, naturalmente, fará aumentar a concorrência.

Bancos de dados NoSQL Tier-Two

Bancos de dados não-líderes em NoSQL, que chamaremos de bancos de dados de nível dois, irão se concentrar em modelos de nicho, muitos dos quais tendo perdido o tempo para florescer completamente. A maioria desses bancos de dados possuem casos de uso mais estreitos e modelos de boutique, razão pela qual terão menos impacto comercial.

Onde os bancos de dados baseados em grafos entram em cena? Estes, especialmente aqueles com armazenamento nativo de grafos e processamento de consultas, representam a próxima geração de bancos de dados relacionais, mas com suporte de primeira classe para “relacionamentos” ou conexões implícitas indicadas por chaves estrangeiras no modelo relacional. Por definição, um banco de dados nativo baseado em grafos é aquele que armazena dados como um grafo e processa queries que retornam dados e seus relacionamentos em tempo real, o que o torna ideal para consultar dados conectados. Ele modela os dados de forma direta e amigável, permitindo aos usuários representar a complexidade das conexões de dados de uma maneira explícita em comparação com a de um banco de dados relacional.

Os relacionamentos são cidadãos de primeira classe do modelo de dados baseado em grafos, ao contrário de outros sistemas de banco de dados que exigem inferir conexões entre entidades usando propriedades especiais como chaves estrangeiras ou processamento do tipo MapReduce. Cada nó no modelo de banco de dados baseado em grafos diretamente e fisicamente contém uma lista de registros de relacionamento que representam suas relações com outros nós.

As empresas podem essencialmente manter os dados como no mundo real: entidades pequenas, normalizadas, mas ricamente conectadas. Isso permite aos usuários consultar e visualizar dados de qualquer ponto de interesse imaginável, suportando muitos casos de uso diferentes.

Para as empresas que buscarem permanecer no topo entre as 500 maiores dos EUA, o fator de sucesso cada vez mais claro está em explorar dados conectados. Os bancos de dados baseados em grafos podem fornecer uma visão completa e em tempo real de informações interconectadas e podem escalar mais naturalmente para grandes conjuntos de dados e requerem tempos de consulta mais curtos, representando uma vantagem para quem quiser fazer perguntas complicadas de um conjunto de dados. Ao tratar as relações entre os pontos de dados como objetos de primeira classe, um banco de dados de grafos é otimizado para responder a perguntas sobre esses relacionamentos. Em última análise, uma empresa conectada alimentada por um banco de dados baseada em grafos é mais rentável do que as que estiverem desconectadas e empresas que reconhecerem isso devem prosperar nos próximos anos.

Fonte: insideBIGDATA