Resumen: El objetivo de este artículo es analizar cómo las investigaciones relacionan Big Data (BD) y Gestión del Conocimiento (GC). Existe una necesidad emergente en las organizaciones de buscar nuevas formas de analizar y procesar el gran volumen de datos desestructurados que no pueden ser analizados por los medios tradicionales de generación de informaciones y conocimiento. Así, para alcanzar el objetivo propuesto se llevó a cabo una revisión sistemática de la literatura, considerando artículos publicados en periódicos y congresos científicos en las bases de datos EBSCOhost y Web of Science. Fueron identificados 85 artículos. Los resultados se presentan en dos partes, la primera en la que se hace una síntesis de los datos de la investigación, destacando las principales palabras clave, el número de publicaciones por fuentes de los datos, entre otras, y la segunda parte relativa al análisis del contenido. Ese análisis contribuyó destacando la necesidad de entrenamiento/capacitación de personas para analizar BD y generar conocimiento, y de desarrollo de herramientas de GC para los activos de Big Data. Se verificó una tendencia hacia las investigaciones que enfocan el área de la salud y el uso preponderante de metodologías de Design Science y experimento. Como sugerencia de investigaciones, se proponen estudios sobre inversión en la capacitación, desarrollo de científicos de datos y sobre el comportamiento de las personas en el contexto de BD.
Palabras clave:Big DataBig Data, Gestión del Conocimiento Gestión del Conocimiento, Revisión Sistemática Revisión Sistemática.
Resumo: O objetivo deste artigo é analisar como as pesquisas relacionam Big Data (BD) e Gestão do Conhecimento (GC). Há uma necessidade emergente das organizações buscarem novas formas de analisar e processar o grande volume de dados desestruturados que não podem ser analisados pelos meios tradicionais de geração de informações e conhecimento. Assim, para atingir o objetivo proposto foi realizada uma revisão sistemática de literatura, considerando artigos publicados em periódicos e congressos científicos nas bases de dados EBSCOhost e Web of Science. Foram identificados 85 artigos. Os resultados são apresentados em duas partes, a primeira em que se faz uma síntese dos dados da pesquisa, destacando as principais palavras-chaves, o número de publicações por fontes dos dados, dentre outras, e a segunda parte é relativa à análise do conteúdo. Essa análise trouxe contribuições destacando a necessidade de treinamento/capacitação de pessoas para analisar BD e gerar conhecimento, de desenvolvimento de ferramentas de GC para os ativos de Big Data. Foi verificada a tendência de pesquisas enfocando a área da saúde e o uso preponderante de metodologias de Design Science e experimento. Como sugestões de pesquisas, propõem-se estudos sobre investimento na capacitação, desenvolvimento de cientistas de dados e sobre comportamento das pessoas no contexto de BD.
Palavras-chave: Big Data, Gestão do Conhecimento, Revisão Sistemática.
Abstract: The aim of this article is to analyze research relating to Big Data (BD) and Knowledge Management (KM). Organizations have been seeking new ways to analyze and process the large volume of unstructured data that cannot be analyzed by traditional means, in order to generate information and knowledge. With this aim, we conducted a systematic literature review of articles published in journals and scientific conferences, using the databases EBSCOhost and Web of Science. A total of 85 articles were identified. The results were presented in two parts; the first gives a summary of the research data, highlighting the main keywords and the number of publications by data sources, among others, and the second is based on analysis of content. This analysis highlighted the need for education and training of people to analyze Big Data and manage knowledge. Knowledge Management needs to develop tools for the Big Data assets. A trend was identified of studies that focus on the area of health, and a predominant use of methodologies of Design Science and experiments. As suggestions for further research, we proposed studies on investment in training, on the development of data scientists, and on individual behavior in the context of BD.
Keywords: Big Data, Knowledge Management, Systematic Review.
BIG DATA Y GESTIÓN DEL CONOCIMIENTO: DEFINICIONES Y DIRECCIONAMIENTOS DE INVESTIGACIÓN
BIG DATA E GESTÃO DO CONHECIMENTO: DEFINIÇÕES E DIRECIONAMENTOS DE PESQUISA
BIG DATA AND KNOWLEDGE MANAGEMENT: DEFINITIONS AND PROPOSALS FOR FURTHER RESEARCH
Recepção: 13/09/2016
Aprovação: 01/11/2016
As organizações estão vivenciando o crescimento do volume de dados e da informação. O termo Big Data (BD) tem sido usado para descrever o enorme volume de dados, que se caracteriza também por possuir um fluxo desestruturado, cuja infraestrutura existente nas organizações é incapaz de processar, tendo como suas principais características o alto volume, a velocidade e a variedade (DAVENPORT; BARTH; BEAN, 2012; GANDOMI; HAIDER, 2015).
O Big Data relacionado ao serviço de empresas de Internet tem crescido rapidamente. Por exemplo, o Google processa dados de centenas de petabyte (PB); o Facebook gera os dados de registro de mais de 10 PB por mês; Baidu, uma empresa chinesa, processamento de dados de dezenas de PB; e Taobao, uma subsidiária do Alibaba, gera dados de dezenas de terabyte (TB) para o comércio on-line por dia (CHEN; MAO; LIU, 2014). Como resultado, muitas empresas não estão sendo capazes de lidar com esse grande volume de dados e acabam perdendo dinheiro, além disso, estima ainda que 90% de todos os dados gerados não são analisados ou utilizados nos processos de decisão de negócios, e 60% destes dados começam a perder valor em milésimos de segundos depois de gerados (MOURDOUKOUTAS, 2015).
A relação entre conhecimento, informação e dados é destacada por Choo (2006) ao afirmar que o primeiro é a aplicação dos dois últimos, ou seja, o conhecimento tem como base a coleta de dados e informações adequadas, com a finalidade de ser útil à organização. AL-Ammary (2014) destaca que o conhecimento tem sido cada vez mais reconhecido como o ativo mais valioso nas organizações por ser um facilitador na formulação de uma estratégia e na busca por vantagem competitiva sustentável.
Logo, em um contexto de Big Data, o grande desafio é transformar todo o volume de dados em informação a fim de gerar conhecimento com valor para as organizações, de forma a trazer vantagem competitiva para as mesmas (ERICKSON; ROTHBERG, 2014). Assim, o Big Data pode contribuir para com a Gestão do Conhecimento (GC) nas organizações. A GC pode ser entendida como um conjunto de processos que visam à criação, ao armazenamento, ao compartilhamento e à utilização do conhecimento (CHYI LEE; YANG, 2000).
Nesse sentido, o objetivo deste estudo é analisar como as pesquisas relacionam Big Data e Gestão do Conhecimento, visando identificar aspectos que venham a contribuir com a evolução dos estudos na área de Sistemas de Informação (SI) e Gestão do Conhecimento.
Para isso, o presente estudo está estruturado da seguinte forma: na seção 2 será apresentado o referencial teórico abordando a Gestão do Conhecimento e Big Data; na seção 3 será descrito o método adotado; na seção 4 é realizada a discussão dos resultados da pesquisa; e, por fim, na seção 5 são trazidas as considerações finais.
Esta seção destina-se a aprofundar o estudo teórico de dois campos da presente pesquisa, a Gestão do Conhecimento e Big Data.
Inicialmente, faz-se necessário um entendimento das relações básicas entre dados, informação e conhecimento. Segundo Batra (2014), esta relação hierárquica tem origens na área de tecnologia da Informação (TI), pois compreender a distinção entre dados e informações é um pré-requisito para a disciplina de sistema de informação.
Os dados em si são a entrada para um sistema de processamento de dados (no qual a saída é a informação), é tipicamente gerada por meio de sistemas de processamento de transações. Sempre que uma decisão é tomada e que é cumprida, isso leva a uma transação ou uma série de operações que estão ocorrendo. Assim, o resultado secundário de qualquer transação concluída é a geração de dados, e dependendo da natureza do sistema de processamento de transações (seja on-line, em tempo real ou off-line), as informações como a saída também são atualizadas, e este processo cíclico continua (BATRA, 2014).
A informação é convertida para conhecimento, uma vez que ela é processada na mente do indivíduo e o conhecimento se torna informação ao se articular e apresentar em forma de gráficos, textos, palavras e outros símbolos (ALAVI; LEIDNER, 2001). Assim sendo, a Gestão do Conhecimento tem se concentrado em aspectos do conhecimento que podem torná-lo mais fácil ou mais difícil de ser capturado e compartilhado, por exemplo, por meio da transformação do conhecimento tácito em explícito (NONAKA; TAKEUCHI, 1997; POLANYI, 1967). Logo, para que as organizações sejam bem-sucedidas, elas devem estar capacitadas a capturar, integrar, criar e utilizar o conhecimento de maneira disciplinada, sistêmica e estratégica (SAMBAMURTHY; SUBRAMANI, 2005).
A criação de conhecimento organizacional reflete a capacidade de a organização gerar novos conhecimentos, distribuí-los e incorporá-los. Nonaka e Takeuchi (1997) defendem que esta abordagem compreende duas dimensões: uma epistemológica e outra ontológica. A dimensão epistemológica baseia-se na diferenciação entre o conhecimento tácito e o conhecimento explícito. Já a dimensão ontológica refere-se aos níveis de criação do conhecimento, como o individual, grupal, organizacional e interorganizacional (NONAKA; TAKEUCHI, 1997).
Davenport e Prusak (1999) definem conhecimento como uma mistura fluida de experiência, valores e informações que servem para gerar novas informações, ou seja, novas formas de conhecimento, dando ao conhecimento uma conotação similar a um sistema de feedback, ou seja, o conhecimento gera conhecimento. E que ao longo do tempo se desenvolve, seja por experiências, por livros, por formações curriculares ou mesmo por uma forma informal, como num diálogo entre amigos.
A Gestão do Conhecimento acontece quando a organização é capaz de reunir, armazenar e transferir conhecimentos, provendo o acesso às fontes de conhecimento por meio de mecanismos de identificação e recuperação de informações, visando à aplicação do conhecimento às necessidades específicas da organização (ALAVI; LEIDNER, 2001). Esses autores consideram uma classificação ampla contendo quatro processos básicos: criação, armazenamento/recuperação, transferência e aplicação de conhecimento. Tal proposta foi feita com o objetivo de investigar o papel da TI no suporte aos processos de gestão de conhecimento. Para estes autores, a criação de conhecimento ocorre de acordo com os quatro modos de conversão da teoria de Nonaka e Takeuchi (1997).
Hansen et al. (1999) sugerem que a estratégia de GC seja um mix de codificação (focada nas tecnologias) e de personalização (focada nos recursos):
Estratégia de codificação: Visa capturar e codificar o conhecimento tácito em uma forma explícita (manuais, documentos, procedimentos) e deixá-lo disponível para a reutilização de toda a organização;
Estratégia de personalização: Procura desenvolver as relações interpessoais de modo que estas promovam o compartilhamento do conhecimento tácito em toda a organização.
Todavia o que se observa é o rápido crescimento dos vários esforços analíticos e de inteligência. Com isso, os ativos intangíveis potencialmente valiosos são encontrados em uma variedade de lugares, no interior e fora da empresa (ERICKSON; ROTHBERG, 2014). Isto pode indicar uma potencial ligação com o Big Data. Para ilustrar esse ponto, tem-se a hierarquia apontada entre dados, informação e conhecimento, mas quando se fala em grande volume de dados, não está claro se essa relação se mantém. Logo, evidencia-se a necessidade de se avançar nos estudos sobre a relação entre GC e BD.
2.2 BIG DATA
Primeiramente, vale dizer que existem várias definições para o fenômeno Big Data, por isso e a fim de servir de base para a presente pesquisa, o Quadro 1 apresenta abordagens com definições de BD.

Baseando-se no Quadro 1, é possível notar uma similaridade nos conceitos, que podem ser sintetizados como sendo um grande volume de dados estruturados ou não, de fontes diversas, que devem ser gerenciados e analisados de forma peculiar.
Assim sendo, o desafio das organizações no gerenciamento dessa quantidade de dados é extrair informações estruturadas. As empresas que aprenderem a aproveitar oportunidades em “Big Data” poderão utilizar informações em tempo real a partir de sensores. A identificação por radiofrequência e outros dispositivos de identificação atuarão para que as organizações compreendam melhor seus ambientes de negócios em um nível mais granular, a fim de criar novos produtos e serviços, e/ou para responder às mudanças nos padrões de uso à medida que ocorrem (DAVENPORT; BART; BEAN, 2012).
Segundo Di Martino et al. (2014), as fontes de dados sãos as mais diversas, segundo os autores, os dados são gerados por vários tipos de recursos, tais como dispositivos móveis, celulares, sensores, portais sociais, internet das coisas, dados da própria empresa, câmeras digitais e sistemas de monitoramento, registros de software, dentre outros. Logo, as organizações terão de desenvolver processos contínuos para acessar essas fontes de dados, analisá-los e interpretá-los (GANDOMI; HAIDER, 2015).
Vale ressaltar que o Big Data, na sua grande maioria, é um conjunto de dados que a cada milésimo de segundo são inseridos novos, assim sendo, o mundo atual dos dados digitalizados contém uma inimaginável quantidade de informações, base que está em crescimento permanentemente (DAVENPORT, 2012). Além disso, existem outras características apontadas por diversos autores, mas para o presente estudo serão consideradas as seguintes: volume, variedade e velocidade, denominada 3 Vs, que seriam as mais comumente citadas (MCAFEE; ZIKOPOULOS et al., 2012; GANDOMI; HAIDER, 2015).
O processo gestão de Big Data tem como entrada as múltiplas fontes de dados, e suas características (volume, variedade e velocidade) são relevantes desde a geração até o processamento dos dados. Assim, cabe às organizações o trabalho de selecionar, processar, analisar e escolher os dados que irão gerar as informações com veracidade e oportunidade (FREITAS JUNIOR, MAÇADA, BRINKHUES, DOLCI, 2015).
Nesse sentido, empresas, nos mais diversos setores, podem usar o Big Data como um recurso, uma vez que cada dispositivo eletrônico enviado e consumidor deixam um rastro, assim é possível analisar esses conjuntos de dados para beneficiar clientes e mercados e otimizar as decisões de negócios (KIM; TRIMI; JI-HYONG, 2014). Entretanto, encontrar pessoas com habilidades para analisar Big Data é, talvez, o maior desafio para as organizações empresariais. As competências exigidas não são simples e nem exclusivamente orientadas para a tecnologia. As empresas recebem muitos dados e tem pouco tempo de processá-los e transformá-los em informação e conhecimento, cabendo a elas tornarem-se provedoras de percepção, usando a análise de dados para processar a informação e dizer o que fazer com ela (DI MARTINO et al., 2014).
Além das empresas prestadoras de serviços e das indústrias, uma área que vem aprofundando estudos sobre o Big Data é a área da Saúde. De acordo com Splendiani (2011), as pesquisas nessa área dependem cada vez mais de grandes coleções de conjuntos de dados e conhecimento, cuja geração, representação e análise muitas vezes exigem grandes esforços colaborativos e interdisciplinares. Com isso surge uma nova dimensão de pesquisa, pesquisa em Big Data, que visa ao desenvolvimento de ferramentas computacionais para gerenciar uma grande quantidade de dados, bem como melhorar a colaboração e a comunicação da comunidade em geral, tendo que por vezes iniciar um movimento de mudança na cultura da empresa.
Por fim, os dados estão amplamente disponíveis, são estrategicamente importantes, assim como o conhecimento que se pode extrair dos dados e, por conseguinte, a sabedoria oriunda dele (MAYER-SCHÖNBERGER; CUKIER 2013). Logo, acredita-se que os estudos e as pesquisas devem verificar se a presença ou não das características do Big Data se relacionam com a Gestão do Conhecimento, o que será feito a seguir.
Para compreender as relações entre a Gestão do Conhecimento e o Big Data é necessário, inicialmente, compreender a relação entre dados, informações e conhecimento, destacados por Alavi e Leidner (2001) no item 2.1, mas é preciso levar em conta principalmente o potencial de dados e informações para se transformar em conhecimento após a reflexão, a experiência ou a aprendizagem. Nesse sentido, é preciso entender as potencialidades e as peculiaridades do Big Data, já que esses dados são desestruturados em grande volume e velocidade (ERICKSON; ROTHBERG, 2014)
A Gestão do Conhecimento contempla processos para criação e compartilhamento do conhecimento, enquanto o foco do Big Data é gerar conhecimento a partir de um conjunto de dados. Esta intersecção pode trazer benefícios para as organizações, o que torna relevante investigar a relação entre eles, considerando que, segundo Davenport e Prusak (1999), o conhecimento é responsável pelo funcionamento das organizações.
Nesse sentido, Breternitz (2013) destaca que, com o Big Data, os executivos podem medir e conhecer mais sobre suas organizações. Além disso, o conhecimento gerado com Big Data pode contribuir para com o processo decisório, impactando com isso no desempenho de suas organizações. Entretanto, isso só ocorrerá na medida em que as ferramentas, as técnicas e as filosofias ligadas ao Big Data se disseminarem.
Kabir e Carayannis (2013) corroboram com essa ideia da melhoria dos processos decisórios, destacando que o sucesso de um projeto de Big Data depende, entre outros, em se ter uma compreensão clara de que tipos de conhecimento e percepções são necessárias em um processo de tomada de decisão. Entretanto, isso requer habilidades de engenharia de dados de um especialista de dados. Por outro lado, os tomadores de decisão de negócios também precisam ter conhecimento sobre que tipo de dados podem fornecer informações necessárias.
Tem-se então outro ponto a ser estudado, ou seja, é preciso levar em conta o desenvolvimento de pessoas com capacidade para trabalhar com isso. Uma necessidade são os chamados de “cientistas de dados” (do inglês data scientists). Estes profissionais precisam ter raciocínio lógico apurado, conhecimento profundo de estatística e software dessa área, modelagem, domínio de sistemas computacionais e conhecimento do negócio e do mercado em que atuará. Além disso, será necessária a capacidade de comunicar seus insights a um pessoal com uma formação não técnica (DAVENPORT; BARTH; BEAN, 2012).
Assim sendo, conforme destacam Davenport e Prusak (1999), para qualquer projeto de gestão, como a gestão de conhecimento, é necessário um forte apoio dos executivos de alta gestão. No que tange a relação entre o Big Data e a Gestão do Conhecimento, este apoio deve incluir uma mobilização das pessoas envolvidas, pois isso há a questão da cultura organizacional já presente nas organizações, e pode haver resistência. Com isso fica claro que o conhecimento oriundo do Big Data pode revolucionar o processo decisório, de gerenciamento e o desempenho de suas organizações.
Verifica-se, pois, que o conhecimento originado do Big Data é um recurso único, valioso, para qualquer organização, sendo capaz de gerar vantagem competitiva. Big Data também ajuda a transformar muitos dos métodos tradicionais de realização de atividades empresariais, gerando insights que se transformarão em conhecimento que virá a impulsionar capacidade da administração para a tomada de decisões (KABIR; CARAYANNIS, 2013).
Corroborando com a importância de avançar nos estudos que relacionam GC e BD, Manyika et al. (2011) apresentam um relatório da McKinsey Global Institute (MGI) que fornece uma estimativa da "Facilidade de Captura" do potencial de valor do Big Data para cada setor. A estimativa é baseada em quatro indicadores com uma relação com conceitos comuns de conhecimento.
Talento (Talent), que estaria intimamente relacionada com a compreensão comum do capital intelectual humano, com ênfase no conhecimento tácito como o talento individual ou know-how que pode ser difícil para compartilhar;
Mentalidade orientada por dados (Data‐driven mindset) remonta ao capital humano, especificamente o conhecimento de gestores e líderes da empresa;
Intensidade de TI (IT intensity), que tem uma conexão com o capital estrutural, ou seja, a estrutura de TI da empresa para o gerenciamento de dados, informações e conhecimento também é uma parte substancial do capital estrutural;
A disponibilidade de dados (Data availability) é o indicador que não está diretamente relacionado com o conhecimento, mas sim de forma indireta, pois diz respeito aos precursores de conhecimento: os dados e informações.
Assim, com base nos aspectos elencados nesta seção, a seguir será exposta a operacionalização das etapas dessa pesquisa, buscando verificar as relações para a investigação entre Big Data e Gestão do Conhecimento.
A presente pesquisa é de natureza qualitativa, enfatizando “os aspectos subjetivos da atividade humana focando o significado, e não a mensuração, de fenômenos sociais” (COLLIS; HUSSEY, 2005, p. 59). Para atingir o objetivo proposto, qual seja, analisar como as pesquisas relacionam Big Data e Gestão do Conhecimento, este estudo seguiu os passos metodológicos propostos por Wolfswinkel et al. (2013) para trazer rigor à pesquisa.
A escolha desses passos se justifica pela dificuldade de estruturação e apresentação uma revisão da literatura dos resultados da pesquisa, de forma pertinente, trazendo relevância e qualidade aos resultados, conforme destacam Webster e Watson (2002). O Quadro 2 ilustra os cinco passos do método proposto.

Com base nesses passos, esta seção explicita como a pesquisa foi realizada, expondo os procedimentos tomados pelo pesquisador, a fim de que seja possível verificar o rigor desta pesquisa.
No passo “definição”, foram definidos os critérios de inclusão e exclusão; identificadas as áreas de pesquisa; determinadas as fontes apropriadas; e decidido sobre os termos específicos de pesquisa.
Inicialmente, foi feita uma revisão bibliográfica que permitiu que o pesquisador pudesse verificar possíveis palavras-chave, que seriam mais relevantes para o tema, conforme se pôde verificar no item 2.3, já que o que se pretende é verificar aspectos que circundam as relações entre Big Data e Gestão do Conhecimento. Em seguida, foi realizada uma pesquisa piloto com esses temas no idioma em português. Não houve um retorno efetivo, o que resultou foram vários artigos sobre Big Data no idioma inglês, mas não houve representatividade de artigos em português. Assim, optou-se por utilizar os termos em inglês, entre aspas, com o modo boleano, separado pelo conectivo em inglês and.
Assim sendo, para a coleta de dados, foram utilizadas as seguintes palavras-chaves: “Big Data” and “Knowledge Management”. Como o referencial teórico indica a importância do compartilhamento da informação como sendo um tema presente na GC, buscou, também, “Big Data” and “Knowledge Sharing”.
O uso do Knowledge Sharing como palavra-chave se deve ao fato de que a gestão do conhecimento envolve o compartilhamento do conhecimento, conforme visto no estudo de Nonaka e Takeuchi (1997), que apresentam formas de converter o conhecimento tácito em explícito. Entre os processos de gestão do conhecimento, o compartilhamento do conhecimento é considerado uma das mais importantes (YU et al., 2010; ISKOUJINA; ROBBERTS, 2015). Por isso, a escolha de Knowledge Sharing como uma das palavras-chave a serem pesquisadas relacionadas ao Big Data.
As buscas iniciais foram realizadas em várias bases, com os mesmos termos, vindo a optar pelas que apresentaram os resultados mais consistentes em número e qualidade que pudessem sustentar a presente pesquisa. Optou-se pelas bases Elton Bryson Stephens Company (EBSCOhost) e Web of Science (WOS). Além do fato de terem apresentado mais resultados, a escolha da primeira se deve também ao fato de contemplar várias bases, como a Academic Source Complete (ASC), Academic Search Premier (ASP), Business Source Complete (BSC), dentre outras, e a segunda, por proporcionar o acesso a periódicos múltiplos com altos fatores de impactos, conforme destaca Barata (2010).
Os links de acesso serão apresentados a seguir:
EBSCO
http://web.a.ebscohost.com/ehost/search/selectdb?sid=d9c1110c-5419-4abb-a903-864917c378bf%40sessionmgr4001&vid=0&hid=4206
WEB OF SCIENCE
http://apps.webofknowledge.com.ez45.periodicos.capes.gov.br /WOS_GeneralSearch_input.do?product=WOS&search_mode=GeneralSearch&SID=2DuJLb6Z5i31qEqiJtu&preferencesSaved=
Para a busca nas duas bases, os termos e as restrições foram os mesmos, período de 2006 a 2016; quanto ao idioma não houve restrição, entretanto todos os resultados obtidos foram em língua inglesa. As variações ocorreram devido à peculiaridade e ao modo de busca de cada base, o que será detalhado a seguir.
Na primeira base de dados, EBSCO Host, foram selecionadas as seguintes fontes de dados/bases de dados: “Academic Search Elite”, “Library, Information Science & Technology Abstracts with Full Text”, “Academic Search Premier” e “Business Source Complete”. O passo seguinte foi a seleção de pesquisa avançada, que permite que se insira mais de um termo de busca, utilizando-se o modo de pesquisa boleano/frase. Em seguida, para cada uma das fontes citadas, foi selecionada a busca por Journals, periódicos e artigos de congressos. A próxima restrição foi o tipo de documento, tendo sido selecionado o termo “tudo” e marcado “texto completo em pdf” para as seguintes fontes “Academic Search Premier“ e “Academic Search Elite”, pois eram as únicas que disponibilizaram esta última opção de seleção.
Na segunda base de dados, a Web of Science, foi selecionada a opção busca básica, que já permitiu a inserção dos termos de busca, utilizando-se o modo de pesquisa boleano/frase. Selecionou-se o período, já destacado, e não houve mais nenhuma restrição, seguindo-se a busca com as configurações default padrão da base.
Os dois passos seguintes propostos por Wolfswinkel et al. (2013) ocorreram de forma integrada. A cada busca a amostra foi refinada para verificar possíveis duplicidades e outros problemas. A pesquisa foi realizada entre os meses de março e julho de 2016.
Na primeira busca, na base EBSCOHost com os termos “Big Data” and “Knowledge Management” foram obtidas 40 (quarenta) publicações com as seguintes fontes, Revistas Acadêmicas (23), Journals (16), Publicações comerciais (14) e Revistas (3). Já na busca com os termos “Big Data” e “Knowledge Sharing” foram obtidos 2 (dois) resultados, em revistas acadêmicas, totalizando no primeiro momento 42 (quarenta e dois artigos). Entretanto, após verificar as duplicidades e excluir publicações que não eram científicas, permaneceram 29 publicações.
Na segunda busca, com a base do Web of Science, com os termos “Big Data” e “Knowledge Management” foram obtidos 55 (cinquenta e cinco) artigos, e com os termos “Big Data” e "Knowledge Sharing” foram obtidos 4 (quatro) artigos. Porém, dois desses já constavam na pesquisa realizada na outra base, assim, após excluir duplicidades e excluir publicações que não eram científicas, permaneceram 57 (cinquenta e sete) artigos. Desse total, 50 artigos são de conferências e as outras 7 (sete) são de periódicos. Portanto, somando as duas bases, permaneceram 85 (oitenta e cinco) artigos para análise.
Os dados foram analisados seguindo os conceitos de análise de conteúdo, obedecendo às etapas de redução, de exibição e de conclusão e verificação (GIL, 2009). Assim, buscou-se analisar primeiramente cada uma das bases, e depois elas foram unidas, realizando uma terceira análise global. Para tanto, utilizou-se o software Weft QDA. Os dados foram categorizados inicialmente seguindo os indicadores apontados por Manyika et al. (2011) no relatório da McKinsey Global Institute, apresentado no item 2.3 deste estudo. Durante a análise dos dados outras categorias emergiram nesta fase.
Este último passo do método sugere a representação e a estruturação do conteúdo e a estruturação do artigo. Logo, esta fase é o resultado da pesquisa em si, expresso neste artigo, sendo que a representação e a estruturação do resultado da pesquisa em si serão apresentadas na seção 4.
Esta seção visa analisar os resultados obtidos na presente pesquisa que busca analisar como as pesquisas relacionam Big Data e Gestão do Conhecimento.
O primeiro resultado a ser destacado é a evolução das publicações destes dois assuntos juntos ao longo do tempo, sendo o período de busca foi de 2006 a 2016. No Quadro 3 são apresentados os dados obtidos, verifica-se que é um tema recente, com o montante maior no ano de 2013, o que se justifica pelas conferências ocorridas naquele ano.

No Quadro 4, os artigos são agrupados segundo as conferências internacionais encontradas na pesquisa da base Web of Science. Observa-se que a maioria dos artigos, 38(trinta e oito) dentre as 50 (cinquenta), referem-se a assuntos de saúde, o que indica o crescimento de importância do estudo da Gestão do Conhecimento e do Big Data para essa área, indo ao encontro do que foi destacado no referencial teórico.

No Quadro 5 estão relacionados os periódicos cujos artigos foram publicados, destaca-se a revista “KM World” que possui 12 (doze) artigos. Acredita-se que essa concentração se deve ao fato de a mesma ser específica para o tema gestão do conhecimento.

As principais palavras-chaves encontradas nas publicações pesquisadas estão apresentadas em ordem ocorrência no Quadro 6. Pode-se observar que os termos da busca principal da pesquisa possuem maior número de ocorrências.

Seguindo o preconizado por Chen et al. (2012) em revisão temática da literatura sobre Big Data, para ilustrar a análise do conteúdo investigado, também nesse trabalho é apresentada uma visualização em Tagcloud (nuvem de palavras) dos principais temas de pesquisa, para isso se utilizou o conteúdo dos títulos e dos resumos dos trabalhos analisados. A Figura 1 apresenta a representação das palavras-chaves mais significativas relativas aos temas pesquisados que compõem o atual estado da arte da combinação dos dois conteúdos abordados nesta pesquisa: Big Data e Gestão do Conhecimento.

A Tagcloud foi elaborada com o apoio do software de análise qualitativa MaxQDA versão 11.1.2, excluindo as palavras sem significado (conjunções, artigos, adjetivos, etc.) e as palavras de busca da seleção da amostra de artigos (Big Data, Knowledge Management e Knowledge Sharing). As palavras destacadas com maior tamanho de fonte indicam uma maior importância do termo ranqueado a partir da frequência em que o termo foi encontrado. Como pode ser visto, as palavras de maior destaque corroboram com a análise dos tópicos discutidos nessa seção (4.2), especialmente nos tópicos relacionados à aplicação de Big Data nos estudos de Saúde. Também se destacam os aspectos tecnológicos, como infraestrutura, arquitetura e desenvolvimento de sistemas. A análise dos termos extraídos também pode ser útil em atribuir tendências para as pesquisas futuras sobre esses temas.
No que tange aos autores, não existe uma frequência de um ou mais determinado autor. Analisando os resultados, é possível inferir que isto se deve a duas razões principais, uma devido ao fato que os artigos de conferência são na sua maioria do ano de 2013 e não existe um autor com várias publicações do mesmo tema numa mesma conferência; e a outra pela característica relacionada ao resultado já apresentado no Quadro 3, ou seja, a maioria dos artigos foram publicados nos anos de 2012, 2013 e 2014. A seguir serão apresentados os métodos utilizados.
No que diz respeito às metodologias de pesquisa utilizada nas publicações, verificou-se que em muitas publicações a mesma não foi explicitada. Dentre as que foram apresentadas, destaca-se a elevada ocorrência de revisões sistemáticas de literatura. Isso pode ser explicado pela emergência recente do tema.
Todavia, foi observado o preponderante uso de metodologias de Design Science e experimento, também justificado pela característica do tema já destacado, sendo que a maior incidência foi o uso do Design Science, com 28 (vinte e oito) ocorrências. Novamente, destacaram-se as pesquisas na área da saúde com a utilização dessa metodologia, as quais buscam a construção e desenvolvimento de arquiteturas de base de dados e de pesquisa.
Esta categoria emergiu ao se verificar o surgimento de uma nova tendência de pesquisa na área de saúde, relacionando os três temas apresentados no título deste item. Este aspecto já havia sido apontado no referencial teórico, vindo a ser comprovada na análise dos resultados.
Verificou-se, ainda, que das pesquisas analisadas, as principais publicações sobre GC, BD e Saúde foram em conferências. Trata-se de 38 (trinta e oito) trabalhos que propõem sistemas de “eHealth architecture” (para prover ferramentas de pesquisa que visam reunir uma base de dados grande para a investigação na área das doenças raras). Como exemplo, o estudo denominado “A Generic, Expandable Architecture for Data Acquisition for Medical Research for Example Haemophilia”, apresentado na conferência Health Informatics Meets Ehealth.
Inicialmente, os dados foram categorizados de acordo com os indicadores propostos pela McKinsey Global Institute (MANYIKA et al., 2011), que fornece uma estimativa da "Facilidade de Captura" do potencial de valor do Big Data devido à relação com conceitos comuns de conhecimento, são eles: talento; intensidade de TI; mentalidade orientada por dados e disponibilidade de dados. Além desses, observou-se a ocorrência do tema saúde e buscou-se conhecer os principais métodos e sugestões de pesquisa, estes três últimos aspectos constituem três categorias que emergiram durante a análise dos dados.
O talento está intimamente relacionado com a compreensão comum do capital intelectual humano, com a ênfase está no conhecimento tácito, ou seja, como o talento individual ou know-how que pode ser difícil de ser compartilhado (MANYIKA et al., 2011). No que tange a essa categoria, pode-se destacar que os estudos apresentados no periódico CyberPsychology, Behavior & Social Networking apontam para a necessidade de investimento também nas pessoas, para capacitá-las a fim de que elas sejam capazes de ter insights, permitindo a integração de experiências sociais de larga escala e insights comportamentais (GAGGIOLI, 2013).
Além disso, os trabalhos analisados apontam para a possibilidade de se obter conhecimento a partir das experiências dos clientes, o que implica pesquisas sobre predição. Um dos principais exemplos é a análise do perfil do cliente de cartões de crédito e com isso é possível conhecer as preferências individuais e, por conseguinte, oferecer serviços personalizados. Isto requer prática para o desenvolvimento do know-how (GHOCHANI, 2013).
Para isso, existe uma necessidade urgente de sistemas capazes de extrair informação útil a partir de uma massa de informações e grande volume de dados e sistemas que permitam a visualização dos mesmos. Tais sistemas também poderão auxiliar na transformação do conhecimento tácito para o explícito, bem como o desenvolvimento do capital intelectual humano para a geração do conhecimento necessário (LARA-NAVARRA; SERRADELL-LÓPEZ; MANIEGA-LEGARDA, 2013; LAMONT, 2012)
A mentalidade orientada por dados, assim como o talento, já analisado, remonta ao capital humano, especificamente o conhecimento de gestores e líderes da empresa de acordo com Manyika et al. (2011).
Segundo Kabir e Carayannis (2013), as organizações devem considerar o conhecimento “escondido” no Big Data como o conhecimento tácito. Tais autores argumentam que se deve aproveitar a experiência acumulada pelos membros das empresas para que sejam desenvolvidos processos e técnicas de armazenamento e análise de dados para a geração de conhecimento. Além disso, os referidos autores destacam a importância do investimento no desenvolvimento das pessoas responsáveis pelas decisões, ou seja, líderes e gestores capazes de extrair valor dos dados e informações, a fim de gerar conhecimento.
Segundo o relatório da McKinsey Global Institute de 2011, a intensidade de TI tem uma conexão com o capital estrutural, ou seja, a estrutura de TI da empresa para o gerenciamento de dados, informações e conhecimento também é uma parte substancial do capital estrutural.
Esta categoria é corroborada pelos autores Kabir e Carayannis (2013), Sukumar e Ferrell (2013) e Batra (2014), que destacam que a importância das empresas desenvolverem ou adquirirem ferramentas, tecnologias e outras propostas de soluções para que o Big Data possa gerar informação e essa informação seja convertida em conhecimento para as organizações, uma vez que muitas organizações estão obtendo vantagem do business analytics e soluções de inteligência para ajudá-las a encontrar novos insights em seus processos, melhorando assim sua performance.
Além das publicações em periódicos, as conferências também destacam a importância do investimento da estrutura de TI para a geração do conhecimento a partir do Big Data. Isto pôde ser observado pelos estudos que destacam técnicas emergentes de computação em nuvem e modelo de computação Big Data, como o MapReduce, conforme se pôde observar no artigo denominado “IntegrityMR: Integrity Assurance Framework for Big Data Analytics and Management Applications” publicado na conferência “2013 IEEE INTERNATIONAL CONFERENCE ON BIG DATA”.
Em síntese, os estudos apontam a necessidade de uma estrutura de TI capaz de armazenar um grande volume de dados, de processar e de recuperar dados e informações, combinando com soluções de Business Intelligence (BI) e/ou Business Analytics (BA), com isso se acredita ser mais possível obter o conhecimento necessário para a organização (LAMONT, 2012; JOHNSON, 2012).
A disponibilidade de dados é um indicador que não é diretamente relacionado com o conhecimento, mas com os antecedentes do conhecimento, ou seja, os dados e as informações (MANYIKA et al., 2011). Os estudos apontam a necessidade da obtenção de valor a partir dos dados, segundo Kabir e Carayannis (2013). Para que isso ocorra, é necessário que a coleta seja realizada com objetivos específicos. Ainda segundo estes autores, atualmente, com o crescimento na quantidade de informação e a possibilidade da utilização dos dados no futuro, combinado com a diminuição de custos de recursos de armazenamento e conectividade, as organizações estão se concentrando no Big Data, mas para isso devem gerar valor a partir dos mesmos.
Erickson e Rothberg (2014) vão ao encontro das afirmações ao reconhecerem o BD como um ativo valioso, sugerindo a necessidade de se estabelecer uma base conceitual de Big Data. Como ponto de partida, os autores sugerem a aplicação de métricas de capital intelectual e ferramentas de gestão do conhecimento para os ativos de Big Data.
Em síntese, pôde-se observar ainda que as publicações pesquisadas que buscaram desenvolver uma base teórica para o estudo de GC e BD apontam para a necessidade de se considerar o valor do Big Data. Além disso, os estudos indicam que as fontes de dados também têm aumentado, assim como o tamanho de dados. Logo, os dados em si tornam-se um recurso fundamental para uma empresa, pois oportunidades deliberadas são criadas para gerar dados dos próprios dados, de forma crescente, podendo criar valor e proporcionando uma vantagem competitiva para a empresa (SUKUMAR; FERRELL, 2013; BATRA, 2014).

Para as empresas, de uma forma geral, a GC, em um contexto de BD, ainda é um terreno incipiente. Muitas delas entendem que existem mais conhecimento e as informações que podem ser extraídas a partir de dados disponíveis em Big Data usando criatividade, recombinação e métodos inovadores, produzindo um valor substancial, porém há a necessidade de encontrar uma abordagem adequada para alinhar o Big Data com a estratégia da organização (KABIR; CARAYANNIS, 2013).
Assim, foi possível verificar nesse estudo várias oportunidades de novas abordagens e algumas sugestões de pesquisas futuras que possam contribuir para o avanço da pesquisa na área. A seguir, serão listadas algumas dessas sugestões:
Buscar o estado da arte a fim de se propor soluções para a gestão de grande volume de dados (KOSCIEJEW, 2013);
Geração de valor dos dados no contexto de BD (ERICKSON; ROTHBERG, 2014);
Big Data, gestão do conhecimento e estratégia da organização (SUKUMAR; FERRELL, 2013; BATRA, 2014);
Como a granularidade pode impactar no conteúdo de Big Data, na extração das informações e geração do conhecimento (ZHANG, 2013);
Pesquisas sobre investimento na capacitação, desenvolvimento de cientistas de dados e sobre comportamento das pessoas no contexto de Big Data (GAGGIOLI, 2013);
Estudo sobre predição e gestão do conhecimento a partir do comportamento de clientes (GHOCHANI, 2013; LAMONT, 2012);
Implicações de Big Data Analytics (KABIR; CARAYANNIS, 2013);
Soluções de Business Intelligence (BI) para gerenciamento de dados e gestão do conhecimento (LAMONT, 2012; JOHNSON, 2012).
Essas propostas sintetizam algumas oportunidades e sugestões que tiveram uma ocorrência maior nesta análise de dados e possuem um caráter mais genérico, sabe-se que existem outras mais específicas a cada estudo, como relacionadas a já destacada questão de saúde.
Esse estudo verificou as conexões naturais existentes entre Gestão do Conhecimento e Big Data. Kabir e Carayannis (2013) evidenciam que esta conexão é clara, mas por se tratar de um tema novo, o desafio está em encontrar as maneiras de relacionar a Gestão do Conhecimento em um contexto de grande volume de dados (ERICKSON; ROTHBERG, 2014).
Este desafio foi um dos norteadores desta pesquisa que teve como objetivo identificar as relações entre Big Data e Gestão de Conhecimento, a fim de verificar as possíveis oportunidades de pesquisa. Foi apresentado o direcionamento de pesquisa na revisão de literatura e por meio da análise da busca realizada nas bases de pesquisa científica de trabalhos sobre o tema.
Os resultados apresentados e a análise contribuem tanto para a pesquisa acadêmica quanto para a prática gerencial. Existem vários desafios ainda a serem vencidos, mas com o aumento de pesquisas nessa área, as organizações poderão gerenciar o conhecimento com mais qualidade e agregar valor aos seus negócios.
Do ponto de vista gerencial, a sintetização dos trabalhos sobre o tema propõe reflexões de como obter valor dos dados neste contexto, bem como se pensar em tecnologias, ferramentas, enfim, soluções para que se possa gerar e gerenciar conhecimento no contexto de Big Data. Além disso, observa-se que, além de contexto, o Big Data pode ser estudado como um recurso ou ativo que deve estar alinhado à estratégia da empresa para gerar vantagem competitiva.
Pelo lado acadêmico, por se tratar de um tema emergente, foram apresentadas várias oportunidades e sugestões de pesquisa relacionando GC e BD. Além desses direcionamentos, essa pesquisa contribui para a literatura de ambos os temas, apresentando uma abordagem conceitual dos mesmos.







