O uso massivo de redes sociais, a troca de mensagens instantâneas e a facilidade de gerar publicações pela web têm se tornado um hábito comum entre a população mundial. Esta tendência facilita a comunicação e gera uma imensa quantidade de dados que, muitas vezes, ficam expostos na internet, numa camada denominada Surface Web. Já o processo de busca e análise desses dados se denomina Open Source Intelligence (OsInt).
Na Surface Web podemos obter informações pessoais nos perfis em redes sociais e aplicativos de relacionamento, possibilitando um levantamento de dados abertos com propósitos investigativos. As redes sociais mais utilizadas pelos brasileiros são Facebook, Twitter, LinkedIn e Instagram, além do YouTube e Tinder, que também podem ser utilizados para obtenção de dados pessoais.
Considerando este universo de dados abertos disponíveis na internet, a Stefanini Rafael, joint-venture entre a multinacional brasileira Stefanini e a israelense Rafael, oferece ao mercado nacional a plataforma Cyber Intelligence. Baseada em tecnologia israelense, a solução consiste em um conjunto de módulos que trabalham de forma integrada e possibilitam aos investigadores, analistas forenses e profissionais de segurança da informação buscar, pesquisar e analisar dados abertos, tendo como base vários métodos investigativos em uma única solução.
A plataforma Cyber Intelligencepossibilita a localização de perfis em redes sociais através de dados mínimos fornecidos pelo usuário, como nomes, apelidos, números de telefone ou endereços de e-mail. A partir destes dados, a plataforma consegue localizar perfis aderentes aos dados de entrada e iniciar a coleta de dados relativos ao perfil, publicações e conexões. Especificamente para análise de redes sociais, utiliza-se o conceito de WebInt (Web Intelligence), um desdobramento do método de coleta de inteligência de dados abertos, que visa a pesquisa de perfis pelo método conhecido como rastreamento (Scam ou Crawler).
“Um diferencial da plataforma Cyber Intelligence é a geração de percepções (insights) a partir dos dados obtidos na internet, que permitem obter informações não declaradas explicitamente pelo usuário da rede social, mas que estão inclusas em suas conexões e postagens. Desta forma, a plataforma pode fornecer ao investigador percepções - lugar de domicílio, profissão, etnia e sexo - apenas pela análise de suas postagens”, explica Marco Alexandre Rodrigues, gerente executivo da divisão de Segurança e Inteligência da Stefanini Rafael.
A geração de percepções é possível porque a plataforma utiliza um moderno conjunto de algoritmos baseados em Inteligência Artificial, principalmente técnicas de Processamento de Linguagem Natural (Natural Language Processing). Outra vantagem da ferramenta é a identificação de sentimentos nas postagens, comentários e reações de um usuário ou de um grupo de usuários.
Além disso, a plataforma pode gerar informações preditivas, como detectar eventos prestes a ocorrer, permitindo que ações de mitigação de riscos e atividades preventivas possam ser executadas em tempo hábil.
A navegação e a obtenção de dados ocorrem por meio de uma biblioteca de identidades virtuais, criadas por cada investigador com o objetivo de manter a confidencialidade no processo de buscas. Estas identidades são também conhecidas como avatares e podem assumir características sociais, conforme a necessidade da investigação.
Além de perfis de redes sociais, a plataforma Cyber Intelligence permite ainda a pesquisa por tópicos. Neste caso, o investigador busca um conteúdo específico para analisar quem está publicando ou republicando determinado assunto. Pode ser utilizado, principalmente, para localizar notícias falsas (Fake News).
Outra vertente de pesquisa se refere à DarkNet, que consiste em sistemas e sites não indexados, que não permitem a busca de conteúdo através de buscadores tradicionais como Google ou Bing. São sites de conversas privadas e de comércio eletrônico, que não têm um endereço comercial ou de fácil acesso e, por isso, estão nas camadas mais profundas da internet. A DarkNet se desdobra em duas camadas operacionais, a Deep Web e a Dark Web.
A Deep Web é um termo geral para classificar sites distintos que não se comunicam com as redes tradicionais. Apesar da dificuldade de acesso e localização de sites nesta camada, nem tudo que está na Deep Web é ilegal. Existem na Deep Web vários sites de gestão e administração de sites abertos, assim como muitos fóruns de discussão e chats de conversa, que são acessados, principalmente, pela população de países onde há censura ou perseguição religiosa e política, servindo ao propósito de democratizar a comunicação e a livre expressão.
A Dark Web é uma parte da Deep Web, entretanto nessa camada obscura da internet, a maioria dos sites é direcionada a práticas criminosas. Pelo fato de não ter como rastrear quem está por trás dos sites da Dark Web, os criminosos publicam sites com conteúdo ilegal - pornografia infantil, chats de conversa entre terroristas e grupos de ódio, instruções para criar bombas e outros artifícios ilícitos.
A plataforma Cyber Intelligencepermite realizar buscas na Deep Web e na Dark Web, possibilitando o acesso a sites privados de grupos de discussão de forma anônima, sem a necessidade de o investigador participar de tais grupos. Permite, por exemplo, verificar números de cartões de crédito que estão sendo comercializados na DarkNet.
Os processos de pesquisa na internet podem ser aprimorados com vários recursos semânticos oferecidos pela solução, como a geração de dicionários de termos comuns a um determinado crime ou delito, nomes e apelidos de membros de organizações criminosas, catálogo de marcas e modelos de veículos, padrão de numeração de documentos, catálogo de sinônimos etc. A plataforma também permite buscas de palavras e expressões em várias línguas.
Uma plataforma de geoprocessamento (Mapas) também é oferecida pela plataforma Cyber Intelligence, o que possibilita o uso de conceitos de geolocalização em vários estágios de uma investigação. É possível geolocalizar, de forma automática, perfis, fotos e postagens sobre o mapa. Fotos e vídeos podem ser georreferenciados a partir de seus metadados de geolocalização. Em redes sociais onde os metadados dos arquivos são apagados, o sistema procura por outras formas de georreferenciamento, como check-in, citação de pontos de referências, endereços e declarações de localização.
Uma forma de enriquecer as análises é associar bases de dados existentes a partir da integração de sistemas legados em uso pela corporação, ou mesmo incluir nos casos investigados arquivos não estruturados como textos, listagens e planilhas.
Todas as informações obtidas na Surface, Deep e Dark Web podem ser associadas aos dados obtidos por meio das integrações com outros sistemas e bases de dados não estruturados. O ambiente de correlação de dados (Link Analysis) permite que os analistas visualizem e verifiquem redes complexas de correlação, combinando dados provenientes de fontes variadas, através de uma interface de visualização gráfica dedicada e simples de operar.
O módulo de análise de correlação é utilizado para mapear conexões diretas de uma única fonte de dados, como um perfil do Facebook, e conexões indiretas de várias redes sociais, com visualização distinta para diferentes entidades e conexões, permitindo identificar e destacar conexões mútuas entre entidades, além de revisar informações adicionais sobre as entidades selecionadas.
Ao final do processo, os investigadores podem gerar dossiês e relatórios com todas as informações obtidas, incluindo dados de perfis de redes sociais, mapas de localização, gráficos e listas de artefatos identificados, como placas de veículos, nomes de suspeitos, locais de encontro e pontos de interesse.