(Não) óbvio OSINT no Twitter



O Twitter é bastante antigo, mas ainda é um serviço de microblog que ainda é popular entre uma ampla audiência, usada ativamente por usuários comuns e por figuras públicas. O melhor exemplo são as contas oficiais do Twitter de políticos, escritores, músicos e atores. Obviamente, essas contas são frequentemente mantidas por “pessoas especialmente treinadas”, mas se estamos falando de OSINT no setor de manufatura, o monitoramento das contas de engenheiros ou gerentes comuns pode fornecer excelentes resultados.

Também é importante que, para trabalhar efetivamente com uma matriz de dados do Twitter, não seja necessário processar cada tweet manualmente ou ir para o outro extremo - conecte-se à API e escreva você mesmo o software. Embora a interface padrão do serviço não nos dê quase nada em termos de ferramentas de pesquisa ou ferramentas de filtragem, o Twitter suporta um grande número de consultas e regras de pesquisa, que não são realmente mencionadas na interface ou aplicativo da Web padrão. É com o uso dessas consultas que vale a pena começar.

Twitter Dorks


No Twitter, você pode procurar informações por quatro parâmetros principais: por conteúdo, por informações completas de tweet, por tipo de mídia e por usuário.

Por "conteúdo" entende-se o próprio texto ou as palavras-chave dos tweets. Esta categoria inclui as seguintes consultas:
Consulta de pesquisaProcurar Resultados
watching nowContém "assistindo" e "agora"
"happy hour"Contém a frase exata "happy hour"
love OR hateContém o valor "amor" OU o valor "ódio"
beer -rootContém "cerveja", mas não contém "raiz"
#haikuContém o Haiku Hashtag
$twtrContém etiqueta de dinheiro, usada para rastreamento de preços.
politics filter:safeOs tweets que contêm "política" serão excluídos como conteúdo inapropriado
puppy url:twitterContém a palavra "filhote" e o URL no qual existe uma combinação de "twitter" em qualquer parte dele
traffic ?Procura tweets com a palavra tráfego e um ponto de interrogação

A categoria "informação" inclui a categoria "conteúdo" e dados como a data do tweet, geolocalização, retweets e até coisas complexas como a filtragem pelo número de retweets, respostas e curtidas.

Consulta de pesquisaProcurar Resultados
near:london within:15miGeolocalização de pontos com raio em mi (milhas) ou km (quilômetros)
superhero since:2015-12-21Contém "super-herói" e enviado depois da data especificada "21-12-2015" no formato "ano-mês-dia"
#brexit until:2016-06-23Contém "#brexit" e enviado antes da data especificada "23-06-2016" no formato "ano-mês-dia"
puppy source:tweetdeckContém "filhote" e foi enviado usando "tweetdeck" (outras opções de fonte: "twitter_for_iphone", "twitter_for_android" e "twitter_web_client")
puppy min_retweets:5Contém "filhote" e tem no mínimo 5 retweets
puppy min_faves:10Contém "filhote" e tem pelo menos 10 curtidas
puppy min_replies:100Contém filhote e tem pelo menos 100 repetições
puppy filter:nativeretweetsMostra retweets que contêm a palavra "filhote"
puppy filter:retweetsEstilo de filtragem da velha escola para retweets antigos (RT) que contêm a palavra "filhote"


Na categoria "mídia", você pode filtrar os tweets pelo conteúdo da mídia, por exemplo, pesquisar apenas tweets de um vídeo ou foto, ou simplesmente encontrar todas as postagens que contenham algum URL externo.

Consulta de pesquisaProcurar Resultados
kitten filter:mediaContém "gatinho" e qualquer tipo de mídia (imagem ou vídeo)
kitten filter:native_videoContém "gatinho" e vídeo tweetado, ou vídeo do Periscope

kitten filter:periscopeContém "gatinho" e um link para o vídeo do Periscope
kitten filter:imagesContém "gatinho" e todos os links definidos como imagens
kitten filter:twimgContém "gatinho" e uma imagem carregada em pic.twitter.com. As imagens podem ser uma ou mais
kitten filter:linksContém "gatinho" e qualquer URL

Com a filtragem por "usuário", tudo fica mais ou menos claro: esse conjunto de funções de pesquisa permite filtrar entradas por contas. Ao mesmo tempo, podemos observar tweets não específicos, mas, por exemplo, apenas as respostas do objeto de monitoramento a usuários específicos .

Consulta de pesquisaProcurar Resultados
from:jackTweet enviado pelo usuário @jack
list:NASA/space-tweetsTweet enviado da conta da NASA para a folha "NASA / space-tweets"
to:NASAReproduzir outros usuários na conta da NASA
@NASAProcure por tweets que mencionam a NASA
breaking filter:verifiedPesquise todos os tweets com a palavra "quebra" em todas as contas verificadas

É importante observar que, para todas as solicitações acima do tipo "filter: type", a regra da solicitação "exclusiva" é válida através do uso do símbolo "-". Por exemplo, para obter todas as mídias da NASA, exceto as imagens, insira uma consulta como “from: NASA filter: media -filter: images”.

Todo esse conjunto de comandos de pesquisa se parece com o Ano Novo no meio do verão, porque elimina a necessidade de analisar com ferramentas de terceiros, conectando-se à API e outros truques e dificuldades técnicas inerentes à pesquisa em dados públicos.

De fato, o próprio Twitter nos permite pegar qualquer informação em que estamos interessados, e de acordo com uma gama bastante ampla de parâmetros que podemos combinar. Surpreendentemente, todas as consultas de pesquisa descritas obviamente não estão documentadas em nenhum lugar. Ou seja, o Twitter permite analisar e pesquisar sutilmente as postagens de seus usuários, mas isso não se aplica particularmente. E é maravilhoso - que tenhamos essa oportunidade - porque muitas vezes os especialistas sofrem com o efeito de "superqualificação" e complicam sua vida onde poderiam usar a navalha da Occam e encontrar a solução mais óbvia e ao mesmo tempo a mais correta para sua tarefa.

Tweetdeck


Um aplicativo conhecido para filtrar o conteúdo por determinados parâmetros e categorias é o Tweetdeck . No entanto, se um usuário comum visualizar o Tweetdeck simplesmente como outra encarnação do feed RSS, no caso de filtragem direcionada de dados públicos, ela se tornará uma ferramenta muito poderosa.

Um dos cenários mais óbvios para o uso do Tweetdeck no contexto OSINT é reduzir o nível de ruído em uma amostra funcional de tweets. Pronto para uso, o serviço pode criar uma lista negra de palavras-chave e os tweets que as contêm simplesmente não aparecerão no seu fluxo. Se você está envolvido no OSINT e coleta informações de fontes públicas, essa função tem um aplicativo muito óbvio.

Vamos considerar um caso condicional: a conta do Twitter de Stephen King. Quem se deparar com a conta do escritor sabe que ela consiste em 30% de amor por seu cachorro, 60% de ódio ao presidente Trump e 10% dos tweets deixarão o resto. Se precisarmos exatamente dos últimos 10% dos registros, o Tweetdeck permitirá perfeitamente filtrar a maior parte do lixo que não é interessante para nós e trabalhar com uma seleção mais ou menos relevante. Vejamos um pedaço da fita de King:



filtraremos as configurações do Tweetdeck para as palavras-chave "Trump", "presidente", "casa branca", "Obama" para cortar a maior parte da "politota" da nossa amostra.



Na verdade, isso é feito elementarmente. Depois de vários tweets com palavras-chave, a conta que observamos mudou completamente:



Ao mesmo tempo, o Tweetdeck suporta todas as consultas de pesquisa discutidas no início do artigo, o que o torna uma ferramenta confortável para encontrar informações.

Agora, muitos de vocês pensaram que, com esse conjunto de consultas de pesquisa suportadas, resta apenas escrever um software que extraia tweets para você e os colete em relatórios, por exemplo, em documentos de texto, que podem ser passados ​​preguiçosamente enquanto saboreiam gaivotas frescas. E aqui novamente o princípio da "solução mais simples - a mais correta". Afinal, antes de se sentar para escrever um software, você deve abrir o Google e ele nos responderá: você não precisa escrever nada, esse software já existe e se chama Twitter Archiver.

Arquivador do Twitter


O Archiver do Twitter (Tweet) é uma extensão de planilha do Google que coleta dados de nossas pesquisas no Twitter e carrega tudo no Google Docs. O próprio aplicativo se apega aos complementos das tabelas do Google e permite que você faça o upload dos resultados da pesquisa diretamente no documento.



No momento da criação da primeira regra de pesquisa, o Twitter Archiver solicitará um login em uma conta existente da qual trabalhar. Isso é tudo. Pesquisamos, analisamos, carregamos em uma tabela do Excel e analisamos.

Por exemplo, usaremos o proxy do Twitter com os parâmetros de pesquisa mais amplos possíveis para mostrar a aparência do upload: Clicável Na saída, obtemos uma tabela com as seguintes colunas:




Data, Nome de tela, Nome completo, Texto do Tweet, ID do Tweet, Link (s), Mídia, Localização, Retweets, Favoritos, Aplicativo, Seguidores, Segue, Listado, Verificado, Usuário desde, Localização, Biografia, Site, Fuso horário, Imagem do perfil . Infelizmente, tudo isso não se encaixou na captura de tela acima, pois ocupa duas telas.

Existe apenas uma fraqueza na ferramenta apresentada: a versão gratuita do Twitter Archiver permite analisar apenas uma regra e apenas uma vez por hora. A versão paga funciona sem restrições no número de regras de pesquisa e faz um upload uma vez a cada 15 minutos. É verdade, não é barato: de US $ 39 / ano por usuário a US $ 399 / ano para um número ilimitado de contas.

Total


É possível coletar informações em um modo semiautomático sem nenhuma habilidade de programação, basta pesquisar consultas no próprio Twitter e no aplicativo Tweetdeck. O bot das tabelas do Google simplifica a sistematização, mas uma versão completa dela custa dinheiro.

Existe uma maneira mais complicada, que não se relaciona com o tópico do artigo como uma solução simples, mas é necessário mencioná-lo. Essa solução é obter acesso à API do Twitter por meio de uma solicitação oficial e criar suas próprias ferramentas. No entanto, a pessoa privada não tem muitas chances para isso: em fóruns especializados, eles dizem que nem todo mundo dá acesso à API e a taxa de rejeição é muito alta.

Mas e se você quiser proteger seus dados e não coletá-los? Como lidar com a análise de dados no Twitter? Sim, de fato, nada. Esta é uma rede pública de microblogs na qual existem apenas duas ferramentas de proteção de informações: listas negras de contas e restrição de acesso.

O primeiro, obviamente, não salvará bots e análises. O segundo é mais eficaz, mas os tweets estarão disponíveis para visualização apenas dos assinantes da conta. Se estamos falando de algum tipo de conta pública, a segunda opção não é aplicável. Além disso, um observador sempre pode se infiltrar na lista de leitores se o titular da conta adicionar manualmente novos seguidores.

Portanto, a única maneira garantida de reduzir a probabilidade de vazamentos do OSINT via Twitter para um nível aceitável é não usar o Twitter.

All Articles