(No) OSINT obvio en Twitter



Twitter es bastante antiguo, pero sigue siendo popular entre una amplia audiencia de servicios de microblogging, que son utilizados activamente tanto por usuarios comunes como por figuras públicas. El mejor ejemplo son las cuentas oficiales de Twitter de políticos, escritores, músicos y actores. Por supuesto, tales cuentas a menudo son mantenidas por "personas especialmente capacitadas", pero si estamos hablando de OSINT en el sector de fabricación, entonces monitorear las cuentas de ingenieros o gerentes comunes puede dar excelentes resultados.

También es importante que para trabajar de manera efectiva con una variedad de datos de Twitter no sea necesario procesar cada tweet manualmente, o apresurarse al otro extremo: conectarse a la API y escribir el software usted mismo. Aunque la interfaz estándar del servicio no nos da casi nada en términos de herramientas de búsqueda o herramientas de filtrado, Twitter admite una gran cantidad de consultas y reglas de búsqueda, que en realidad no se mencionan en la aplicación o interfaz web estándar. Es con el uso de estas consultas que vale la pena comenzar.

Twitter Dorks


En Twitter, puede buscar información por cuatro parámetros clave: por contenido, por información completa de tweets, por tipo de medio y por usuario.

Por "contenido" se entiende el texto en sí o las palabras clave de los tweets. Esta categoría incluye las siguientes consultas:
Consulta de busquedaResultados de la búsqueda
watching nowContiene "viendo" y "ahora"
"happy hour"Contiene la frase exacta "hora feliz"
love OR hateContiene el valor "amor" O el valor "odio"
beer -rootContiene "cerveza" pero no contiene "raíz"
#haikuContiene el hashtag Haiku
$twtrContiene etiqueta de efectivo, utilizada para el seguimiento de precios.
politics filter:safeLos tweets que contienen "política" se eliminarán como contenido inapropiado
puppy url:twitterContiene la palabra "cachorro" y la URL en la que hay una combinación de "twitter" en cualquier parte
traffic ?Busca tweets con la palabra tráfico y un signo de interrogación

La categoría "información" incluye tanto la categoría "contenido" como datos como la fecha del tweet, la geolocalización, los retweets e incluso cosas tan complejas como el filtrado por la cantidad de retweets, respuestas y me gusta.

Consulta de busquedaResultados de la búsqueda
near:london within:15miGeolocalización de puntos con radio en mi (millas) o km (kilómetros)
superhero since:2015-12-21Contiene "superhéroe" y se envía después de la fecha especificada "2015-12-21" en el formato "año-mes-día"
#brexit until:2016-06-23Contiene "#brexit" y se envía antes de la fecha especificada "2016-06-23" en el formato "año-mes-día"
puppy source:tweetdeckContiene "cachorro" y se envió mediante "tweetdeck" (otras opciones de origen: "twitter_for_iphone", "twitter_for_android" y "twitter_web_client")
puppy min_retweets:5Contiene "cachorro" y tiene un mínimo de 5 retweets
puppy min_faves:10Contiene "cachorro" y tiene al menos 10 me gusta
puppy min_replies:100Contiene cachorro y tiene al menos 100 repeticiones
puppy filter:nativeretweetsMuestra retweets que contienen la palabra "cachorro"
puppy filter:retweetsEstilo de filtrado de la vieja escuela para viejos retweets (RT) que contienen la palabra "cachorro"


En la categoría "medios", puede filtrar los tweets por el contenido del contenido multimedia, por ejemplo, buscar solo tweets de un video o foto, o simplemente encontrar todas las publicaciones que contienen alguna URL externa.

Consulta de busquedaResultados de la búsqueda
kitten filter:mediaContiene "gatito" y cualquier tipo de medio (imagen o video)
kitten filter:native_videoContiene "gatito" y video tuiteado, o video de Periscope

kitten filter:periscopeContiene "gatito" y un enlace al video de Periscope
kitten filter:imagesContiene "gatito" y todos los enlaces que se definen como imágenes
kitten filter:twimgContiene "gatito" y una imagen cargada en pic.twitter.com. Las imágenes pueden ser una o más
kitten filter:linksContiene "gatito" y cualquier URL

Con el filtrado por "usuario", todo está más o menos claro: este conjunto de funciones de búsqueda le permite filtrar entradas por cuentas. Al mismo tiempo, podemos observar tweets no específicos, sino, por ejemplo, solo las respuestas del objeto de monitoreo a usuarios específicos .

Consulta de busquedaResultados de la búsqueda
from:jackTweet enviado por el usuario @jack
list:NASA/space-tweetsTweet enviado desde la cuenta de la NASA a la hoja "NASA / space-tweets"
to:NASAReproducir otros usuarios a la cuenta de la NASA
@NASABusque tweets que mencionen a la NASA
breaking filter:verifiedBusque todos los tweets con la palabra "ruptura" en todas las cuentas verificadas

Es importante tener en cuenta que para todas las solicitudes anteriores del tipo "filtro: tipo", la regla de la solicitud "exclusiva" es válida mediante el uso del símbolo "-". Por ejemplo, para obtener todos los medios de la NASA, excepto las imágenes, debe ingresar una consulta como "from: filtro de la NASA: media-filtro: imágenes".

Todo este conjunto de comandos de búsqueda se parece al Año Nuevo a mediados del verano, ya que elimina la necesidad de analizar con herramientas de terceros, conectarse a la API y otros trucos técnicos y dificultades inherentes a la búsqueda en datos públicos.

De hecho, Twitter en sí mismo nos permite tomar cualquier información que nos interese, y de acuerdo con una amplia gama de parámetros que podemos combinar entre nosotros. Sorprendentemente, todas las consultas de búsqueda descritas obviamente no están documentadas en ninguna parte. Es decir, Twitter le permite analizar y buscar sutilmente las publicaciones de sus usuarios, pero esto no se aplica particularmente. Y es maravilloso, que tengamos esa oportunidad, porque a menudo los especialistas sufren el efecto de "sobrecalificación" y complican su vida donde podrían usar la navaja de afeitar de Occam y encontrar la solución más obvia y al mismo tiempo la más correcta para su tarea.

Tweetdeck


Una aplicación bien conocida para filtrar contenido por parámetros y categorías dados es Tweetdeck . Sin embargo, si un usuario común ve a Tweetdeck simplemente como otra encarnación de la fuente RSS, entonces, en el caso del filtrado dirigido de datos públicos, se convierte en una herramienta muy poderosa.

Uno de los escenarios más obvios para usar Tweetdeck en el contexto OSINT es reducir el nivel de ruido en una muestra de tweets en funcionamiento. Fuera de la caja, el servicio puede crear una lista negra de palabras clave y los tweets que los contienen simplemente no aparecerán en su transmisión. Si está involucrado en OSINT y recolecta información de fuentes públicas, dicha función tiene una aplicación muy obvia.

Tomemos un caso condicional: la cuenta de Twitter de Stephen King. Quienes se encuentran con la cuenta del escritor saben que consiste en un 30% de amor por su perro, un 60% de odio al presidente Trump y un 10% de los tuits dejarán el resto. Si necesitamos exactamente el último 10% de los registros, Tweetdeck le permitirá filtrar perfectamente la mayor parte de la basura que no nos interesa y trabajar con una selección más o menos relevante. Veamos un trozo de cinta de King:



filtraremos la configuración de Tweetdeck para las palabras clave "Trump", "presidente", "casa blanca", "Obama" para eliminar la mayor parte de la "política" de nuestra muestra.



En realidad, esto se hace de manera elemental. Después de una mutación de tweets con palabras clave, la cuenta que hemos observado ha cambiado por completo:



Al mismo tiempo, Tweetdeck admite todas las consultas de búsqueda que se discutieron al comienzo del artículo, lo que lo convierte en una herramienta cómoda para encontrar información.

Ahora, muchos de ustedes han pensado que con un grupo de consultas de búsqueda compatibles, solo queda escribir software que extraiga tweets y los recopile en informes, por ejemplo, en documentos de texto, que luego se pueden hojear mientras beben gaviotas frescas. Y aquí nuevamente el principio de "la solución más simple, la más correcta". Después de todo, antes de sentarse a escribir software, debe abrir Google y él nos responderá: no necesita escribir nada, dicho software ya existe y se llama Twitter Archiver.

Twitter Archiver


Twitter (Tweet) Archiver es una extensión de hoja de cálculo de Google que recopila datos de nuestras búsquedas en Twitter y los carga en Google Docs. La propia aplicación se aferra a los complementos de las tablas de Google y le permite cargar los resultados de búsqueda directamente en el documento.



En el momento de la creación de la primera regla de búsqueda, Twitter Archiver solicitará un inicio de sesión en una cuenta existente desde la cual trabajar. Eso es todo. Buscamos, analizamos, cargamos en una tabla de Excel y analizamos.

Por ejemplo, mostraremos a Twitter los parámetros de búsqueda más amplios posibles para mostrar cómo se verá la carga: En la salida, se puede hacer clic en una tabla con las siguientes columnas:




Fecha, Nombre de pantalla, Nombre completo, Texto de Tweet, ID de Tweet, Enlace (s), Medios, Ubicación, Retweets, Favoritos, Aplicación, Seguidores, Sigue, Listado, Verificado, Usuario desde, Ubicación, Bio, Sitio web, Zona horaria, Imagen de perfil . Desafortunadamente, todo esto no encaja en la captura de pantalla anterior, ya que ocupa dos pantallas.

Solo hay una debilidad en la herramienta presentada: la versión gratuita de Twitter Archiver le permite analizar solo una regla y solo una vez por hora. La versión paga funciona sin restricciones en el número de reglas de búsqueda y se carga una vez cada 15 minutos. Es cierto, no es barato: de $ 39 / año por usuario a $ 399 / año para un número ilimitado de cuentas.

Total


Es posible recopilar información en un modo semiautomático sin ninguna habilidad de programación, solo las consultas de búsqueda del propio Twitter y la aplicación Tweetdeck son suficientes. El bot para las tablas de Google simplifica la sistematización, pero una versión completa cuesta dinero.

Hay una forma más complicada, que no se relaciona con el tema del artículo como una solución simple, pero es necesario mencionarlo. Esta solución es obtener acceso a la API de Twitter a través de una solicitud oficial y luego crear sus propias herramientas. Sin embargo, la persona privada no tiene muchas oportunidades para esto: en foros especializados dicen que no todos dan acceso a la API y la tasa de rechazo es muy alta.

Pero, ¿qué sucede si desea proteger sus datos y no recopilarlos? ¿Cómo lidiar con el análisis de datos en Twitter? Sí, de hecho, nada. Esta es una red pública de microblogging en la que solo hay dos herramientas de protección de la información: listas negras de cuentas y restricción de acceso.

El primero, obviamente, no guardará bots y análisis. El segundo es más efectivo, pero luego los tweets estarán disponibles para ver solo a los suscriptores de la cuenta. Si estamos hablando de algún tipo de cuenta pública, entonces la segunda opción no es aplicable, además, un observador siempre puede colarse en la lista de lectores si el titular de la cuenta agrega manualmente nuevos seguidores.

Entonces, la única forma garantizada de reducir la probabilidad de fugas de OSINT a través de Twitter a un nivel aceptable es no usar Twitter.

All Articles