(不是)Twitter上明显的OSINT



Twitter很老,但仍然受到微博服务的广泛欢迎,普通用户和公众人士都积极使用它。最好的例子是政客,作家,音乐家和演员的官方Twitter帐户。当然,此类帐户通常由“经过特殊培训的人员”维护,但是如果我们在制造业中谈论OSINT,那么监视普通工程师或管理人员的帐户将获得出色的结果。

同样重要的是,要有效地处理来自Twitter的数据数组,不必手动处理每条推文,也不必急于处理另一条推文-连接到API并自己编写软件。尽管该服务的标准界面在搜索工具或过滤工具方面几乎不能为我们提供任何服务,但Twitter支持大量搜索查询和规则,而标准Web界面或应用程序中并未真正提及这些内容。正是使用这些查询才值得开始。

Twitter Dorks


在Twitter上,您可以通过四个关键参数来搜索信息:按内容,按完整的tweet信息,按媒体类型以及按用户。

“内容”是指文本本身或推文的关键字。此类别包括以下查询:
搜索查询搜索结果
watching now包含“观看”和“现在”
"happy hour"包含确切的短语“欢乐时光”
love OR hate包含值“ love”或值“ hate”
beer -root包含“啤酒”但不包含“根”
#haiku包含the句标签
$twtr包含现金标签,用于价格跟踪。
politics filter:safe包含“政治”的推文将被删除为不当内容
puppy url:twitter包含单词“ puppy”和URL,其中任何部分都包含“ twitter”的组合
traffic ?搜索带有单词traffic和问号的推文

类别“信息”既包括类别“内容”,又包括诸如推文的日期,地理位置,转发等数据,甚至包括诸如根据转发,回复和喜欢的数量进行过滤之类的复杂数据。

搜索查询搜索结果
near:london within:15mi点的地理位置,半径以mi(英里)或km(公里)为单位
superhero since:2015-12-21包含“超级英雄”,并以“ year-month-day”的格式晚于指定日期“ 2015-12-21”发送
#brexit until:2016-06-23包含“ #brexit”并在指定日期“ 2016-06-23”之前以“ year-month-day”格式发送
puppy source:tweetdeck包含“小狗”,并使用“ tweetdeck”发送(其他来源选项:“ twitter_for_iphone”,“ twitter_for_android”和“ twitter_web_client”)
puppy min_retweets:5包含“ puppy”,并且至少有5条转发
puppy min_faves:10包含“小狗”,并且至少有10个赞
puppy min_replies:100包含小狗,并且至少有100次重播
puppy filter:nativeretweets显示包含单词“ puppy”的转发
puppy filter:retweets包含“ puppy”一词的旧转发(RT)的旧过滤样式


在“媒体”类别中,您可以按媒体内容的内容过滤鸣叫,例如,仅搜索视频或照片中的鸣叫,或者仅查找包含某些外部URL的所有帖子。

搜索查询搜索结果
kitten filter:media包含“小猫”和任何类型的媒体(图像或视频)
kitten filter:native_video包含“小猫”和推特视频,或Periscope的视频

kitten filter:periscope包含“小猫”和指向Periscope视频的链接
kitten filter:images包含“小猫”和任何定义为图像的链接
kitten filter:twimg包含“小猫”和上传到pic.twitter.com的图像。图片可以是一个或多个
kitten filter:links包含“小猫”和任何URL

通过“用户”过滤,一切都差不多了:这组搜索功能使您可以按帐户过滤条目。同时,我们不能观察到特定的推文,而只能观察到监视对象对特定用户的响应

搜索查询搜索结果
from:jack用户发送的推文 @jack
list:NASA/space-tweets从NASA帐户发送到“ NASA /太空推特”工作表的推文
to:NASA重播其他用户到NASA帐户
@NASA搜索提及NASA的推文
breaking filter:verified在所有经过验证的帐户中搜索所有带有“ breaking”一词的推文

重要的是要注意,对于上述所有“过滤器:类型”类型的请求,“排他”请求的规则通过使用“-”符号是有效的。例如,要从NASA获取除图像以外的所有媒体,您将输入“ from:NASA filter:media -filter:images”之类的查询。

整个搜索命令集看起来像是夏天中期的新年,因为它消除了使用第三方工具进行解析,连接到API以及公共数据搜索中固有的其他技术技巧和困难的需求。

实际上,Twitter本身允许我们获取我们感兴趣的任何信息,并根据可以相互组合的相当广泛的参数进行获取。令人惊讶的是,所有描述的搜索查询显然都没有记录在任何地方。也就是说,Twitter允许您巧妙地解析和搜索用户的帖子,但这并不特别适用。而且,这真是太好了,因为我们有这样的机会,因为专家经常遭受“超额资格”的影响,并使他们的生活复杂化,他们可以使用Occam的剃须刀并找到最明显,同时又最正确的解决方案。

鸣叫甲板


Tweetdeck 是一个通过给定的参数和类别过滤内容的著名应用程序。但是,如果普通用户仅将Tweetdeck看作RSS提要的另一种形式,那么在对公共数据进行有针对性的过滤的情况下,它将成为功能非常强大的工具。

在OSINT上下文中使用Tweetdeck的最明显的方案之一是降低工作推文样本中的噪声水平。开箱即用,该服务能够创建关键字黑名单,包含这些关键字的推文不会出现在您的信息流中。如果您参与OSINT并从公共资源中收集信息,那么此功能将具有非常明显的用途。

让我们来看一个有条件的案例:Stephen King的Twitter帐户。那些遇到作者帐户的人都知道,这包括对狗的爱的30%,对特朗普总统的仇恨的60%,以及10%的推文将丢弃其余的。如果我们恰好需要记录的最后10%,那么Tweetdeck将完美地允许您过滤掉大部分我们不感兴趣的垃圾,并使用或多或少相关的选项。让我们看一下King的录像带:



我们将过滤掉Tweetdeck对“特朗普”,“总统”,“白宫”,“奥巴马”这些关键字的设置,以从样本中删除大部分“ politota”。



实际上,这是基本完成的。在使用关键字对Muta进行推文之后,我们观察到的帐户已完全更改:



同时,Tweetdeck支持本文开头讨论的所有搜索查询,这使其成为查找信息的便捷工具。

现在,您中的许多人都认为,有了这样一个受支持的搜索查询池,仅需编写能够为您提取推文并将其收集到报告(例如文本文档)中的软件,然后可以在懒惰的同时一边品尝新鲜的海鸥。这里又是“最简单的解决方案-最正确的解决方案”的原则。毕竟,在您坐下来编写软件之前,您应该打开Goog​​le,他会回答我们:您不需要编写任何东西,此类软件已经存在,称为Twitter Archiver。

Twitter存档


Twitter(Tweet)Archiver是Google电子表格扩展程序,可从Twitter收集有关搜索查询的数据并将其全部上传到Google文档。该应用程序本身紧贴Google表格的附件,并允许您将搜索结果直接上传到文档中。



在创建第一个搜索规则时,Twitter Archiver将请求登录到要使用的现有帐户。就这样。我们搜索,解析,上传到Excel表并进行分析。

例如,我们将使用最广泛的搜索参数进行鸣叫,以显示上传的效果:可点击 在输出中,我们获得带有以下各列的表格:




日期,屏幕名称,全名,推文,推文ID,链接,媒体,位置,转发,收藏夹,应用程序,关注者,关注,列出,已验证,用户自定义,位置,生物,网站,时区,配置文件图像不幸的是,所有这些都不适合上面的屏幕截图,因为它占据了两个屏幕。

所提供的工具只有一个弱点:免费版本的Twitter Archiver使您只能按一条规则进行解析,并且每小时只能解析一次。付费版本可以不受搜索规则数量的限制,每15分钟上传一次。没错,价格并不便宜:无限制帐户数量从每位用户每年39美元到每年399美元。


无需任何编程技能就可以半自动模式收集信息,仅从Twitter本身和Tweetdeck应用程序进行的搜索查询就足够了。 Google表格的漫游器简化了系统化过程,但完整版本需要花钱。

有一种更复杂的方法,它与作为简单解决方案的文章主题无关,但是有必要提及它。该解决方案是通过正式请求获得对Twitter API的访问权,然后创建自己的工具。但是,私人人士没有太多机会:在专门论坛上,他们说并不是每个人都可以使用该API,并且拒绝率非常高。

但是,如果您想保护数据而不收集数据怎么办?如何处理Twitter上的数据分析?是的,实际上什么也没有。这是一个公共微博网络,其中只有两种信息保护工具:帐户黑名单和访问限制。

显然,第一个不会保存机器人程序和解析程序。第二种方法更有效,但随后将仅向该帐户的订户提供推文。如果我们在谈论某种公共帐户,那么第二个选项不适用,此外,如果帐户持有者手动添加新的关注者,则观察者可以始终潜入读者列表。

因此,将通过Twitter进行OSINT泄漏的可能性降低到可接受水平的唯一保证方法是不使用Twitter。

All Articles