(Tidak) OSINT jelas di Twitter



Twitter sudah cukup tua, tetapi masih populer dengan khalayak luas layanan microblogging, yang secara aktif digunakan oleh pengguna biasa dan figur publik. Contoh terbaik adalah akun Twitter resmi politisi, penulis, musisi, dan aktor. Tentu saja, akun seperti itu sering dikelola oleh "orang-orang yang terlatih khusus," tetapi jika kita berbicara tentang OSINT di sektor manufaktur, maka memantau akun insinyur atau manajer biasa dapat memberikan hasil yang sangat baik.

Penting juga bahwa untuk bekerja secara efektif dengan berbagai data dari Twitter, Anda tidak perlu memproses setiap tweet secara manual, atau bergegas ke ekstrem lain - sambungkan ke API dan tulis sendiri perangkat lunak. Meskipun antarmuka standar layanan tidak memberikan hampir apa pun kepada kami dalam hal alat pencarian atau alat penyaringan, sementara Twitter mendukung sejumlah besar permintaan pencarian dan aturan, yang tidak benar-benar disebutkan dalam antarmuka web standar atau aplikasi. Dengan penggunaan pertanyaan ini maka layak untuk dimulai.

Twitter Dorks


Di Twitter, Anda dapat mencari informasi dengan empat parameter utama: menurut konten, dengan melengkapi informasi tweet, berdasarkan jenis media, dan menurut pengguna.

Yang dimaksud dengan "konten" adalah teks itu sendiri atau kata kunci dari tweet. Kategori ini mencakup kueri berikut:
Permintaan pencarianHasil Pencarian
watching nowBerisi "menonton" dan "sekarang"
"happy hour"Berisi frasa persis "happy hour"
love OR hateBerisi nilai "cinta" ATAU nilai "benci"
beer -rootMengandung "bir" tetapi tidak mengandung "root"
#haikuBerisi Hashtag Haiku
$twtrBerisi tag uang tunai, digunakan untuk pelacakan harga.
politics filter:safeTweet yang berisi "politik" akan dihapus sebagai konten yang tidak pantas
puppy url:twitterBerisi kata "puppy" dan URL di mana ada kombinasi "twitter" di bagian mana pun
traffic ?Mencari tweet dengan kata traffic dan tanda tanya

Kategori "informasi" termasuk kategori "konten" dan data seperti tanggal tweet, geolokasi, retweet, dan bahkan hal-hal rumit seperti penyaringan berdasarkan jumlah retweet, balasan, dan suka.

Permintaan pencarianHasil Pencarian
near:london within:15miArahkan geolokasi dengan jari-jari dalam mi (mil) atau km (kilometer)
superhero since:2015-12-21Berisi "superhero" dan dikirim lebih lambat dari tanggal yang ditentukan "2015-12-21" dalam format "tahun-bulan-hari"
#brexit until:2016-06-23Berisi "#brexit" dan dikirim sebelum tanggal yang ditentukan "2016-06-23" dalam format "tahun-bulan-hari"
puppy source:tweetdeckBerisi "puppy" dan dikirim menggunakan "tweetdeck" (opsi sumber lain: "twitter_for_iphone", "twitter_for_android" dan "twitter_web_client")
puppy min_retweets:5Berisi "anak anjing" dan memiliki minimal 5 retweet
puppy min_faves:10Berisi "anak anjing" dan memiliki setidaknya 10 suka
puppy min_replies:100Berisi anak anjing dan memiliki setidaknya 100 ulangan
puppy filter:nativeretweetsMemperlihatkan retweet yang berisi kata "puppy"
puppy filter:retweetsGaya penyaringan sekolah lama untuk retweet lama (RT) yang berisi kata "puppy"


Dalam kategori "media", Anda dapat memfilter tweet berdasarkan konten konten media, misalnya, hanya mencari tweet dari video atau foto, atau cukup menemukan semua posting yang berisi beberapa URL eksternal.

Permintaan pencarianHasil Pencarian
kitten filter:mediaBerisi "anak kucing" dan semua jenis media (gambar atau video)
kitten filter:native_videoBerisi "anak kucing" dan video tweeted, atau video dari Periscope

kitten filter:periscopeBerisi "anak kucing" dan tautan ke video dari Periscope
kitten filter:imagesBerisi "anak kucing" dan tautan apa pun yang didefinisikan sebagai gambar
kitten filter:twimgBerisi "anak kucing" dan gambar yang diunggah ke pic.twitter.com. Gambar bisa satu atau lebih
kitten filter:linksBerisi "anak kucing" dan URL apa pun

Dengan pemfilteran menurut "pengguna", semuanya kurang lebih jelas: serangkaian fungsi pencarian ini memungkinkan Anda untuk memfilter entri berdasarkan akun. Pada saat yang sama, kami dapat mengamati bukan tweet spesifik, tetapi, misalnya, hanya tanggapan dari objek pemantauan untuk pengguna tertentu .

Permintaan pencarianHasil Pencarian
from:jackTweet dikirim dari pengguna @jack
list:NASA/space-tweetsTweet dikirim dari akun NASA ke lembar "NASA / space-tweets"
to:NASAPutar ulang pengguna lain ke akun NASA
@NASACari tweet yang menyebutkan NASA
breaking filter:verifiedCari semua tweet dengan kata "break" di semua akun yang diverifikasi

Penting untuk dicatat bahwa untuk semua permintaan tipe "filter: type" di atas, aturan permintaan "eksklusif" berlaku melalui penggunaan simbol "-". Misalnya, untuk mendapatkan semua media dari NASA kecuali untuk gambar, Anda akan memasukkan kueri seperti "dari: filter NASA: media -filter: images".

Seluruh rangkaian perintah pencarian ini tampak seperti Tahun Baru di pertengahan musim panas, karena menghilangkan kebutuhan untuk penguraian dengan alat pihak ketiga, menghubungkan ke API dan trik dan kesulitan teknis lainnya yang melekat dalam pencarian dalam data publik.

Bahkan, Twitter sendiri memungkinkan kita untuk mengambil informasi apa pun yang kita minati, dan sesuai dengan berbagai parameter yang dapat kita gabungkan satu sama lain. Anehnya, semua permintaan pencarian yang dijelaskan jelas tidak didokumentasikan di mana pun. Artinya, Twitter memungkinkan Anda untuk mem-parsing dan menelusuri posting pengguna Anda secara halus, tetapi ini tidak berlaku secara khusus. Dan itu luar biasa - bahwa kami memiliki kesempatan seperti itu - karena sangat sering spesialis menderita dari efek "overqualification" dan mempersulit kehidupan mereka di mana mereka dapat menggunakan pisau Occam dan menemukan solusi yang paling jelas dan sekaligus paling tepat untuk tugas mereka.

Tweetdeck


Aplikasi terkenal untuk memfilter konten dengan parameter dan kategori yang diberikan adalah Tweetdeck . Namun, jika pengguna biasa melihat Tweetdeck hanya sebagai inkarnasi lain dari umpan RSS, maka dalam kasus pemfilteran data publik yang ditargetkan, itu menjadi alat yang sangat kuat.

Salah satu skenario paling jelas untuk menggunakan Tweetdeck dalam konteks OSINT adalah mengurangi tingkat kebisingan dalam sampel tweet yang berfungsi. Di luar kotak, layanan ini dapat membuat daftar hitam kata kunci dan tweet yang berisi mereka tidak akan muncul di aliran Anda. Jika Anda terlibat dalam OSINT dan mengumpulkan informasi dari sumber publik, maka fungsi tersebut memiliki aplikasi yang sangat jelas.

Mari kita ambil kasus bersyarat: akun Twitter Stephen King. Mereka yang menemukan akun penulis tahu bahwa itu terdiri dari 30% cinta untuk anjingnya, 60% kebencian terhadap Presiden Trump, dan 10% dari tweet akan menjatuhkan sisanya. Jika kami membutuhkan tepat 10% terakhir dari catatan, maka Tweetdeck akan memungkinkan Anda untuk menyaring sebagian besar sampah yang tidak menarik bagi kami dan bekerja dengan pilihan yang kurang lebih relevan. Mari kita lihat selembar rekaman King:



Kami akan menyaring pengaturan Tweetdeck untuk kata kunci "Trump", "presiden", "rumah putih", "Obama" untuk memotong sebagian besar "politota" dari sampel kami.



Sebenarnya, ini dilakukan secara elemen. Setelah muta tweet dengan kata kunci, akun yang kami amati telah sepenuhnya berubah:



Pada saat yang sama, Tweetdeck mendukung semua permintaan pencarian yang dibahas pada awal artikel, yang membuatnya menjadi alat yang nyaman untuk menemukan informasi.

Sekarang banyak dari Anda berpikir bahwa dengan kumpulan permintaan pencarian yang didukung, tetap hanya menulis perangkat lunak yang akan menarik tweet untuk Anda dan mengumpulkannya dalam laporan, misalnya, ke dalam dokumen teks, yang kemudian dapat dengan mudah dibolak-balik sambil menyeruput camar segar. Dan di sini sekali lagi prinsip "solusi paling sederhana - paling benar." Lagi pula, sebelum Anda duduk untuk menulis perangkat lunak, Anda harus membuka Google dan dia akan menjawab kami: Anda tidak perlu menulis apa pun, perangkat lunak tersebut sudah ada dan disebut Twitter Archiver.

Pengarsip Twitter


Twitter (Tweet) Archiver adalah ekstensi spreadsheet google yang mengumpulkan data dari pencarian Twitter kami dan mengunggah semuanya ke Google Documents. Aplikasi itu sendiri melekat pada add-on dari tabel Google dan memungkinkan Anda untuk mengunggah hasil pencarian langsung ke dokumen.



Pada saat pembuatan aturan pencarian pertama, Pengarsip Twitter akan meminta login ke akun yang ada untuk bekerja. Itu saja. Kami mencari, mengurai, mengunggah ke tabel Excel dan menganalisis.

Sebagai contoh, kami akan proksi Twitter dengan parameter pencarian seluas mungkin untuk menunjukkan bagaimana tampilan unggahan: Dapat Diklik Pada output, kami mendapatkan tabel dengan kolom berikut:




Tanggal, Nama Layar, Nama Lengkap, Teks Tweet, ID Tweet, Tautan, Media, Lokasi, Retweet, Favorit, Aplikasi, Pengikut, Mengikuti, Terdaftar, Diverifikasi, Pengguna Sejak, Lokasi, Bio, Situs Web, Zona Waktu, Gambar Profil . Sayangnya, semua ini tidak sesuai dengan tangkapan layar di atas, karena menempati dua layar.

Hanya ada satu kelemahan dalam alat yang disajikan: versi gratis Twitter Archiver memungkinkan Anda untuk mengurai hanya dengan satu aturan dan hanya sekali per jam. Versi berbayar berfungsi tanpa batasan pada jumlah aturan pencarian dan melakukan unggahan sekali setiap 15 menit. Benar, ini tidak murah: dari $ 39 / tahun per pengguna hingga $ 399 / tahun untuk jumlah akun yang tidak terbatas.

Total


Dimungkinkan untuk mengumpulkan informasi dalam mode semi-otomatis tanpa keterampilan pemrograman, cukup cari permintaan dari Twitter itu sendiri dan aplikasi Tweetdeck sudah cukup. Bot untuk tabel Google menyederhanakan sistematisasi, tetapi versi lengkapnya membutuhkan biaya.

Ada cara yang lebih rumit, yang tidak berhubungan dengan topik artikel sebagai solusi sederhana, tetapi yang perlu disebutkan. Solusi ini adalah untuk mendapatkan akses ke Twitter API melalui permintaan resmi dan kemudian membuat alat Anda sendiri. Namun, orang pribadi tidak memiliki terlalu banyak peluang untuk ini: di forum khusus mereka mengatakan bahwa tidak semua orang memberikan akses ke API dan tingkat penolakannya sangat tinggi.

Tetapi bagaimana jika Anda ingin melindungi data Anda, dan tidak mengumpulkannya? Bagaimana cara menangani analisis data di Twitter? Ya, sebenarnya, tidak ada apa-apa. Ini adalah jaringan microblogging publik di mana hanya ada dua alat perlindungan informasi: daftar hitam akun dan pembatasan akses.

Yang pertama, jelas, tidak akan menyimpan bot dan parsing. Yang kedua lebih efektif, tetapi kemudian tweet akan tersedia untuk dilihat hanya untuk pelanggan akun. Jika kita berbicara tentang beberapa jenis akun publik, maka opsi kedua tidak berlaku, ditambah, seorang pengamat selalu dapat menyelinap ke dalam daftar pembaca jika pemegang akun secara manual menambahkan pengikut baru.

Jadi satu-satunya cara dijamin untuk mengurangi kemungkinan kebocoran OSINT melalui Twitter ke tingkat yang dapat diterima adalah dengan tidak menggunakan Twitter.

All Articles