دمى الرسوم البيانية: دليل خطوة بخطوة

وفي وقت سابق، نشرنا آخر حيث، مع مساعدة من الرسوم البيانية، قمنا بتحليل المجتمعات في الغليان نقطة من مدن مختلفة من روسيا. الآن نريد أن نقول كيفية بناء مثل هذه الرسوم البيانية وتحليلها.



تحت الخفض - تعليمات خطوة بخطوة لأولئك الذين أرادوا منذ فترة طويلة التعامل مع تصور الرسوم البيانية وكانوا ينتظرون المناسبة المناسبة.


1. اختيار الفرضية


إذا حاولت تصور شيء على الأقل ، وتحميل البيانات بلا داعٍ إلى برنامج رسومي ، فلن تكون النتيجة مرضية لك. لذلك ، قم أولاً بصياغة ما تريد أن تعرفه بمساعدة الرسوم البيانية ، وابتكار فرضية قابلة للتطبيق.

للقيام بذلك ، اكتشف ما هي البيانات التي لديك بالفعل ، وما يمكن تمثيلها بـ "كائنات" ، وما هي "الروابط" بينها. عادة ما يكون هناك عدد أقل بكثير من الأشياء من الروابط - يمكنك التحقق من نفسك بهذه الطريقة.

أعددنا حالة الاختبار مع فريق نقطة الغليان من تومسك. وبناءً على ذلك ، سيكون لدينا جميع البيانات لتحليل الأحداث والمشاركين من هناك. تساءلنا عما إذا كان المجتمع قد تم تشكيله من المشاركين في هذه الأحداث وكيف بدا من وجهة نظر المشاركين من رجال الأعمال والجامعات والحكومة.

اقترحنا أن الأشخاص الذين حضروا نفس الحدث مرتبطون ببعضهم البعض. علاوة على ذلك ، كلما حضروا الأحداث معًا أكثر ، كلما كان الاتصال أقوى.
في الحالة الثانية ، قررنا معرفة كيفية ارتباط عضوية المشاركين في أحد "المجالات" (المجالات الرئيسية لدينا) بالتقنيات الشاملة التي تهمهم. هل التوزيع حتى؟ هل هناك أي مواضيع ساخنة؟ لهذا التحليل ، أخذنا بيانات عن المشاركين في الحدث من 200 شركة تكنولوجيا Tomsk.

من حيث المبدأ ، حتى هذه الصيغ الأولية للفرضيات كافية للمضي قدمًا إلى الخطوة الثانية.

2. إعداد البيانات


الآن بعد أن قررت ما تريد اكتشافه ، خذ مجموعة البيانات بالكامل ، واعرف ما هي المعلومات حول "الكائنات" المخزنة ، وتخلص من كل الفائض وأضف المعلومات المفقودة. إذا تم توزيع البيانات عبر عدة مصادر ، فقم أولاً بجمع كل شيء في كومة واحدة ، وإزالة التكرارات.

سأشرح بمثال. كانت لدينا بيانات عن المشاركين في 650 حدثًا. هذا ، نسبيًا ، 650 جدول Excel يحتوي على 23000 إدخال تقريبًا تحتوي على الحقول "معرف القائد" ، "الموضع" ، "التنظيم". لإنشاء رسم بياني ، يكفي معرف واحد فريد (لحسن الحظ ، هناك واحد هنا - هذا هو معرف القائد) وعلامة تربط كل مشارك بإحدى المجالات الثلاثة قيد النظر: الحكومة أو الأعمال أو الجامعات. وليس لدينا هذه المعلومات حتى الان.

للحصول عليها ، يمكنك المضي قدمًا: في كل ملف من 650 ملفًا ، أزل الأعمدة الإضافية وأضف حقلاً جديدًا ، واملأه بقيم لكل صف ، على سبيل المثال: "1" للسلطة ، "2" للأعمال و "3" للتعليم والعلوم. ويمكنك أولاً دمج جميع الملفات 650 في قائمة واحدة كبيرة ، وإزالة التكرارات ، ثم إضافة قيم جديدة فقط. في الحالة الأولى ، سيستغرق هذا العمل 1-2 أشهر. في الثانية - 1-2 أسابيع.

بشكل عام ، عند إضافة سمات جديدة ، حاول تجميع البيانات أولاً. على سبيل المثال ، يمكنك فرز المشاركين حسب الشركة / المؤسسة وتعيين السمة بشكل مجمّع.

نحن نعد البيانات أكثر. لتحميلها في معظم برامج التصور ، ستحتاج إلى إنشاء ملفين: أحدهما يحتوي على قائمة قمم ، والآخر بقائمة من الحواف.



احتوى ملف الرأس في حالتنا على عمودين: رقم - رقم القمة ونوع التسمية. احتوى ملف الحواف أيضًا على عمودين: المصدر - معرف الرأس الأولي ، الهدف - معرف الرأس النهائي.

كيفية تحويل البيانات التي حضرها المشاركون 1 و 2 و 5 و 23 إلى حدث واحد إلى أضلاع؟ من الضروري إنشاء ستة خطوط ووضع علامة على اتصال كل مشارك بكل منها: 1 و 2 و 1 و 5 و 1 و 23 و 2 و 5 و 2 و 23 و 5 و 23.

في المثال الثاني ، بدت الجداول



على النحو التالي : تم إدراج القمم كأسواق والتقنيات الشاملة. على سبيل المثال ، إذا حضر ممثل عن شركة تابعة لسوق Technet (ID = 4) حدثًا حول موضوع "Big Data and AI" (ID = 17) ، فإننا نضع في حافة الطاولة حافة (خط) تربط هذه القمم (المصدر = 4 ، الهدف = 17).

تعد مرحلة إعداد البيانات الجزء الأكثر استهلاكًا للوقت في العملية ، ولكن كن صبورًا.

3. التصور البياني


لذلك ، يتم إعداد جداول البيانات ، يمكنك البحث عن وسيلة لتمثيلها في شكل رسم بياني. للتصور ، استخدمنا برنامج Gephi - أداة قوية مفتوحة المصدر يمكنها معالجة الرسوم البيانية بمئات الآلاف من القمم والروابط. يمكنك تنزيله من الموقع الرسمي .

سآخذ لقطات شاشة من المشروع الثاني ، حيث كان هناك عدد قليل من القمم والروابط ، بحيث يكون كل شيء واضحًا قدر الإمكان.

بادئ ذي بدء ، نحن بحاجة إلى تحميل الجداول بالقمم والحواف. للقيام بذلك ، حدد عنصر "استيراد من CSV" من قائمة قسم "مختبر البيانات".



أولاً ، قم بتحميل الملف بالقمم. في الشاشة الأولى من النموذج ، أشر إلى أننا نستورد القمم ، وتحقق من أن البرنامج يحدد ترميز التوقيعات بشكل صحيح.



في النموذج الثالث ، "تقرير الاستيراد" ، من المهم الإشارة إلى نوع الرسم البياني. نحن لسنا موجهين.



وبالمثل ، قم بتحميل الأضلاع. في النافذة الأولى ، وضح أن هذا ملف ذو حواف ، وتحقق أيضًا من الترميز.



لحظة مهمة تنتظرنا في النافذة الثالثة "تقرير الاستيراد". هنا من المهم الإشارة ليس فقط إلى أن الرسم البياني غير موجه ، ولكن أيضًا تحميل الحواف في نفس مساحة العمل مثل القمم. لذلك ، حدد العنصر "إلحاق بمكان العمل الحالي".



ونتيجة لذلك ، سنرى الرسم البياني في هذا النموذج تقريبًا (علامة التبويب "المعالجة"):



لذلك ، تتميز الحواف بسماكات مختلفة اعتمادًا على عدد الاتصالات بين القمم. يمكنك معرفة مقدار الوزن الذي أصبحت عليه كل حافة في علامة التبويب Data Lab في خصائص الحواف في العمود Weight.

ما هو سيئ هنا: جميع القمم لها نفس الحجم وتقع بشكل عشوائي تمامًا. في علامة التبويب "معالجة" ، سنصلح ذلك. أولاً ، حدد العقد في النافذة اليسرى العلوية وانقر على الأيقونة ذات الدوائر ("الحجم"). بعد ذلك ، حدد عنصر الترتيب - يسمح لك بتعيين حجم الرأس ، اعتمادًا على بعض المعلمات. لدينا الفرصة لاختيار معلمة واحدة فقط - الدرجة (الدرجة) ، والتي توضح عدد الحواف التي تخرج من قمة الرأس. اختر الحد الأدنى والحد الأقصى لحجم الدائرة وانقر على زر "تطبيق". هنا ، إذا حددت رموزًا أخرى ، يمكنك ضبط لون علامة الرأس ولون الحواف. الآن الرسم البياني بالفعل أكثر مرئية.



الشيء التالي الذي يجب القيام به هو كشف الرسم البياني. يمكن القيام بذلك يدويًا ، أو تحريك القمم ، أو يمكنك استخدام خوارزميات التصميم التي يتم تنفيذها في Gephi.

ماذا نحقق مع التصميم المناسب؟ أقصى قدر من الرؤية. كلما كانت القمم والحواف أقل على الرسم البياني للتراكبات ، كلما قل تقاطع الحواف ، كان ذلك أفضل. سيكون من الجميل أيضًا إذا كانت القمم المتجاورة أقرب إلى بعضها البعض ، والقمم غير المتجاورة أبعد عن بعضها. حسنًا ، تم توزيع كل شيء على المنطقة المرئية ، ولم يتم ضغطه في كومة واحدة.

كيف نفعل ذلك في Gephi؟ تحتوي النافذة اليسرى السفلية "Stacking" (التراص) على خوارزميات التراص الأكثر شيوعًا القائمة على قياسات القوة. تخيل أن القمم عبارة عن كرات مشحونة تتنافر ، ولكن بعضها متماسك بواسطة شيء مشابه للينابيع. إذا قمت بتعيين القوى المناسبة و "تحرير" الرسم البياني ، ستتبدد القمم إلى أقصى مسافات تسمح بها الينابيع.

يتم توفير الصورة الأكثر تجانسًا من خلال خوارزمية Fruchterman و Reingold. حدد Fruchterman Reingold من القائمة المنسدلة وقم بتعيين حجم منطقة الرسم. انقر فوق الزر تنفيذ. سيظهر شيء مثل هذا:



يمكنك مساعدة الخوارزمية ، ودون إيقافها ، اسحب بعض القمم ، في محاولة لكشف الرسم البياني. ولكن تذكر أنه لا يوجد زر "إلغاء" ، فلن يكون من الممكن العودة إلى الموقع السابق للقمم. لذلك ، احتفظ بنسخ جديدة من المشروع قبل كل تغيير محفوف بالمخاطر.

خوارزمية أخرى مفيدة هي Force Atlas 2. وهي تقدم رسمًا بيانيًا على شكل حلقات معدنية متصلة بالينابيع. تعمل الينابيع المشوهة على تحريك النظام ، وتتأرجح وتتخذ موقفًا ثابتًا في النهاية. هذه الخوارزمية جيدة للمرئيات التي تؤكد على بنية المجموعة وتسلط الضوء على المجموعات الفرعية بدرجة عالية من التفاعل.

تحتوي هذه الخوارزمية على عدد كبير من الإعدادات. فكر في الأهم. يمنع "حظر التداخل" القمم من التداخل مع بعضها البعض. يزيد التباين من المسافة بين القمم ، مما يجعل الرسم البياني أكثر قابلية للقراءة. يتم أيضًا جعل الرسم البياني أكثر تهوية من خلال تقليل تأثير أوزان الأضلاع على المواضع النسبية للقمم.

بعد اللعب بالإعدادات نحصل على الرسم البياني التالي:



بعد تلقي الرسم البياني بالشكل الذي يناسبك ، انتقل إلى المعالجة النهائية. هذه هي علامة التبويب "عرض". يمكننا هنا تحديد ، على سبيل المثال ، رسم رسم بياني بحواف منحنية ، مما يقلل من تداخل القمم على الحواف الأخرى. يمكننا تمكين تسميات الذروة من خلال تعيين حجم الخط ولونه. أخيرًا ، قم بتغيير خلفية الركيزة. على سبيل المثال ، مثل هذا: من



أجل حفظ الصورة الناتجة ، انقر على النقش "تصدير SVG / PDF / PNG في الزاوية اليسرى السفلية من النافذة. أيضا ، لا تنس حفظ المشروع نفسه من خلال القائمة العلوية "ملف" - "حفظ المشروع".

في حالتنا ، كان من المهم تسليط الضوء على العلاقة بين التقنيات الشاملة وأسواق NTI ، والتي قمنا من أجلها يدويًا ببناء جميع الأسواق في سطر واحد في المركز ووضع كل شيء آخر فوق وتحت. والنتيجة هي مثل هذا الرسم البياني. ومع ذلك ، لا يمكن حل مشكلات معينة بدون المحاذاة اليدوية للقمم.



ربما تفكر كيف تمكنا من تلوين القمم بألوان مختلفة؟ هناك خدعة واحدة. يمكنك الانتقال إلى علامة التبويب "معمل البيانات" ، وإنشاء عمود جديد في الذروات هناك ، وتسميته "السوق". واملأ كل قمة بالقيم: 1 إذا كان سوق STI ، 0 إذا كانت تقنية شاملة. ثم انتقل فقط إلى "معالجة" ، حدد الرمز في شكل لوحة ، والعقد - التقسيم ، وكفاصل - سوق السمة الجديدة لدينا.



بالنسبة للإنشاءات الأكثر تعقيدًا ، عندما يكون مطلوبًا لتحديد العناقيد وطلائها بألوان مختلفة ، يستخدم Gephi ترسانة غنية من الحسابات الإحصائية ، والتي يمكن استخدام نتائجها للتلوين المنفصل. توجد هذه الحسابات في العمود الأيمن من علامة التبويب المعالجة.



على سبيل المثال ، بالنقر فوق الزر "تشغيل" بجوار حساب "الوحدات النمطية" ، سوف تجد تقديرًا لمستوى تجميع الرسم البياني الخاص بك. إذا قمت بعد ذلك بتعيين لون القمم اعتمادًا على فئة Modularity ، فستظهر صورة جميلة على النحو التالي:



إذا كنت ترغب في معرفة المزيد حول قدرات Gephi ، يجب عليك قراءة دليل العمل مع البرنامج من Martin Grangin http://www.martingrandjean.ch/gephi- مقدمة / .

4. تحليل النتيجة


لذا ، حصلت على التصور النهائي للرسم البياني. ماذا تعطيك؟ أولاً ، إنه جميل ، يمكن إدراجه في عرض تقديمي ، أو عرضه على أصدقائك أو إنشاء شاشة توقف على سطح المكتب. ثانيًا ، يمكنك من خلالها فهم مدى تعقيد بنية موضوع الموضوع التي تفكر فيها وتعدد مجموعاتها. ثالثًا ، انتبه إلى أكبر القمم والسمنة. هذه عناصر خاصة يرتكز عليها كل شيء.
لذا ، بعد أن أنشأنا رسمًا بيانيًا لمجتمع الخبراء الذي يحضر الأحداث في نقطة الغليان ، وجدنا على الفور مشاركين من المرجح أن يكونوا بمثابة موصلات فائقة. كانت "قمم" تم من خلالها توحيد الكتل في وحدة واحدة. وفي الحالة الثانية ، رأينا كيف يبدو تركيز المتخصصين من شركات Tomsk من منظور انتمائهم إلى السوق والتكنولوجيا الرقمية الشاملة التي يعتمدون عليها. هذا يشير بشكل غير مباشر إلى مستوى الكفاءات والخبرات التكنولوجية في المنطقة.

إن مساعدة الرسوم البيانية في فهم الواقع المحيط أمر رائع حقًا ، لذلك لا تكن كسولًا وحاول إنشاء تصور للبيانات الخاصة بك. إنها ليست صعبة على الإطلاق ، ولكنها تتطلب عمالة كثيفة في بعض الأحيان.

All Articles