مقارنة بين مشاهد الراب الروسية باستخدام تقنيات التعدين R والنص. Noize Mc، Oxxxymiron، Uncle Zhenya. الحلقة 2

R. تعدين النص. موسيقى الراب. الحلقة 2


هذه المقالة هي استمرار لمادة "مقارنة بين مشاهد الراب الروسية باستخدام تقنيات التعدين R والنص. "Noize Mc and Kasta vs Pharaoh and Morgenshtern" والآن سأحاول تحليل عمل Noise Ms و Oksimiron بالتفصيل. ومع ذلك ، أود أن أشير إلى أن هذا لن يكون مقارنة بين الاثنين. الغرض من هذه المقالة ليس إظهار أي منها أكثر برودة ، ولكن نقل عمق وتنوع موسيقاهم ، التي لدينا الفرصة للاستمتاع بها في الوقت الحقيقي. نحن محظوظون جدًا لأننا نستطيع متابعة نجاحاتهم والذهاب إلى حفلاتهم. في هذه المادة لن تكون هناك مقارنة كما في الجزء الأول ، لن يكون هناك مثل هذا التباين القوي.

هذه المرة ، تم إجراء التحليل أيضًا باستخدام R و Python و Genius.com API. يمكنك قراءة المزيد في الجزء الأول ، لأنني لا أريد تكرار ذلك.

أولئك الذين هم على دراية بسيطة بعمل Noise Ms و Oksimiron سيوافقون على أن الكلمات التي يستخدمها هؤلاء الفنانون ستكون مختلفة تمامًا بسبب الموضوعات المختلفة للأغاني. على سبيل المثال ، العديد من أغاني خريجي أكسفورد ودبلوم Oksimiron في الأدب الإنجليزي في العصور الوسطى لها العديد من الإشارات إلى الدين والتاريخ. على سبيل المثال ، مسار يسمى "برج العاج". قلة من الناس يعرفون أن هذا التشبيه استخدم لأول مرة في أغنية الكتاب المقدس "بأغنية سليمان": "عنقك مثل عمود من العاج" ويعني بشكل مجازي منطقة ذات تطلعات عالية ، بعيدة عن صخب العالم ومخاوفه. لذلك ، ليس من المستغرب أن العديد من نصوصه تبدو صعبة الإدراك والفهم ، لدرجة أن المساعدة في فك الترميز تتحول إلىاناتولي واسرمان .

من ناحية أخرى ، تركز Noise Ms عمله على جمهور أوسع ، لذا فإن لغة موسيقاه مفهومة وقريبة من عدد كبير جدًا من الناس. أيضًا ، العديد من كلمات Ivan (الاسم الحقيقي Noise Ms) مكتوبة "هنا والآن" وتخبر عن الأحداث الجارية في وقت كتابة هذا التقرير. على سبيل المثال، كان المسار "مرسيدس S-666" مكتوبة في أعقاب وقوع حادث الذي وقع في ينينسكي بروسبكت في عام 2010، عندما نائب رئيس شركة لوك أويل اناتولي Barkov وامرأتين، أولغا الإسكندرية وفيرا Sedelnikova، أصبح المشاركون في حادث مروري. مات في هذا الحادث. تعلن شرطة المرور في موسكو أن أليكساندرينا وسيدلنيكوفا هي المسؤولة. يدعي شهود عيان أن الأمر ليس كذلك.

بادئ ذي بدء ، عن طريق القياس مع المقالة السابقة ، قمت بحساب العدد الإجمالي للكلمات لـ Noise Ms - 56473 (157 أغنية) و Oxymiron - 16540 (39 أغنية). تم أخذ Oksimiron للتحليل 2 من ألبومه الرسمي + Mikstape رقم 2 ، قرر الأول استبعاده ، لأنه في جميع الأعمال تقريبًا ، ينفذ Oksimiron آية واحدة فقط.

هذه هي الطريقة التي يبدو بها عدد الكلمات الفريدة بعد حذف كلمات التوقف.

صورة

كما ترى ، تستخدم Noise Ms و Oksimiron فقط 2209 كلمة شائعة في نصوصهما. أكثر من 50 ٪ من مفردات كل فنان هي فريدة من نوعها ، مما يشير بلا شك إلى الاختلاف في أساليبهم التأليفية. أود أن أجرؤ على اقتراح أن عدد الكلمات الفريدة في Oksimiron سيكون أعلى حتى إذا كان عدد الألبومات والمقطوعات أقرب قليلاً إلى الضوضاء. على سبيل المقارنة ، يحتوي Leo Nikolayevich Tolstoy في عمله "Anna Karenina" على 12،752 كلمة فريدة من أصل 253،311.

حتى أتمكن من رؤية الكلمات الأكثر شيوعًا بسهولة من Noise Ms و Oxymiron ، جمعتها في سحب الكلمات.

صورة

وكذلك الكلمات المشتركة بينهما.

صورة

ثم كان لدي بعض الأسئلة المنطقية. أي كلمة تعتبر أكثر شهرة وتذكرًا من قبل هذا الفنان أو ذاك؟ ما الكلمات التي تميز عمله بقوة أكبر؟ تلك التي قالها في كثير من الأحيان في أغنية واحدة ، ولكن بأعداد أقل ، أو تلك التي ذكرها ، افترض ، مرة واحدة ، ولكن في المزيد من المسارات.

من الصعب للغاية التوصل إلى نتيجة لا لبس فيها. في الواقع ، استنادًا إلى المقالة الأولى ، كانت كلمة "tyr" هي الأكثر شيوعًا بين Caste ، ولكن أولئك الذين هم على دراية بعملهم أشاروا على الفور إلى أنه من الصعب تسمية هذه الكلمة بأنها واحدة من الكلمات المحددة لهذه الفرقة ، حيث قيلت في جميع الأوقات تقريبًا مسار واحد "Tyrim". لذلك ، قد لا يقوم شخص ما بتشغيل المسار بأكثر الكلمات المذكورة كثيرًا ، ولكن شخصًا ما على العكس سيعرف الفنان ويربطه بهذه الأغنية حصريًا. على سبيل المثال ، بالنسبة لي ، سيتم ربط Caste دائمًا بكلمات أغنية "Around the Noise" ("لا تغلي كل شيء nishtyak").

إذا أخذنا كلمة تم استخدامها في المزيد من المسارات ، فإن احتمال سماع هذه الكلمة وربطها بعمل فنان معين أعلى بكثير.

كما سبق أن قلت ، فإن كلا النهجين لهما الحق في الوجود ولديهما نقاط قوة ونقاط ضعف ، لذلك ، من أجل تزويد القراء بصورة كاملة ، قمت بتحليل نصوص Noise Ms و Oxymiron بطريقتين.

هذه هي الطريقة التي يبدو بها تجاور الكلمات الأكثر استخدامًا في Noise Ms و Oksimiron. المعنى الأول هو الكلمات الأكثر شعبية بين الفنانين ، والثاني هو الكلمات المذكورة في المزيد من الأغاني. لا توجد كلمات توقف.

صورة

صورة

إذا كنت تدرس بعناية البيانات في الجداول ، يصبح من الواضح أن معظم الكلمات شائعة ولا تؤثر على نمط النص. ومع ذلك ، هناك كلمات تبرز على الخلفية العامة ، وهي تخلق تفرد أسلوب المؤلف.

لفهم كيف تختلف نصوص Noise Ms و Oksimiron عن الأعمال والنصوص الأخرى المكتوبة باللغة الروسية ، قارنت البيانات الخاصة بالكلمات الأكثر استخدامًا (قبل حذف كلمات التوقف) مع نفس الإحصائيات المأخوذة من المجموعة الوطنية للغة الروسية . يحتوي نظام المعلومات والمراجع هذا ، القائم على مجموعة من النصوص الروسية في شكل إلكتروني ، على أكثر من 50000 وثيقة. لتجميع التصنيف ، تم استخدام 192198434 أشكال الكلمات.

صورة

من المتوقع أن تكون الكلمات الأكثر شيوعًا هي حروف الجر ، والعطف ، والجسيمات ، والضمائر ، وما إلى ذلك. بالمقارنة مع عشرات الآلاف من الأعمال الأخرى ، كان لدى Noise Ms و Oksimiron نفس النسبة المئوية تقريبًا لاستخدام هذه الكلمات.

من أجل تحليل التشابه / الاختلاف بين النصوص بشكل أكثر دقة ، لا يكفي التفكير في الكلمات الفردية فقط وتكرار استخدامها ، ومن المهم أيضًا التفكير في أي الروابط التي تشكلها هذه الكلمات ، وما يسمى بـ bigrams ، و 3-Frames ، إلخ. بعد كل شيء ، باستخدام نفس المفردات ، يمكنك تأليف جمل وعبارات مختلفة في المعنى. بعد تحليل الروابط التي تتكون منها كلمات معينة ، يمكن للمرء أن يخلص إلى نتيجة أكثر ثقة بشأن التشابه أو الاختلاف.

هذه هي الطريقة التي تظهر بها أكبر العروض الدرامية الكبيرة في الضوضاء وفي الأوكسيميرون. قارنتهم مرة أخرى بمعلومات من مجموعة اللغة الروسية.

صورة

ومرة أخرى ، كما هو الحال مع المقارنة المعتادة لأشكال الكلمات ، فإن روابط الكلمات بين الفنانين وجسم اللغة الروسية متشابهة جدًا ، ولكن هناك عناصر بارزة تميز مواضيع وأسلوب الفنانين.

بالنسبة لي ، كانت نقطة مهمة للغاية ومثيرة للجدل ومثيرة للجدل هي تحديد اتساع وتنوع مفردات المؤلفين. كيف يتم ذلك دون اللجوء للقواميس لتفسير معاني الكلمات وتعريف موضوعها؟ هل تحدد براعة الإبداع العدد الإجمالي للكلمات في الأعمال؟ أم هو مفتاح عدد الكلمات الفريدة؟ في الحالة الأولى ، يمكنك ببساطة استخدام نفس الكلمات في جميع الأغاني ، وأخذ الرقم فقط. في الثانية ، يمكن استخدام العديد من الكلمات الفريدة في عدد n من الأغاني ، ثم مرة أخرى معالجة نفس الكلمات. كما ترون ، فإن كلا النهجين لهما العديد من التحفظات.

لذلك ، افترضت أن تكرار استخدام الفنانين لكلمات فريدة في أغانيهم يمكن أن يخبرنا عن الاتساع. كلما زادت الكلمات الفريدة المستخدمة في عدد أقل من الأغاني ، أصبح بإمكان المرء القول بثقة أكبر أن الموضوعات مختلفة. إما أن المؤدي هو سيد المرادفات ، ثم الموضوعات هي نفسها ، لكن الكلمات مختلفة ، وهي أيضًا بلا شك جيدة ، لأنها تظهر اتساع معرفة اللغة الروسية.
يوجد أدناه جدول يوضح عدد الكلمات التي تم استخدامها في عدد الأغاني. على سبيل المثال ، تم استخدام كلمة "punks" في أغنية واحدة فقط ، ولكن ربما عدة مرات. وكلما استخدمت كلمات أكثر في عمل واحد - كلما زاد التفرد. من أجل الراحة ، تم استدعاء هذا المقياس من قبلي - "فهرس تفرد الكلمات". كلما زادت القيمة ، كلما كان النص فريدًا ومتنوعًا.

لتوضيح الفهم ، سأعطي مثالًا من الجدول: استخدمت Noise Ms 5،451 كلمة فريدة في مسار واحد فقط (ربما عدة مرات) ، وقد استخدمه 1،467 كلمة فريدة في عملين ، إلخ. استخدم 12 كلمة فريدة في أكثر من 40 مسارًا.

صورة

كما ترى ، فإن نسبة التفرد في المجموعات هي نفسها تقريبًا لفنانين. تم استخدام ما يزيد قليلاً عن 60٪ من Noise Ms وما يصل إلى 75٪ من الكلمات الفريدة لـ Oxymiron في مسار واحد فقط.

سيكون من المثير للاهتمام مقارنة هذه المؤشرات ، على سبيل المثال ، مع موسيقى البوب ​​، حيث لا يكون الموضوع واسعًا جدًا ، لأن موسيقى الراب في البداية هي موسيقى احتجاجية. يثير المؤدون مواضيع صعبة لأنفسهم وللمجتمع ، أو يحاولون فهمها ، أو مشاركة منطقهم. موسيقى البوب ​​مصممة أكثر للترفيه عن المستمعين وإرخائهم ، فهي أسهل.

ولكن ، أريد أن أؤكد أنني لا أقارن بأي حال من الأحوال موسيقى الراب مع موسيقى البوب ​​في هذا المثال. أعرض نتائج تحليل عمل فنانين موهوبين - Noise Ms و Oksimiron.
حول الكلمات ، قيل عددهم وتفردهم بالفعل ، إن لم يكن كل شيء تقريبًا ، ثم الكثير. ولكن ماذا يمكن أن يؤثر على إدراك النص المسموع؟ في حالة فناني الراب ، هذه بالطبع سرعة الكلمات المنطوقة. تؤثر سرعة وجودة نطق الكلمات بالطبع على إدراك النص وفهمه.

فيما يلي سرعة نطق الكلمات لكل وحدة زمنية (ثانية واحدة). يمكنك أيضًا التعرف على إحصائيات الأغاني التي تحتوي على أكبر عدد من الكلمات ، بالإضافة إلى الأعمال التي تتميز بأعلى سرعة في "القراءة".

صورة

Noise Ms يبلغ معدل نطق الكلمات في المتوسط ​​1.77 كلمة في الثانية. كان هذا متوقعًا ، نظرًا لأن العديد من أغاني Noise تحتوي على عنصر الغناء "التقليدي" الذي يطيل من وقت نطق الكلمة. وأسلوب أغانيه ليس مجرد موسيقى الراب أو الهيب هوب ، بل غالبًا ما يكون مزيجًا من موسيقى الروك والراب.

صورة

لدى Oxymiron متوسط ​​عدد الكلمات المنطوقة في الثانية أعلى من زميله - 2.55 كلمة في الثانية.

على الأرجح ، يجب استبعاد المسار XXX Shop من هذه الإحصائيات ، لأنه يحتوي على آيتين باللغة الإنجليزية ويتم تأديتها من قبل فنانين آخرين. ومع ذلك ، فإننا نستمع إلى المسارات ككل ، دون تقسيمها إلى فنانين. Noise السيدة لديها الكثير من التعاون.

استنادًا إلى التحليل ، يمكننا أن نقول بعض الأشياء بأمان. أولاً ، يستخدم المؤلفان في عملهما بكل ثقة جميع الثروات التي توفرها لهم اللغة الروسية. ثانيًا ، معظم الكلمات التي تشكل أغانيها مستخدمة بشكل شائع وشائع بين المؤلفين الآخرين ، ومع ذلك ، يمكن تمييز العديد من أشكال الكلمات والأرقام الكبيرة التي تتميز بها فقط. وثالثًا ، تختلف موسيقى Noise MS و Oxymiron ، من حيث الأسلوب والموضوع والمفردات التي يستخدمونها. وبالتأكيد هذه الموسيقى تستحق الاهتمام.

آمل أيضًا أن تبدو الأساليب المقدمة لتحليل نصوص فناني الأداء مفيدة ومتاحة لك. في الواقع ، يجب أن يختلف تحليل الموسيقى ، بما في ذلك موسيقى الراب ، عن التحليل المعتاد للأعمال الأدبية. في الحالة الثانية ، يتم التركيز على طول الجمل ، عدد المقاطع في الكلمات ، عدد الكلمات في الجمل ، عدد الأسماء / الصفات / المنعطفات ، إلخ. في رأيي ، في موسيقى الراب هذا لا معنى له ، حيث يتم دمج الجمل في وحدة واحدة أثناء القراءة. يتم نطق الكلمات بسرعة كبيرة ، وهنا من المهم على الأقل تتبع ما يقرأه المؤدي.

تعليق وانتقاد. بعد كل شيء ، كلما زاد عدد المراجعات ، زادت سرعة وكفاءة القدرة على تحسين الأساليب المعروفة لتحليل الأعمال الموسيقية.

علاوة العم جينيا


العم Zhenya . قليل من الناس على دراية بعمله ، لكن هذا الشخص فريد ويتم التعبير عن هذا التفرد في النصوص. فهي معقدة في هيكلها ومليئة بشكل لا يصدق بالمعنى والمحتوى العميق. ذكر نيتشه ، Castaneda ، صور من الأساطير ، والتلاعب بالألفاظ ، والتوقف عن التركيب. أنصح الجميع بالتعرف قليلاً على عمله.

ستكون مراجعة نصوصه قصيرة ، حيث تم منحها مكافأة بناء على طلبجر. من الأقوال إلى الأفعال.

تمكنت من العثور على 14 مقطوعة من العم Zhenya مع كلمات. استخدم فيها 10.064 كلمة ، و 5756 بعد إزالة كلمات التوقف. عدد الكلمات الفريدة هو 2750. هنا سحابة كلمات تتكون من قائمة الأكثر شعبية.

صورة

بالطبع ، الهيب هوب هي كلمة واحدة ، ولكن عند معالجة النصوص ، يتم تقسيم جميع أشكال الكلمات إلى رموز مميزة.

هذه هي الطريقة التي تبدو بها الكلمات الأكثر شيوعًا والأكثر استخدامًا في النصوص.

صورة

ومن المثير للاهتمام ، تم استخدام الورك أكثر من القفزة.

وهكذا ، سيطر العم Zhenya على المفردات في النصوص. استخدم 72٪ من 2750 كلمة فريدة في عمل واحد فقط (ربما عدة مرات). والتي يمكن أن تتحدث مرة أخرى عن مواضيع مختلفة في عمله. بشكل عام ، مؤشراته تشبه إلى حد كبير مؤشرات Oxymiron.

صورة

وأخيرًا ، أريد أن أعرض الأغاني بأكبر عدد من الكلمات وأعلى سرعة قراءة.

صورة

سرعة العم Zhenya أعلى من سرعة Oxymiron.

النهاية


All Articles