आर और पाठ खनन तकनीकों का उपयोग करके रूसी रैप दृश्यों की तुलना। नॉइज़ मैक, ओक्सएक्सिमिरोन, अंकल झेन्या। कड़ी 2

आर। टेक्स्ट माइनिंग। रैप। कड़ी 2


यह लेख सामग्री की निरंतरता है “आर और पाठ खनन तकनीकों का उपयोग करते हुए रूसी रैप दृश्यों की तुलना। " शोर मैक और कस्ता बनाम फिरौन और मॉर्गेंसहर्ट" और अब मैं शोर सुश्री और ओक्सिमिरोन के काम का विस्तार से विश्लेषण करने की कोशिश करूंगा। हालांकि, मैं यह नोट करना चाहता हूं कि यह दोनों के बीच तुलना नहीं होगी। इस लेख का उद्देश्य यह नहीं दिखाना है कि उनमें से कौन सा कूलर अच्छा है, बल्कि उनके संगीत की गहराई और विविधता को व्यक्त करने के लिए, जिसे हमें वास्तविक समय में आनंद लेने का अवसर मिलता है। हम बहुत भाग्यशाली हैं कि हम उनकी सफलताओं का अनुसरण कर सकते हैं और उनके संगीत समारोहों में जा सकते हैं। इस सामग्री में पहले भाग की तरह कोई तुलना नहीं होगी, इतना मजबूत विपरीत नहीं होगा।

इस बार, आर, पायथन और जीनियस डॉट कॉम एपीआई का उपयोग करके विश्लेषण भी किया गया था। आप पहले भाग में अधिक पढ़ सकते हैं , क्योंकि मैं इसे दोहराना नहीं चाहता।

जो लोग नोइस सुश्री और ओक्सिमिरोन के काम से थोड़ा परिचित हैं, वे इस बात से सहमत होंगे कि निश्चित रूप से, इन कलाकारों द्वारा इस्तेमाल किए जाने वाले शब्द गीतों के विभिन्न विषयों के कारण बहुत भिन्न होंगे। उदाहरण के लिए, ऑक्सफोर्ड के एक स्नातक के कई गाने और मध्ययुगीन अंग्रेजी साहित्य में एक डिप्लोमा के एक धारक ओसेमिरोन के धर्म और इतिहास के कई संदर्भ हैं। उदाहरण के लिए, "आइवरी टॉवर" नामक एक ट्रैक। कुछ लोगों को पता है कि इस रूपक का उपयोग पहली बार बाइबिल के गीत "सोलोमन के गीत" में किया गया था : "आपकी गर्दन हाथी दांत के खंभे की तरह है" और संयोग से उच्च आकांक्षाओं का एक क्षेत्र है, जो दुनिया की हलचल और उसकी चिंताओं से दूर है। इसलिए, यह आश्चर्य की बात नहीं है कि उनके कई ग्रंथ धारणा और समझ के लिए मुश्किल लगते हैं, इतना कि वे डिकोडिंग में मदद करने के लिए उन्हें बदल देते हैंअनातोली वासरमैन

दूसरी ओर, शोर सुश्री अपने काम को व्यापक दर्शकों पर केंद्रित करती हैं, इसलिए उनके संगीत की भाषा समझने और बहुत बड़ी संख्या में लोगों के करीब है। इसके अलावा, इवान के कई गीतों (वास्तविक नाम शोर सुश्री) को "यहां और अभी" लिखा गया है और लेखन के समय वर्तमान घटनाओं के बारे में बताते हैं। उदाहरण के लिए, ट्रैक "मर्सिडीज S-666" एक दुर्घटना के मद्देनजर 2010 में लेनिनस्की प्रॉस्पेक्ट पर लिखा गया था , जब लुकोइल अनातोली बार्कोव के उपाध्यक्ष और दो महिलाओं, ओल्गा एलेक्जेंड्रिना और वेरा सेडेलनिकोवा, यातायात दुर्घटना में भाग ले रहे थे। उस दुर्घटना में मृत्यु हो गई। मॉस्को ट्रैफिक पुलिस ने घोषणा की कि अलेक्सांडीना और सेडेलनिकोवा को दोष देना है। प्रत्यक्षदर्शियों का दावा है कि यह मामला नहीं है।

पिछले लेख के साथ सादृश्य द्वारा शुरू करने के लिए, मैंने शोर सुश्री - 56 473 (157 गाने) के लिए और ऑक्सीमिरोन के लिए कुल शब्दों की गणना की - 16 540 (39 गाने)। ओक्सिमिरोन को उनके आधिकारिक एल्बम + मिक्सटेप नंबर 2 के विश्लेषण के लिए लिया गया था, पहला ऐसा जिसे उन्होंने बाहर करने का फैसला किया था, क्योंकि, लगभग सभी कार्यों में, ओक्सिमिरोन केवल एक कविता करता है।

स्टॉप शब्दों को हटाने के बाद अद्वितीय शब्दों की संख्या इस प्रकार है।

छवि

जैसा कि आप देख सकते हैं, शोर सुश्री और ओक्सिमिरोन अपने ग्रंथों में केवल 2209 सामान्य शब्दों का उपयोग करते हैं। प्रत्येक कलाकार की शब्दावली का 50% से अधिक अद्वितीय है, जो निस्संदेह उनके संपादकीय शैलियों में अंतर को इंगित करता है। मैं यह सुझाव देने के लिए उद्यम करूंगा कि ओक्सिमिरोन में अनूठे शब्दों की संख्या अधिक होगी यदि एल्बम और पटरियों की संख्या शोर से थोड़ी अधिक भी करीब थी। तुलना के लिए, लियो निकोलेयेविच टॉल्स्टॉय ने अपने काम "एना कारेनिना " में 253,311 में से 12,752 अद्वितीय शब्द हैं।

ताकि मैं आसानी से और स्पष्ट रूप से नॉइस सुश्री और ऑक्सीमिरोन के सबसे लोकप्रिय शब्दों को देख सकूं, मैंने उन्हें शब्द बादलों में देखा।

छवि

साथ ही साथ उनके लिए आम शब्द भी।

छवि

तब मेरे कुछ तार्किक सवाल थे। इस या उस कलाकार द्वारा कौन सा शब्द अधिक लोकप्रिय और यादगार माना जाता है? कौन से शब्द उसके काम को अधिक मजबूती से चित्रित करते हैं? वे जिन्हें उन्होंने अक्सर एक गीत में कहा था, लेकिन कम संख्या में, या जो उन्होंने उल्लेख किया था, मान लीजिए, एक बार, लेकिन अधिक पटरियों में।

असंदिग्ध निष्कर्ष बनाना बहुत मुश्किल है। दरअसल, पहले लेख के आधार पर, "टियर" शब्द जाति के बीच सबसे लोकप्रिय था, लेकिन जो लोग अपने काम से परिचित हैं, उन्होंने तुरंत संकेत दिया कि इस शब्द को इस बैंड के लिए परिभाषित करने वाले शब्दों में से एक कहना मुश्किल है, क्योंकि यह लगभग कई बार उच्चारित किया गया था। एक ट्रैक "टायरिम"। इसलिए, कोई भी कभी भी सबसे अधिक बार उल्लेखित शब्द के साथ एक ट्रैक को चालू नहीं कर सकता है, जबकि इसके विपरीत कोई व्यक्ति विशेष रूप से इस गीत के साथ कलाकार को जानता और संबद्ध करेगा। उदाहरण के लिए, मेरे लिए, जाति हमेशा "अराउंड द नॉइज़" गीत के शब्दों के साथ जुड़ी होगी ("सब कुछ नहीं उगलती")।

यदि हम एक शब्द लेते हैं जो अधिक पटरियों में उपयोग किया गया था, तो इस शब्द को सुनने और एक निश्चित कलाकार के काम के साथ जुड़ा होने की संभावना बहुत अधिक है।

जैसा कि मैंने पहले ही कहा था, दोनों दृष्टिकोणों को अस्तित्व और कमजोरियों का अस्तित्व रखने का अधिकार है, इसलिए, पाठकों को एक संपूर्ण चित्र प्रदान करने के लिए, मैंने नॉइस सुश्री और ऑक्सीमिरोन के ग्रंथों का दो तरीकों से विश्लेषण किया।

यह कैसे सबसे अधिक इस्तेमाल किए जाने वाले शब्दों का जूक्सपोजिशन है, जैसा कि नॉइस सुश्री और ओक्सिमिरोन में दिखता है। पहला अर्थ कलाकारों के बीच सबसे लोकप्रिय शब्द है, दूसरा वह शब्द है जो अधिक गीतों में वर्णित हैं। कोई रोक टोक नहीं।

छवि

छवि

यदि आप तालिकाओं में डेटा का सावधानीपूर्वक अध्ययन करते हैं, तो यह स्पष्ट हो जाता है कि अधिकांश शब्द सामान्य हैं और पाठ की शैली को प्रभावित नहीं करते हैं। हालांकि, ऐसे शब्द हैं जो सामान्य पृष्ठभूमि के खिलाफ खड़े हैं, और वे लेखक की शैली की विशिष्टता बनाते हैं।

यह समझने के लिए कि कैसे नॉइस सुश्री और ओक्सिमिरोन के ग्रंथ रूसी में लिखे गए अन्य कार्यों और ग्रंथों से भिन्न हैं, मैंने रूसी भाषा के राष्ट्रीय कोष से लिए गए समान आँकड़ों के साथ सबसे अधिक इस्तेमाल किए जाने वाले शब्दों (रोक शब्दों को हटाने से पहले) के लिए डेटा की तुलना की । इलेक्ट्रॉनिक रूप में रूसी ग्रंथों के संग्रह पर आधारित इस सूचना और संदर्भ प्रणाली में 50,000 से अधिक दस्तावेज शामिल हैं। रेटिंग संकलित करने के लिए, 192 689 044 शब्द रूपों का उपयोग किया गया था।

छवि

यह उम्मीद की जाती है कि सबसे लोकप्रिय शब्द पूर्वसर्ग, संयोजन, कण, सर्वनाम, आदि रहे हैं। हज़ारों अन्य कार्यों के साथ तुलना में, शोर सुश्री और ओक्सिमिरोन के पास भी इन शब्दों के उपयोग का लगभग समान प्रतिशत था।

ग्रंथों की समानता / भिन्नता का अधिक सटीक रूप से विश्लेषण करने के लिए, केवल व्यक्तिगत शब्दों और उनके उपयोग की आवृत्ति पर विचार करना ही पर्याप्त नहीं है, यह भी विचार करना महत्वपूर्ण है कि ये शब्द कौन से संयोजक बनाते हैं, तथाकथित बिग्रेड, 3-फ्रेम इत्यादि। आखिरकार, एक ही शब्दावली का उपयोग करके, आप उन वाक्यों और वाक्यांशों की रचना कर सकते हैं जो अर्थ में भिन्न हैं। विश्लेषण करने के बाद, जो संयोजक कुछ शब्द बनाते हैं, एक समानता या अंतर के बारे में अधिक आश्वस्त निष्कर्ष निकाल सकता है।

इस तरह से सबसे लोकप्रिय बीजाघर शोर में और ऑक्सीमायरन में दिखते हैं। मैंने फिर उनकी तुलना रूसी भाषा के कोष से की गई जानकारी से की।

छवि

और फिर से, जैसा कि शब्द रूपों की सामान्य तुलना के मामले में, कलाकारों और रूसी भाषा के कॉर्पस के बीच शब्दों के संयोजक बहुत समान हैं, लेकिन ऐसे प्रमुख तत्व हैं जो कलाकारों के विषयों और शैली को भेदते हैं।

मेरे लिए एक बहुत ही महत्वपूर्ण, विवादास्पद और विवादास्पद बिंदु लेखकों की शब्दावली की चौड़ाई और विविधता का निर्धारण था। शब्दों के अर्थ की व्याख्या और उनके विषय की परिभाषा के लिए शब्दकोशों की ओर रुख किए बिना यह कैसे करें? क्या रचनात्मकता की बहुमुखी प्रतिभा कार्यों में शब्दों की कुल संख्या निर्धारित करती है? या अद्वितीय शब्दों की संख्या की कुंजी है? पहले मामले में, आप बस सभी गीतों में समान शब्दों का उपयोग कर सकते हैं, और केवल संख्या ले सकते हैं। दूसरे में, कई अनूठे शब्दों का उपयोग एन-गानों की संख्या में किया जा सकता है, और फिर उसी शब्दों को फिर से जोड़ सकते हैं। जैसा कि आप देख सकते हैं, दोनों दृष्टिकोणों में कई आरक्षण हैं।

इसलिए, मैंने यह धारणा बनाई कि जिस आवृत्ति के साथ कलाकार अपने गीतों में अद्वितीय शब्दों का उपयोग करते हैं, वह हमें चौड़ाई के बारे में बता सकता है। कम गीतों में उपयोग किए जाने वाले अधिक अद्वितीय शब्द, अधिक आत्मविश्वास से कह सकते हैं कि विषय अलग हैं। या तो कलाकार समानार्थक शब्द का स्वामी है, और फिर विषय समान हैं, लेकिन शब्द अलग हैं, जो निस्संदेह अच्छा भी है, क्योंकि यह रूसी भाषा के ज्ञान की चौड़ाई दिखाता है।
नीचे एक तालिका है जो इंगित करती है कि कितने गीतों में कितने शब्दों का उपयोग किया गया था। उदाहरण के लिए, "दंड" शब्द का उपयोग केवल 1 गीत में किया गया था, लेकिन शायद कई बार। और अधिक शब्दों का उपयोग केवल एक काम में किया गया था - उच्चतर विशिष्टता। सुविधा के लिए, यह उपाय मेरे द्वारा कहा गया था - "शब्दों की विशिष्टता का सूचकांक"। उच्च मूल्य, अधिक अद्वितीय और विविध पाठ।

समझ की स्पष्टता के लिए, मैं तालिका से एक उदाहरण दूंगा: शोर सुश्री ने केवल एक ट्रैक में 5,451 अद्वितीय शब्दों का उपयोग किया (संभवतः कई बार), 1,467 अद्वितीय शब्दों का उपयोग उनके द्वारा दो कार्यों में किया गया था, आदि। उन्होंने 40 से अधिक पटरियों में 12 अद्वितीय शब्दों का उपयोग किया।

छवि

जैसा कि आप देख सकते हैं, दो कलाकारों के लिए समूहों में विशिष्टता का प्रतिशत लगभग समान है। सिर्फ नोइस मिस के 60% से अधिक और ऑक्सीमिरोन के 75% से अधिक अद्वितीय शब्दों का उपयोग केवल एक ट्रैक में किया गया था।

इन संकेतकों की तुलना करना दिलचस्प होगा, उदाहरण के लिए, पॉप संगीत के साथ, जहां विषय इतना व्यापक नहीं है, क्योंकि शुरू में रैप संगीत विरोध संगीत है। कलाकार अपने और समाज के लिए कठिन विषयों को उठाते हैं, उन्हें समझने की कोशिश करते हैं, या उनके तर्क को साझा करते हैं। पॉप संगीत को श्रोताओं के मनोरंजन और आराम करने के लिए डिज़ाइन किया गया है, यह आसान है।

लेकिन, मैं इस बात पर जोर देना चाहता हूं कि मैं किसी भी तरह से इस उदाहरण में पॉप के साथ रैप की तुलना नहीं कर सकता। मैं दो प्रतिभाशाली कलाकारों - शोर सुश्री और ओक्सिमिरोन के काम के विश्लेषण के परिणाम दिखाता हूं।
शब्दों के बारे में, उनकी संख्या और विशिष्टता पहले ही कहा जा चुका है, यदि लगभग सब कुछ नहीं, तो बहुत कुछ। लेकिन श्रव्य पाठ की धारणा को और क्या प्रभावित कर सकता है? रैप कलाकारों के मामले में, यह, निश्चित रूप से, बोले गए शब्दों की गति है। शब्दों के उच्चारण की गति और गुणवत्ता, ज़ाहिर है, पाठ की धारणा और समझ को प्रभावित करती है।

नीचे प्रति यूनिट समय (एक सेकंड) शब्दों के उच्चारण की गति है। आप शब्दों की सबसे बड़ी संख्या के साथ गाने के आंकड़ों से भी परिचित हो सकते हैं, साथ ही साथ "पढ़ने" की उच्चतम गति के साथ काम करते हैं।

छवि

शोर एमएस की औसत शब्द उच्चारण दर प्रति सेकंड 1.77 शब्द है। यह उम्मीद की जानी थी, क्योंकि शोर के कई गीतों में "पारंपरिक" गायन का एक तत्व है जो शब्द के उच्चारण के समय को लंबा करता है। और उनके गीतों की शैली शुद्ध रैप या हिप-हॉप नहीं है, बल्कि अधिक बार रॉक और रैप का मिश्रण है।

छवि

ऑक्सीमिरोन के पास अपने सहकर्मी की तुलना में प्रति सेकंड बोले जाने वाले शब्दों की औसत संख्या है - 2.55 शब्द प्रति सेकंड।

ट्रैक एक्सएक्सएक्स शॉप, सबसे अधिक संभावना है, इन आंकड़ों से बाहर रखा जाना चाहिए, क्योंकि इसमें अंग्रेजी में 2 छंद हैं और वे अन्य कलाकारों द्वारा किए गए हैं। हालांकि, हम उन्हें कलाकारों में विभाजित किए बिना पटरियों को एक पूरे के रूप में सुनते हैं। शोर सुश्री का भी बहुत सहयोग है।

विश्लेषण के आधार पर, हम सुरक्षित रूप से कुछ बातें कह सकते हैं। सबसे पहले, दोनों लेखक अपने काम में आत्मविश्वास से उन सभी धन का उपयोग करते हैं जो रूसी भाषा उन्हें प्रदान करती है। दूसरे, उनके गीतों को बनाने वाले अधिकांश शब्द आमतौर पर अन्य लेखकों के बीच उपयोग किए जाते हैं और लोकप्रिय होते हैं, हालांकि, कई शब्द रूप और बड़े अक्षर जो केवल उनकी विशेषता होते हैं, उन्हें प्रतिष्ठित किया जा सकता है। और तीसरा, शोर एमएस और ऑक्सिमिरोन का संगीत अलग है, दोनों शैली में, विषय और शब्दावली में, जो वे उपयोग करते हैं। और निश्चित रूप से, यह संगीत जो ध्यान देने योग्य है।

साथ ही, मुझे आशा है कि कलाकारों के ग्रंथों के विश्लेषण के प्रस्तुत तरीके आपके लिए उपयोगी और सुलभ प्रतीत होंगे। दरअसल, रैप सहित संगीत का विश्लेषण, साहित्यिक कार्यों के सामान्य विश्लेषण से अलग होना चाहिए। दूसरे मामले में, वाक्य की लंबाई, शब्दों में शब्दांशों की संख्या, वाक्यों में शब्दों की संख्या, संज्ञा / विशेषण / मोड़, आदि पर जोर दिया जाता है। मेरी राय में, रैप संगीत में इसका कोई मतलब नहीं है, क्योंकि पढ़ने के दौरान वाक्य एक पूरे में संयुक्त होते हैं। शब्दों का उच्चारण बड़ी तेजी के साथ किया जाता है, और यहाँ पर कम से कम बस यह ध्यान रखना ज़रूरी है कि कलाकार क्या पढ़ रहा है।

टिप्पणी करें, आलोचना करें। आखिरकार, अधिक समीक्षाएँ, अधिक तेज़ और अधिक कुशलता से हम संगीत कार्यों का विश्लेषण करने के प्रसिद्ध तरीकों को सुधारने में सक्षम होंगे।

बक्शीश चाचा जेन्या


चाचा झुनियाकुछ लोग उसके काम से परिचित हैं, लेकिन यह व्यक्ति अद्वितीय है और इस विशिष्टता को ग्रंथों में व्यक्त किया गया है। वे संरचना में जटिल हैं और अविश्वसनीय रूप से अर्थ और गहरी सामग्री से भरे हुए हैं। नीत्शे, कास्टानेडा का उल्लेख, पौराणिक कथाओं से चित्र, वर्डप्ले और रचना से परहेज। मैं हर किसी को उसके काम से परिचित होने की सलाह देता हूं।

उनके ग्रंथों की समीक्षा संक्षिप्त होगी, क्योंकि यह अनुरोध पर एक बोनस बनाया गया थाट्राउल। शब्दों से कर्मों तक।

मैं गीत के साथ चाचा झुनिया के 14 ट्रैक खोजने में कामयाब रहा। उनमें उन्होंने 10,064 शब्दों का इस्तेमाल किया, और 5,756 स्टॉप शब्दों को हटाने के बाद। अद्वितीय शब्दों की संख्या 2750 है। यहां एक शब्द क्लाउड सबसे लोकप्रिय की सूची से बना है।

छवि

बेशक, हिप-हॉप एक शब्द है, लेकिन जब ग्रंथों को संसाधित करते हैं, तो सभी शब्द रूपों को टोकन में विभाजित किया जाता है।

यह कैसे सबसे लोकप्रिय शब्द और ग्रंथों में सबसे अधिक बार इस्तेमाल किया जाता है।

छवि

दिलचस्प बात यह है कि कूल्हे का उपयोग एक बार हॉप की तुलना में अधिक किया गया था।

और इसलिए, चाचा जेन्या ने ग्रंथों में शब्दावली को नियंत्रित किया। उन्होंने केवल एक काम (संभवतः कई बार) में 2750 अद्वितीय शब्दों में से 72% का उपयोग किया। जो फिर से अपने काम में विभिन्न विषयों पर बात कर सकता है। सामान्य तौर पर, इसके संकेतक ऑक्सीमिरोन के समान होते हैं।

छवि

और अंत में, मैं सबसे अधिक शब्दों और उच्चतम पढ़ने की गति के साथ गाने दिखाना चाहता हूं।

छवि

चाचा जेन्या की गति ऑक्सीमिरोन से भी अधिक है।

समाप्त


All Articles