实验:如何学习创建流行的英语文本(以及为什么说英语的哈伯族人读得这么少)



多年来,我一直从事市场营销,撰写文字,而我喜欢英语并在工作中使用它。整个俄语互联网上,关于内容营销和业务推广的文章很少。而那些通常只是告诉如何分析任何特定错误的方法。

我认为有必要比较以英语为母语的人创作内容的方式,并且当我们用英语写作时我们会保持不消闲。这是我的实验结果。

注意:小型研究方法不是特别科学,但在我看来是实用的。对我来说,结果似乎很有趣且有用,但不要认为它们是最终的真理。

简介:我们将分析什么


首先,我需要找到一种方法来在一个地方收集原本说俄语的作者的英语文章,这些文章在我们的网络细分中“熟”,但希望将其内容带给国际受众。我在枢纽上找到了这样的俄语-英语内容集合

哈伯(Habr)是一种流行的资源,在过去的一两年中,它宣布了转变为国际资源的目标。这里出现了英文版,可以用英文进行讨论。问题在于,到目前为止,说俄语的用户用英语编写的内容似乎并没有吸引外国人。

同一作者用俄语和英语撰写的文章成功与否有很大不同。为了理解为什么会这样,我决定从评估他们创建什么样的内容开始。

方法


我不认为自己是一个足够高水平的专家,无法独自评估它,并且没有熟悉的媒体编辑人员可以免费帮助您。因此,我将使用三种文本评估和错误纠正工具。它们是语法LinguixProWritingAid。我积极使用前两个(我为两个订阅付费-Grammarly具有出色的Web编辑器,而Linguix具有更快的浏览器扩展-他们现在在ProductHunt 上进行讨论),ProWritingAid遇到了几条评论,并决定将其作为“第三条意见”。

所有这些工具都属于写作辅助软件的类别,即,它们可以发现英文文本中的错误,提供纠正它们的方法,并帮助评估所生成文本的“可读性”。

我们想要确认或反驳的假设-俄语作者的英语文本很难读懂,因为:

  • 他们的英语知识水平不够好;
  • 他们写得太刻苦,而承运人则喜欢轻盈;
  • 整个文本的格式不是外国读者喜欢的格式。

我们将看:

  • 文章长度
  • 每个字的错误数,
  • 可读性指标。

为了清楚起见,我们将讲英语的Habr上收视率最高的文章与进入Hacker News网站首页的热门文章进行比较-Hacker News网站是有关创业公司和技术的美国最佳网站。

好,就是这样,走吧!

英语水平:Runet作者与外国人


为了进行分析,我选择了Habr的10篇文章。其中包括本年度最佳清单,当月最佳清单,公司博客以及私人作者的最新帖子。文本的总容量为22437个单词。

  • 在此语法卷中,仅发现986个错误,即大约每23个单词错误一次
  • Linguix显示了相似的结果-933错误,即每24个单词错误一次
  • ProWritingAid – , , , 88 100 , 50. , , , Grammarly Linguix 160 , PWA 350. 1343 . 16 . , .



智力助手在俄语作者的英语文章中发现的错误,

但是我们将这些指标与软件在评估外国作者的内容时所展示的内容进行比较。

英文出版物量达到22 631字。对于此卷,语法检查出617个错误(1个错误为36个单词),Linguix发现421个错误(53个单词为错误),PWA发现542个错误(41个单词为错误)-但是这里还是有异常。
总的来说,结果是雄辩的-每20-25个单词用英语书写的小名作家有一个错误,而对于外国作者来说,语法检查软件会每30-40个单词生成一次建议(即这些不一定是严重错误) 。

文字的“可读性”


显然,以母语为母语的人在上面书写的错误更少。但是,如果这篇文章很有趣,即使有错误也应该很好地阅读,但是我们选择的帖子中并未观察到这一点。这意味着它不仅会影响每个单词的错误数量,还会影响其他方面。

在英语中,存在可读性的概念-即要感知的文本的复杂性。这些级别通常与教育水平相关联,例如,“文本太复杂,只有受过大学教育的人才能理解它”,反之亦然,“文本太简单,以至于接受8类教育的人都容易理解。”

良好的可读性指标被认为是60-70分-在这种情况下,该文字将能够轻松地理解大约80%的以英语为母语的人。 Grammarly和Linguix在其编辑器中免费提供了可读性数据以及其他统计信息,而ProWritingAid仅免费分析了前500个单词的可读性。因此,在这一部分中,我们将获得来自两个服务的数据,而我已经可以使用这些服务。

对于根据Grammarly讲俄语的英语作者的材料,平均可读性为55.5。 Linguix的平均得分是57.3。通常,两种服务都提供几乎相同的可读性评级,相差不超过两点。如您所见,我们的作者(以及维护公司博客的作者)的材料未达到所需的60分可读性。



外国作者的内容情况如何?语法上此类文章平均可读性得分为77.8Linguix-75.4。同样,两种服务之间的差距很小。在我们和非我们的作者之间还有很多。
另一个结论是,对我们而言,编写可访问的文本更加困难。这是非携带者的常见“疾病”-我想更认真地“结束”文本,因此很难阅读。

文字长度


在此实验中,我们回顾了私人和公司作者的博客文章。在此类别内,各种出版物格式都是可能的。

国内作者经常出版相当长的材料-十篇文章中包含22,437个单词。即,平均体积为2243.7

为了收集相似数量的材料(22,631个单词)来分析英语内容,需要13篇文章。教材的平均数量约为1740个单词
也就是说,外国作者撰写的文章简短,他们的听众习惯了阅读这种特殊格式的文本。

这是什么意思呢


根据我的研究结果,尽管很肤浅,不是特别科学,而是实用的分析,但我们可以这样说:

如果您想被外国人阅读,请以外国人的身份写作!

实际上,这意味着三件事:

  1. 阅读您的文章雇用纠正者,如果没有,请使用自动验证服务(或此类服务的组合)。
  2. 尝试使文本尽可能简单阅读更多英语博客文章以学习风格。一段时间后,您会更容易在文本中找到不必要的复杂结构。
  3. 写得短些英文内容的消费者不太喜欢篇幅较长的文章-有关此主题的研究很多。因此,为了获得更大的效果,无论出于任何原因都值得放弃长读。

今天就这样,谢谢收看!我很高兴在评论中回答问题。

All Articles