遗传密码分析II


插图melmagazine.com(来源

当前,具有不受入侵者保护的通道的公共网络已广泛用于信息交换。可以在此处阅读如何组织保护

在消息中,发件人保护消息的完整性,机密性和可用性为此使用了密码学,密码学,学等 理论的结果

在当前的工作中,我们继续只考虑一个特定的问题-消息代码的分析。

随着纳米技术的发展,对遗传密码(HA)的研究和使用引起了人们的兴趣。但是,GK模型的局限性还远远不能满足所有研究人员的需求,并且那些满意的人仍然对某些细节不满意。

事实是,现有的GC模型无法解释许多现象和实验确定的事实。但是,这并不奇怪,但很自然。该地区是一个相对较新且相当复杂的地区,自发现以来相对已过去了很短的时间,投入时间的人也非常有限。个别研究人员的努力旨在改进GK模型。为此,使用了蛋白质氨基酸的特性(请参见表1)。氨基酸的现代合理分类基于自由基(R-基团)的极性,即它们在生理pH值(接近pH = 7.0)下与水相互作用的能力。

表1-蛋白氨基酸的性质


遗传学更正说明


熟悉各种来源的民法典说明会在文本,定义和推理中产生混淆感。如果在生物体内科学已经建立并运行着一个信息传递系统,而这正是分子生物学如何解释先驱研究人员的优点的话,那么为清晰起见,最好将该系统与技术上的类似系统建立类比。

显然,读者和追随者不必费心去考虑其他作者发表的材料的内容。这反映在人类思维惯性的体现以及压力对意识形态的权威名称的影响上。

各个概念或代码本身都没有清晰透明的描述。我们简要介绍了这种系统在技术和生物体内的示意图。

. ( ), ( ) .
. , : . ( ) , , . , . . . () .

下文是一些简化的方案,用于在使用编码系统的技术中以及在利用自然界自身创造的编码系统在生物体内传输信息。同时,列出了系统的所有必需要素及其运行过程。

在使用分组代码的通信系统中用户信息交换的一般方案中,可以区分以下概念和通信系统的相应元素:

  • 消息来源(信息)-文本,档案文档,音频,视频图像等。
  • 邮件的发件人,以某种字母表示;
  • 消息-许多数字化的信息词;
  • 编码器-一种实现将发送者消息转换为代码字的设备或计算机程序;
  • , ;
  • , ;
  • , , , ;
  • , ;
  • () .

系统的某些元素可以与相同或修改的功能组合在一起。字母表可以是单(二进制)在发送侧和接收侧中,消息的源方和发送方以及接收器和用户可以是一个人,解码器功能可以被限制于检测到错误,而无需校正它们,但具有去除失真码字等的

应该是什么从现有的遗传密码和活生物体的功能描述

我们认为一个细胞核中的一组染色体是由以“逗号”分隔的一系列基因形式记录的DNA分子代表的。每个基因由4个字母的3个字母密码子(三胞胎)形成。

在基因内的密码子(三胞胎)之间没有分隔符(逗号);三胞胎(密码子,单词)以连续,无分支的流形式书写。一般染色体和单个基因都具有称为遗传信息的信息负荷,由于亲代细胞分裂的过程,该信息传递给新一代细胞。

从父母继承的基因的语义信息填充是未明确记录的某种类型的生物(个体)的物理属性。症状(例如,头发的颜色)的传播是多阶段的:三联体-氨基酸-酶-蛋白质-器官或身体组织。这些迹象没有明确记录,而是通过合成蛋白间接记录。对于金发和黑发,参与合成的蛋白质,氨基酸,三胞胎是不同的。金发碧眼的蛋白质(父母的父母)将用于不同的组织和器官,为后代提供遗传特征和头发颜色的外观。

假定那些在细胞中合成并提供进一步形成人体生长和发育所需的全部蛋白质种类的酶的集合,保证了由遗传决定的基因型的出现。密码子(三胞胎)的完整列表限制为4 3 = 64,但是构成基因的此类密码子的组成和序列非常大。每个氨基酸(酶,蛋白质)需要单独的一组密码子或一个基因来合成。

特定生物的所有蛋白质都是唯一的。进入人体的异质蛋白质或变形的蛋白质(被视为陌生人)会被人体排斥。这是免疫系统。该系统检查使用基因组的蛋白质编码的正确性。换句话说,代码字的作用是由体内合成的蛋白质发挥作用,免疫系统充当解码器。

解码器处理的消息的接收者应被视为使用特定蛋白质进行生长和重要活动的活生物体的器官和组织。消息用户是生物本身。

可以假定原始染色体和基因最初是由所需的性状产生的,该性状是由蛋白质列表形成的,并且是来自形成所需蛋白质列表的氨基酸的蛋白质,最后是由合成这些氨基酸的密码子产生的。因此,有关生物特征的信息最初可以记录在基因和染色体中,并存储在其中,并在细胞分裂过程中传递给新一代细胞和生物。该有机体的理想特性已被固定并保存了许多代。尽管这里所说的与分子生物学的中心教条相矛盾,但是列出的链可以在两个方向上被精神追踪。

因此,在比较两个(实时和技术)信息传输系统时,我们会得出以下结论:

  • 消息的来源(信息)是细胞,其中是DNA的来源和载体。
  • , – , ;
  • – () , ;
  • , , , , « » ;
  • , — ;
  • , — , , ;
  • – , ;
  • , , – ;
  • () – , .

( )


. , « , , » . .

« , » ..
. – , . , .

区分细胞免疫,以及具有自身活性的蛋白质产物(体液免疫)。该系统作为一个整体起作用。它包括大约10 12个淋巴细胞和10 20个免疫球蛋白分子,用于鉴定抗原。

抗原(Ag)是来自相同物种(同种异体),另一物种(外源性)以及人工或合成动物的分子和细胞。由机体自身产生但经过修饰的同种异体抗原称为自体抗原

鉴定抗原后,免疫系统使用特殊的T细胞或抗体中和并清除抗原。(At),由B细胞产生。称为补体和备解系统的体液因子执行相同的功能。吞噬作用和细胞内银的破坏是由巨噬细胞进行的

免疫系统的所有这些组成部分构成了人体的免疫网络。
这样的网络有时具有超敏性,有时具有免疫耐受性或免疫缺陷性,这违反了规范。

在第一种情况下,会发生过度的免疫反应,在第二种情况下,会表现为缺乏选择性免疫反应。最困难的情况是当同种异体抗原变成自体并且人体的免疫系统开始对其自身起作用时。这样就完成了系统映射。

开发GC的另一种方法是将其元素表示为代数(Galois场)和空间结构(请参见论文)。根据对《民法典》的现有描述,其单词列表包含64个三元组,每个三元组都可以与单个多维数据集的顶部进行比较。

图2显示了根据Yablonsky的具有2 6 = 64个顶点的单个六维立方体

遗传密码(续)

在我们的三维(n = 3)世界中,在有生命和无生命的自然世界中,都有令人称奇的现象,称为元素的自组织和自组装,例如在无生命的自然世界中,晶体的成核和生长。在这种现象中,自然结晶定律的作用得以体现。随着时间的流逝,人发现了这些法律,对它们进行了解释,并全身心投入其中。 1848年,奥古斯特·布拉夫(Auguste Brave)在几何上推导了由相同单元形状形成的14种空间(平移)晶格。

1890年,E。S. Fedorov建立了17个平面和230个空间代数晶体学群。科学家的这一发现尤其决定了自然界制造晶体的可能性和局限性。物质晶体的性质非常罕见。大多数物质,即使在溶液中,也倾向于通过乳剂,悬浮液或胶体以无序形式保留(无定形),并且不会结晶。

从数学的观点来看,晶体学晶格实现了简单和复杂的对称类型。埃舍尔的画作很多。二维和三维空间中的晶体不具有5射线旋转对称性-这是3维几何结构对我们世界的晶体学限制。在4维世界中,此限制已消除。Rosenfeld B. V. Karasev在现有的各种数学中有机会强调和缩小一类对称性-平面上的规则多边形和n维空间中的规则多面体

表2-正则多面体及其特征(n = 3的情况)

p *-面中顶点的数量; q *是与顶点相邻的面的数量。

表3-正则多面体及其特性(案例n = 4)


在多面体q的每个顶点处,相同的p边会聚。
正则4多面体的值(p,q,r)由不等式sin(π/ p)·sin(π/ r)> cos(π/ q)的整数解确定。这样的整数解只有6种,所有的整数解都在表3中列出。

与往常一样,数学提供了比自然或人所能实现的更多的机会。尽管我们对自然的了解可能非常有限。当蜜蜂为它们的蜂蜜储备建立六边形存储时,便知道了遗传遗传反射行为的情况。

通过对HA的分析,并考虑到其元素放置的空间模型中的代码元素的其他属性,可以得出这样的元素安排,要考虑到氨基酸分子的各种空间对称性。

20顶点十二面体如何(在数学上)与生物体的遗传学联系起来尚不清楚。但是十二面体的5面面和自然的晶体学限制的结果表现为在面的顶点处没有氨基酸的五个对称的旋转对称性。

在用于自然建模的5种可能的正确3-多面体中,没有选择最简单的一种,但是它满足了合成细胞酶的定量要求(20)。十二面体拥有如此多的山峰。现有的20种氨基酸(细胞酶)可以按特定顺序映射到十二面体的顶点。实际上,有可能在空间中放置20个氨基酸(n = 3),以使它们的坐标对应于十二面体的顶点,并且多面体的某些特性将反映氨基酸的对称依赖性。



该图示出了I-反对称的平面; II-划分“对立面”的平面。平面的交点是十二面体的旋转轴之一。

带有索引(上和下)和符号(±)的字母A和B表示具有某些特性的氨基酸(表1)。因此,在图1的左侧,穿过多面体中心的水平面上方的所有元素都标有,而水平面下方的所有元素都标有⊖,它们表示氨基酸的极性。

1968年,Rumer Yu。B.提出并提供了构象的矩阵和图形描述(表4)。

表格4- 4链接图的构造(64)及其描述(根据Rumer)


表中元素和图排列方式是,使得块中的相邻元素彼此仅相差一个值(信息的1位)。因此,它类似于格雷码。

链聚合物的拓扑编码模型。作者确定了模型的三个组成部分:拓扑代码;链编码算法;物理操作员系统重新创建编码结构。该模型使用了Rumer变换[7]。

例如,三胞胎AAC,AAU-Asn; AAG,AAA-通过替换碱基C-A将左侧的赖氨酸转换为右侧; G-U。

表5-从构象矩阵到三重态HA的转换(根据Karasev V. Luchinin V.)

在图形的矩阵[3×3]中,连接的边将数字i和i-4的顶点连接起来,并对应于值1。

根据可用的GC描述,其密码子列表包含64个三元组,每个三元组都可以与一个单位立方体的顶点关联。图2显示了具有2 6 = 64个顶点的单个六维立方体

另一方面,由64个元素和一个顶点数相同的单个超立方体(n = 6)组成的扩展Galois场GF(2 6可以与64个三元组关联



图2-具有顶点标记的单个多维数据集(根据Yablonsky SV的[11]和根据Karasev,Rumer的[4,7])的GK元素。

由于顶点和三元组的数量重合,我们可以在它们之间建立一对一的关系-双射,这可以通过元素的排列来表示。 HA的氨基酸一次分配给单个立方体的每个顶点。


图3-超立方体

拓扑代码的一部分。选择转化为链图(4b)的链状聚合物(4a)的4单元片段作为初始对象。图形边缘(kc)-聚合物键入射到链接端点的顶点(i,i-1,i-2,...,i-4)。

图x1,x2,...,x6的顶点是取值为0或1的变量。


图4-链状聚合物的四单元片段(a),其图(b)和图的基质(c)

Galois字段的表。这是加法表和字段乘法表,还包括Galois字段元素的表,该表显示了元素的各种表示形式以及元素的某些特征;

元素表的左列是该字段的原始元素(000010)的程度。这些学位贯穿该领域的所有要素。下列各栏:用多项式表示字段元素,二进制向量,十进制数,字段元素顺序,乘法逆向量,多项式逆度,小数形式逆,码字权重。

隐写术和信息保护[1,2,12,13,14]


众所周知,DNA是由一系列基因形成的,其中有外显子和内含子。外显子编码蛋白质,开始其合成,内含子不编码任何东西。他们甚至被称为“沉默”基因。在蛋白质开始合成之前,特殊的酶会从DNA中去除内含子。

例如,在一个基因组的人中,几乎有90%的内含子。对于隐写技术应用,感兴趣的是内含子。此外,HA的简并性不仅允许生成人工DNA容器,还可以修饰天然DNA。

将DNA容器嵌入消息后,应转到消息的收件人。这可以通过许多方式来完成。例如,将所使用的DNA分子的模型所属的生物体的基因组引入。普通病毒向我们展示了成功的DNA分布机制。
定义隐秘术是用于嵌入/检索,传输(存储)隐藏信息的方法的科学,其中使用信息感知的功能在开放通道的基础上并在开放通道内组织隐藏通道,为此,可以使用以下技术:

  • 完全隐藏了隐藏的沟通渠道的存在,
  • 为检测,检索或修改打开的容器消息中的已隐藏消息带来了困难,
  • 屏蔽协议中的隐藏信息。

隐写术的一般概念是创建一个隐藏的通道,用于在发送方(A)和接收方(B)之间传输信息。因此,在一个消息中,它被订户A ≠A订户B ≠B隐藏(隐藏于AB),被发送(嵌入到订户A中),另一条消息的容量较小(大约为专利可以在这里阅读)。

对于指示的不等式,考虑了不同的条件和可能性。第一对或第二对可以是一个人,或者对两对订户都进行相等,尽管后者是不希望的。

早在上世纪50年代,理查德·费曼(Richard Feynman)就利用DNA分子组织计算的可能性进行了理论证明。
定义密写算法是一对相互可逆的变换:正F:M×B×K→B和逆F -1:B×K→M,对应于三元组(M —消息,pB —空容器,K —键)结果容器对(zB是已填充的容器,K是键)是初始消息M,并且F(m,b,k)= b m,k
F -1(b m,k,k)= m,其中m ∊ M; b,b m,k ∊ B;

隐秘系统(GHS)称为系统S =(M,B,K,F,F -1),由消息,容器,密钥和连接它们的转换集构成。

通过GHS实施(隐藏)/检索消息是指具有相应参数值的正向/反向隐写转换的结果。
定义测序是DNA片段中核苷酸序列的确定。

计算机技术,微生物技术的出现和发展使得人们可以说出并实际使用活细胞的结构元素(DNA,RNA等)作为隐写容器[3,4]。这些元素用于存储大量信息并具有微观尺寸的属性吸引了专家的注意,尽管与它们进行合作需要大量的专业培训和使用专门的昂贵设备

二手文献清单:
1. .. . . — .: , 2003. 152 .
2. . . . . – .: -, 2002. – 272 .
3. . ., . . // . 2002. . 7. . 274 — 278.
4. .. / 23.03.2004, №470-2004.
5. . . . – .: , 1966. – 648 .
6. . . – .: ,1976. – 224.
7. . . // . 1968. . 183. .225-226
8. – . . – .: ,
9. . . : . – .: , 1999. – 352 .
10. . . -. . / . . . . . . .: , 1964. . 195 – 219.
11. . .– .: , 1979.–272 .
12. Bancroft F. C. Clelland C. DNA-based steganography. United States Patent №6.312.911. November 06,2001.US Patent & Trademark Office.
13. Bancroft F. C. Clelland C. DNA-based steganography. WO0068431. November 16,2000. World Intelltctual Property Organization.
14. Pfitzmann B. Information Hiding Terminologiy, Information Hiding //First International Workshoh. Vol. 1174 of Lecture Notes in Computer Science, Isaac Newton Institute, Cambrige, England, May 1996.- Berlin: Springer-Verlag/pp 347-350.

All Articles