Analisis Kode Genetik I


Ilustrasi oleh melmagazine.com (Sumber: melmagazine.com/wp-content/uploads/2019/11/DNA-1280x533.jpg )

Saat ini, jaringan publik dengan saluran yang tidak dilindungi dari penyusup banyak digunakan untuk pertukaran informasi. Pesan dalam jaringan yang terhubung dan pengguna komputer dipaksa untuk melindungi diri mereka sendiri. Karena pengguna tidak dapat melindungi saluran pesan sendiri, ia melindungi pesan tersebut.

Apa yang dilindungi dalam pesan? Pertama, sintaks (integritas) untuk tujuan ini menggunakanpengkodean(pengkodean dan analisis kode), dan kedua, semantik (kerahasiaan) dimanakriptologidigunakan(analisis kriptografi dan kriptografi), ketiga, secara tidak langsung, pelanggar dapat membatasi ketersediaan pesan dengan menyembunyikan fakta penularannya, yang menggunakan steganologi (steganografi dan steganalisis).

Kemungkinan yang terdaftar secara teoritis dan praktis disediakan dalam berbagai tingkat, dan meskipun setiap arah telah berkembang untuk waktu yang agak lama, mereka masih jauh dari lengkap. Dalam karya ini, kami hanya akan menyentuh satu masalah tertentu - analisis kode pesan.

pengantar


Kode genetik (HA) dipilih sebagai objek analisis. Anda dapat berkenalan dengan contoh aneh tentang penggunaan Kode Sipil di bidang keamanan informasi (tampaknya tidak profesional dan karenanya tidak berhasil) di sini.

Dalam teori pengkodean, dua arah penting dapat dibedakan: pengkodean sumber informasi dan pengkodean saluran. Yang pertama diimplementasikan, sebagai aturan, oleh sisi transmisi dan memiliki tujuan menghilangkan redundansi pesan (misalnya, kode Morse), tujuan yang kedua adalah untuk mendeteksi dan menghilangkan kesalahan dalam pesan. Sebelum munculnya kode koreksi, masalah menghilangkan kesalahan diselesaikan dengan mentransmisikan ulang fragmen pesan yang terdistorsi atas permintaan pihak penerima.

Di sini kami mencatat fakta bahwa tidak mungkin bagi pihak penerima untuk mendekripsi ciphergram dengan benar jika terjadi kesalahan dalam teksnya. Cipher tidak memungkinkan untuk mendeteksi kesalahan, atau bahkan memperbaikinya. Untuk alasan ini, di sisi transmisi sistem komunikasi, cipher-program pesan dikodekan dengan kode koreksi, dan di sisi penerima, decoder dalam pesan yang diterima mendeteksi (jika ada) dan memperbaiki kesalahan.

Setelah itu, cryptosystem ikut bermain dan penerima yang sah diberikan pesan yang didekripsi. Ini adalah, secara umum, fungsi jaringan yang bertukar pesan aman.

Dalam karya ini, kami akan menganalisis secara rinci kode genetik yang sangat penting, yang diciptakan bukan oleh pikiran manusia, tetapi oleh alam itu sendiri (kasus yang jarang terjadi).

Kisah Penemuan dan Hadiah Nobel



Kami bertanya pada diri sendiri bagaimana, pada tingkat genetika dan metabolisme organisme (sel), apakah alam menerapkan ketentuan pertukaran informasi dalam kehidupan spesies dan perwakilan individu mereka?

Sebelum Perang Dunia Kedua, dunia ilmiah tahu bahwa dalam organisme hidup transmisi sifat turun-temurun dari generasi ke generasi dilakukan melalui unit kimia (gen) yang relatif sederhana, yang mencakup sejumlah besar informasi yang diperlukan untuk kelanjutan dan reproduksi kehidupan.

Semua gen (bukan protein) mengikat rantai (kromosom) dan terwujud dalam asam deoksiribonukleat (DNA). Para ahli tidak memiliki kejelasan tentang bagaimana semuanya terjadi dan bagaimana DNA itu sendiri terstruktur.

Peneliti muda, ahli fisika Inggris F. Crick dan ahli biologi Amerika J. Watson, pada tahun 1953 (25,4) menerbitkan sebuah artikel di jurnal Nature tentang struktur asam deoksiribonukleat. Pada awal pekerjaan mereka pada tahun 1949, James Watson berusia 23 tahun, masing-masing Francis Crick dan Maurice Wilkins, 33.

Dalam artikel tersebut, penulis menggambarkan model struktur spasial DNA dalam bentuk heliks ganda, dua helai yang dipelintir ke kanan. Untaian itu sendiri ternyata dihubungkan oleh "langkah" transversal yang terbentuk dari nukleotida.

Definisi . Nukleotida adalah senyawa yang terdiri dari gula, basa yang mengandung nitrogen (purin atau pirimidin) dan asam fosfat. Nukleotida adalah "blok bangunan" untuk DNA dan RNA.


Heliks DNA ini adalah pembawa kode genetik - kode hereditas sifat organisme dan hewan. Ini adalah pekerjaan baru yang sama sekali tidak biasa pada struktur dan sifat-sifat molekul asam deoksiribonukleat.

Model DNA penulis muda dikonfirmasi dengan membandingkannya dengan pola difraksi sinar-X dari struktur kristal DNA dari ahli biofisika Inggris Maurice Wilkins. Kemudian, kode genetik ditemukan yang berisi dan mentransmisikan informasi tentang sintesis struktur dan komposisi protein - komponen utama dari setiap sel organisme hidup yang mengimplementasikan siklus sel.

Definisi . Siklus sel adalah pergantian periode istirahat relatif yang tepat dengan periode pembelahan sel.


Pada tahun yang sama, penulis kemudian menerbitkan artikel lain yang menggambarkan mekanisme yang memungkinkan untuk menyalin DNA dengan sintesis matriks dalam pembelahan sel hidup. Heliks ganda DNA disamakan dengan "kunci petir".

Setiap utas spiral, setelah "membuka kunci" dan mengencerkan utas, menjadi matriks sintesis dan dilengkapi dengan utas kedua dari sitoplasma sel sesuai dengan prinsip saling melengkapi untuk melengkapi DNA. Ia juga mengatakan bahwa urutan basis tertentu (kodon, kembar tiga) adalah kode yang berisi informasi genetik.

Ide matematika kode ini pertama kali diungkapkan oleh G. Gamov dalam sebuah artikel pada tahun 1954 sebagai masalah menerjemahkan kata-kata dari alfabet empat-sistem (sistem) menjadi kata-kata alfabet dua puluh huruf. Dia menyajikan masalah pengkodean fenomena kehidupan bukan sebagai biokimia, tetapi sebagai masalah matematika kombinasi. Upaya pendahuluan jangka panjang dari penulis karya ini dijelaskan dengan baik dalam buku D. Watson, The Thread of Life.

Pada tahun 1962, Watson, Crick, dan Wilkins menerima Hadiah Nobel dalam Fisiologi atau Kedokteran "untuk penemuan di bidang struktur molekul asam nukleat dan untuk menentukan peran mereka dalam transfer informasi dalam materi hidup."

Mereka memiliki informasi tentang fakta-fakta berikut:

  1. Pada tahun 1866, Gregor Mendel merumuskan ketentuan bahwa "unsur-unsur", yang kemudian disebut gen, menentukan pewarisan sifat-sifat fisik individu spesies.
  2. , , () , , .
  3. 1869 . , . . () (). . 4- ( ): (), (), (G), (); (), (U) , (G), (), ( ) .
  4. , , – , .
  5. 1950 . , 4- .
  6. , , .
  7. , 20- , (), .
  8. 1944 Β« ? Β». : Β« - , , ?Β».
  9. 1954 , () 4- 20- , , .

Peneliti harus mengambil langkah berikutnya, dan itu diambil.

Tidak ada kekurangan hipotesis dan asumsi, tetapi seseorang harus memverifikasi kebenarannya.
Kode yang tumpang tindih (satu huruf nukleotida adalah bagian dari lebih dari satu kodon): triangular, major-minor dan sequential, diusulkan oleh Gamov dan rekan;
kode yang tidak tumpang tindih: kombinasi Gamow dan Ichas, "kode bebas koma" dari Scream, Griffith dan Orgel. Dalam kode kombinasi, asam amino (20) dikodekan oleh triplet dari 4 nukleotida, tetapi urutannya tidak penting, tetapi hanya komposisinya: triplet TTA, TAT, ATT mengkodekan asam amino yang sama dalam protein.

Kode bebas koma menjelaskan bagaimana "frame membaca" dipilih. Seperti "jendela geser" di sepanjang untai DNA, tempat huruf-huruf mengikuti, satu demi satu tanpa pemisah (koma) ke dalam kata-kata menunjukkan bahwa kata-kata itu entah bagaimana berbeda. Menurut model F. Crick, sebuah asumsi dibuat: semua kembar tiga dibagi menjadi yang bermakna, yaitu, sesuai dengan asam amino spesifik, dan tidak memiliki makna.

Jika hanya kembar tiga bermakna yang membentuk DNA, maka dalam "kerangka baca" lain kembar tiga tersebut akan menjadi tidak berarti. Para penulis kode ini menunjukkan bahwa dimungkinkan untuk memilih kembar tiga yang memenuhi persyaratan seperti itu dan bahwa ada tepat 20. Tentu saja, penulis tidak memiliki kepercayaan penuh pada kebenaran mereka.

Memang, setelah tahun 1960, ditunjukkan bahwa kodon, yang dianggap oleh Crick tidak masuk akal, melakukan sintesis protein in vitro, dan pada tahun 1965 arti dari semua 64 kodon triplet didirikan. Ternyata juga bahwa sejumlah asam amino dikodekan oleh dua, tiga, empat dan bahkan enam kembar tiga yang berbeda, yaitu ada redundansi tertentu, yang tujuannya masih harus ditentukan.

Kode kehidupan genetik. Informasi yang Diwarisi


. – , ( , G, C, T), , . ( ) – . . .


Untuk mengkodekan masing-masing dari 20 jenis asam amino kanonik, dari mana hampir semua protein dibangun lebih lanjut dan sinyal berhenti terminal, satu set tiga nukleotida (huruf) yang disebut triplet (kodon) sudah cukup. Urutan kodon membentuk gen dalam untai kromosom dan menentukan urutan asam amino dalam rantai polipeptida protein yang dikodekan oleh gen ini. Ada konsep "satu gen - satu enzim."

Presentasi klasik dari informasi (linearitas dari rekamannya) adalah teks dalam arti luas (ucapan, surat, buku, gambar, film, musik, dll.) Dari kata ini dalam bahasa alami (EY). Bahasa tersebut mencakup kosakata yang luas (vocabulary), dan jika memiliki bahasa tertulis yang terpisah dari bahasa yang diucapkan, maka alfabet dengan tata bahasa.

Untuk menyimpan informasi untuk waktu yang lama dan mentransfer salinannya, diperlukan memori dan sistem penulisan yang solid dan terlindungi dengan baik. Informasi turun temurun dari organisme hidup ditulis oleh EY alam dalam teks-teks panjang dengan kata-kata dalam alfabet "molekuler" tertentu, yang disimpan dalam bentuk kromosom dalam inti semua sel organisme hidup.

Proses dan cara mentransfer informasi yang direkam pada molekul pembawa alami dirumuskan oleh F. Crick (1958) dalam bentuk dogma sentral biologi molekuler . Tiga proses utama memberikan kontrol terhadap semua proses fungsi sel lainnya dan kehidupan organisme secara keseluruhan.

Proses-proses ini adalah: replikasi , transkripsi dan terjemahan. Selanjutnya, mereka akan dibahas secara lebih rinci. Informasi dalam organisme ditransmisikan hanya dalam satu arah dari asam nukleat (DNA β†’ RNA β†’ protein) ke protein, transmisi balik tidak ada. Kasus khusus DNA β†’ protein, RNA β†’ RNA, RNA β†’ DNA dimungkinkan.

Membaca informasi di sepanjang rantai molekuler hanya diperbolehkan dalam satu arah ke depan. Istilah "bingkai membaca" digunakan.

Definisi . Frame pembacaan (terbuka) adalah urutan kodon yang tidak tumpang tindih yang mampu mensintesis protein, dimulai dengan kodon awal dan diakhiri dengan kodon stop. Bingkai ditentukan oleh triplet pertama dari mana siaran dimulai.


Untuk memulai penyiaran, kodon awal tidak cukup, Anda juga memerlukan kodon inisiasi (ada tiga di antaranya: AUG, GUG, UUG). Setelah membacanya, terjemahan dilakukan dengan secara berurutan membaca kodon dari rRNA ribosom dan melampirkan asam amino satu sama lain oleh ribosom sampai kodon berhenti tercapai.

Selama penerjemahan, kodon selalu "dibaca" dari beberapa simbol awal yang dimulai (AUG) dan tidak tumpang tindih. Membaca setelah dimulainya triplet setelah triplet pergi ke kodon berhenti penyelesaian sintesis rantai protein polipeptida.

Fakta-fakta ini dirangkum dalam sebuah tabel metode untuk mentransmisikan informasi genetik.

Tabel 1 - dogma utama biologi molekuler


Sejarah studi teks-teks hereditas organisme, pemahaman mereka, panjang, kaya akan penemuan, pencapaian, khayalan dan kekecewaan. Daftar peristiwa dalam sejarah pemahaman (kognisi) dari teks-teks alam adalah kepentingan yang tidak diragukan, baik untuk sains dan untuk setiap orang.

Kata-kata dari teks sangat panjang, tetapi alfabet penulisan "EYA nature" hanya mengandung empat huruf - ini adalah basis molekuler: dalam RNA itu adalah A (adenin), C (sitosin), G (guanin), U (uracil) (dalam DNA, urasil diganti) pada T (timin)). Bahasa satwa liar adalah bahasa molekul.

Ahli biologi telah menetapkan bahwa setiap kata dari teks hereditas dibentuk oleh molekul DNA polimer (asam deoksiribonukleat, ditemukan pada tahun 1868 oleh dokter I.F. Misher), dibangun dari 4 basa (nukleotida - dari nuklir - nuklir).

Basa diikat (terhubung) satu sama lain secara berpasangan, A ← β†’ T, T ← β†’ A, G ← β†’ C, C ← β†’ G dengan ikatan hidrogen khusus yang menerapkan prinsip saling melengkapi. Fakta-fakta ini didirikan pada waktu yang berbeda, oleh berbagai ilmuwan dan metode dari banyak ilmu (fisika, kimia, biologi, sitologi, genetika, dll.). Kesulitan dalam cara mengetahui NJ ini bertemu terus-menerus.

Molekul DNA tidak mengkristal, tetapi ketika ini dilakukan, tugas membangun struktur DNA dikurangi untuk menyelesaikan masalah inversi analisis difraksi sinar-X (Transformasi Fourier dari pola difraksi kristal yang dibuat di layar dengan sinar-X).

Model yang dihitung dan dirakit dengan tangan oleh J. Watson dan Francis Crick pada tahun 1953 mirip dengan permainan anak-anak LEGO, di mana unsur-unsurnya adalah basis molekuler dan jarak interatomik serta sudut rotasi dipelihara dengan sangat akurat, struktur kromosom direproduksi dalam skala besar.

Model ini secara praktis mengkonfirmasi hipotesis beragam para ahli teori dan secara meyakinkan membuktikan tidak adanya perbedaan dengan eksperimen praktis dan hasil analisis difraksi sinar-X DNA kristal.

Data rinci utama tentang struktur kimia DNA dan karakteristik numerik model diperoleh oleh Rosalinda Franklin dan M. Wilkins sebelumnya pada tahun 1953 di laboratorium analisis sinar-X. Konflik para ilmuwan dijelaskan dalam novel "Loneliness on the Net" karya Janusz Leon Wisniewski.

Kehadiran struktur visual DNA dan karakteristik kuantitatifnya memberikan dorongan untuk pengembangan genetika dan semua biosains, dari mana ide proyek Genom Manusia muncul pada tahun 2000. Watson menjadi pemimpin pertama proyek ini, set kromosom Homo sapiens manusia sepenuhnya diuraikan dalam proyek. Peta genetik lengkap kromosom 1 selesai pada tahun 2006. Peta ini berisi 3141 gen dan 991 pseudogenes.

Dari sudut pandang matematika, empat elemen alfabet dapat dikaitkan dengan empat elemen bidang Galois terbatas GF (2 2 ) = ( 0, 1, Ξ±, Ξ² ), operasi yang dilakukan dengan modulo polinomial tak tereduksi p (x) = x 2 + x + 1 . Kemudian Ξ± + Ξ² = 1, Ξ± βˆ™ Ξ² = 1dan pemetaan elemen-elemen medan menjadi huruf-huruf mengambil bentuk


, dan nukleotida (komplementer) tambahan dihitung sesuai dengan aturan Β¬ β†’ x + 1 , dari mana T β†’ A + 1, C β†’ G + 1.

Secara struktural, model DNA mewakili dua rantai polimer yang sama dari nukleotida yang terhubung secara berpasangan (oleh prinsip tangga tali) dan dipelintir menjadi spiral ganda yang tepat. Di bawah ini dalam teks, pasangan surat yang ditulis secara vertikal sesuai dengan langkah-langkah "tangga":

T A GGTTCG T ...
ATCCAAGCA ...


Dua rantai mengulangi urutan huruf, tetapi awal dari satu terletak di seberang ujung yang lain. Informasi dalam molekul DNA dicatat dengan tingkat redundansi yang tinggi, yang tentu saja memberikan tingkat keandalan yang tinggi ketika membaca informasi dan menyalinnya (replikasi: DNA β†’ DNA). Satu kata lagi dikaitkan dengan kata asli, tetapi dalam kode tambahan.

Semua kromosom mengandung gen dalam komposisi mereka dan terkandung dalam setiap sel dalam volume yang sangat kecil (dalam inti sel) dan pendek dan sangat panjang. Jarak antara untai DNA adalah 2 nm, antara "langkah" - 0,31 nm, satu putaran lengkap "heliks" setiap 10 pasangan. Total panjang semua DNA yang direntangkan menjadi satu untai mencapai 2 m. Informasi keturunan manusia dicatat pada 23 kromosom. Panjang kromosom sekitar 10 9nukleotida, dan diameter nukleus kurang dari satu mikrometer. Dengan demikian, DNA dalam sel dipadatkan.

Definisi . Gene (Greek.γΡνο΢ - genus). Unit struktural dan fungsional dari faktor keturunan organisme hidup. Gen (lebih tepatnya alel) menentukan sifat turun temurun dari organisme yang ditransmisikan dari orang tua kepada keturunan selama reproduksi.


Dalam kata-kata DNA, adalah mungkin untuk mengisolasi dan mempertimbangkan sub-sub bagian individu (gen) yang membawa informasi integral tentang struktur satu molekul protein atau satu molekul RNA. Selain itu, gen dicirikan oleh urutan pengatur (promotor).

Promotor dapat ditempatkan baik dalam jarak dekat dengan kerangka bacaan terbuka yang mengkodekan protein atau awal urutan RNA, dan pada jarak jutaan pasangan basa (nukleotida), misalnya, dalam kasus dengan peningkat, isolator, dan penekan.

Setiap gen dirancang dan bertanggung jawab untuk menciptakan protein spesifik yang diperlukan untuk kehidupan tubuh. Konsep genotipe menunjukkan konstitusi herediter dari gamet (sel germ) dan zigot (sel somatik), berbeda dengan fenotipe yang menggambarkan karakter yang diperoleh yang tidak diwariskan.

Kode blokir


Kode adalah konsep multi-nilai. Pertama-tama, kode dapat disebut seperangkat kode dari kata-kata kode yang membentuk kode itu sendiri. Kata-kata inilah yang dikenali oleh decoder pada sisi penerima ketika mengirimkan pesan, dan pada sisi pengirim, pembuat kode membentuknya.

Saat membuat kata-kata kode, pemetaan unik dari serangkaian karakter hingga yang terbatas milik alfabet terbatas tertentu ke yang lain, belum tentu dipesan, biasanya serangkaian karakter yang lebih luas untuk pengkodean transmisi, penyimpanan, atau transformasi informasi digunakan. Kami

mencantumkan properti dari kode genetik yang sedang dipertimbangkan:

  • . . in Vitro ( ). () () .
  • . , .
  • . . ( ) – , , .

    . . 4- , , 20 , , ( ) .

    , (), 4; 2- (), 42 =16 ; () 43 = 64 > 20 . .
  • . . , -, , - . .

    . 64 1965 . , . , (). .

    2 β€”


    20 61 , . , . AUG – .
    . . AGC, GCU, CUA,… , . , . .
  • . - .

    , . ( ) ( ) .
  • . - , . : AUG ( ) , – .
  • . . . 1961 . .
  • – ;
  • – ( ) .


Pertimbangkan dua set diskrit X dan n yang masing-masing berisi | X | dan | n | unsur dan pemetaan Ο† : n β†’ X . Ketika mewakili pemetaan sewenang-wenang dari set dengan kata-kata dalam alfabet X, kita mendapatkan satu set kata X n , masing-masing panjang karakter n dari q tersedia | = | X, yang membentuk alfabet pesan teks. Lebih mudah untuk mengatur semua kata X n dalam urutan leksikografis dalam daftar umum.

Tujuan kami di bagian pekerjaan ini adalah untuk menghasilkan kode yang menyediakan pengkodean (konversi) dari data yang ditransmisikan ke dalam bentuk yang nyaman untuk transmisi dalam ruang dan waktu dan penyiaran (terjemahan) dari satu bahasa ke bahasa lain yang dapat dimengerti oleh penerima pesan.

Menghasilkan kode melibatkan memilih alfabet, menentukan keteraturan, dan ketika memilih kode biasa, menentukan panjang kata kode, menentukan jumlah kata kode, menentukan komposisi huruf per kata dari setiap kata.

Tabel 3 - Kode genetik terdiri dari 64 kata kode masing-masing 3 huruf


Tabel 4 - Nilai terbalik dari urutan kode RNA kembar tiga


Properti tambahan dari kode, misalnya, kode tidak boleh memiliki koma, ditentukan oleh persyaratan yang lebih ketat untuk parameter kode bernama. Kode bebas koma harus memiliki kata dengan periode maksimum. Persyaratan tersebut difokuskan pada kenyamanan sintesis codec berikutnya. Terkait erat dengan ketentuan sintesis kode ini adalah masalah informasi pengkodean dan penguraiannya.

Analisis kode



Tugas analisis kode terdengar sangat berbeda ketika kode sudah ada dan digunakan, tetapi sedikit yang diketahui tentang hal itu sendiri. Pesan kode tersedia untuk dilihat dan dipelajari, tetapi pesan tersebut sangat beragam dan banyak sehingga prinsip penciptaannya tidak terlihat bahkan dengan analisis yang sangat luas.

Sebenarnya, sistem pengkodean itu sendiri juga tersedia untuk observasi dan studi, tetapi tingkat kerumitan konstruksi dan fungsinya tidak memungkinkan untuk mendapatkan deskripsi kualitatif dan andal yang lengkap.

Informasi (data) adalah pesan, mis. rangkaian karakter alfabet, yang dari beberapa posisi awal dapat dibagi menjadi segmen (blok) dengan panjang n karakter, dan masing-masing segmen tersebut adalah kata kode. Kode dalam hal ini adalah blok.

Di sisi penerima saluran pesan, penerima harus dapat membagi string karakter pesan yang berkelanjutan menjadi kata-kata yang terpisah. Penggunaan kata pembatas (koma) tidak diinginkan karena memerlukan sumber daya.

Sinkronisasi . Tanpa sinkronisasi, terjemahan pesan yang benar tidak mungkin dilakukan. Ini menyiratkan salah satu persyaratan untuk kode yang dihasilkan - kode harus dirancang sehingga sinkronisasi disediakan secara unik oleh sarana (properti) dari kode itu sendiri dan perangkat penerima informasi.

Definisi . Proses menetapkan posisi yang mengandung karakter awal (awal) dari suatu kata kode disebut sinkronisasi.
Tugas sinkronisasi diselesaikan dengan mudah jika alfabet menggunakan karakter pemisah kata khusus, misalnya, koma. Kerangka baca dari codeword berikutnya diatur segera setelah pemisah.


Pemisah seperti itu nyaman, tetapi tidak diinginkan karena beberapa alasan.

  • Pertama, kode harus sedemikian rupa sehingga pada titik kedatangan pesan itu memiliki bentuk yang persis sama dengan pada titik keberangkatan (memastikan integritas);
  • Kedua, pengodean, waktu pengodean dan durasi transmisi harus sesingkat mungkin, karena ini mengurangi kemungkinan mendistorsi pengaruh lingkungan pada teks pesan;
  • Ketiga, diinginkan untuk memiliki sejumlah kecil pembawa pesan, karena membutuhkan lebih sedikit penyimpanan, perlindungan, dan sumber daya lainnya.


Untuk dapat membedakan kata-kata kode dengan lebih baik, kata-kata tersebut harus dihapus satu sama lain dengan jarak tertentu dalam daftar lengkap kata-kata yang memungkinkan, yaitu. berbeda dalam komposisi makna simbol, karena vektor ruang vektor adalah komponen.

Oleh karena itu, kata-kata kode bisa tidak semua dan tidak ada kata-kata dari himpunan X n , tetapi hanya sebagian dari mereka D Ρ” X n . Pilihan komposisi simbolis dari kata-kata kode mewakili tugas utama pembentukannya, karena itu adalah komposisi kata-kata kode yang harus memastikan kepuasan persyaratan yang dirumuskan untuk kode. Dengan demikian, kami akan mempertimbangkan kode lebih lanjut tanpa koma.

. , . = (1, 2, …, n) = (1, 2, …, n). || = (1, 2, …, n, 1, 2, …, n). n – 1 n n . .


. (2, …, n, 1), (3, …, n, 1, 2)…( n, 1,…, n-2, n-1), .

Jika semua tumpang tindih dalam rangkaian untuk setiap pasangan kata kode bukan kata-kata kode, maka mekanisme pihak penerima (decoder) saluran transmisi informasi memiliki kemampuan untuk mengatur posisi awal yang unik. Ini dimungkinkan jika dekoder daftar D memiliki semua kata kode dan kemungkinan mencocokkannya dengan karakter yang dibaca dari pesan yang diterima.

Kami menunjukkan bagaimana ini dilakukan. Biarkan simbol dipilih dan diperbaiki dalam urutan karakter yang diterima. Setelah menghitung n karakter dari yang diperbaiki, decoder membandingkan kata yang ternyata dengan kata-kata dalam daftar kode. Jika ada kecocokan dengan salah satu kata dalam daftar kode, maka sinkronisasi dibuat. Simbol tetap dan posisinya mulai.

Jika tidak ada kecocokan dengan kata-kata dalam daftar kode, mis., Tekan kata yang tumpang tindih, ini berarti bahwa posisi awal terletak di sebelah kiri posisi tetap.
Kami bergerak ke kiri satu posisi dari posisi tetap dan mengulangi tindakan dari langkah sebelumnya sampai kami mendapatkan satu langkah yang cocok dengan salah satu kata kode. Proses ini harus memiliki penyelesaian yang sukses di posisi awal yang benar, mis., Sinkronisasi dibuat rata-rata untuk jumlah langkah n / 2.
. () D Ρ” n n , , Ρ”D .


Kami telah menetapkan bahwa kode semacam itu memastikan sinkronisasi yang benar dalam rantai panjang kata-kata kode tanpa pemisah di antara mereka. Kata-kata apa dari set X n yang termasuk dalam subset D Ρ” X n ? Jika kardinalitas dari himpunan X n dibagi dengan bilangan bulat, maka kardinalitas D dapat menjadi salah satu pembagi tersebut (Lagrange kelompok teorema) dan kode disebut kelompok kode blok tanpa koma .

, , D. , D  n (  n D), . , D.


Mari kita beralih ke masalah jumlah kata dalam kode yang dihasilkan.

Kekuatan kode tanpa koma. Kami akan menemukan jumlah kata sebanyak mungkin dalam kode D , yang kami tunjukkan dengan | D | = W n ( q) . Tidak mungkin untuk mendapatkan makna yang tepat, tetapi perkiraan atas jumlah kata dapat diperoleh dengan menggunakan konsep periode kata. Dilambangkan dengan T k x pergeseran siklik dari sebuah kata panjang n oleh k langkah, k < n .

. d ( ) k, k = d ≀ n, d | n. d = n (). .


, = (1, 2, 3, 1, 2, 3 ) d < n. || . || = (1, 2, 3 ; 1, 2, 3 , 1, 2, 3 ; 1, 2, 3). , (;) , . , n.


n(q) q . D Wn(q) ≀ n(q)/n .






Dengan demikian, untuk data sumber contoh 1, dari sekumpulan 64 kata yang berubah-ubah dengan panjang 3 karakter, Anda dapat membuat kode yang berisi 20 kata dan menyediakan sinkronisasi. Kode ini bukan tanpa cacat. Jika kesalahan dimasukkan ke dalam salah satu kata dalam satu karakter, kode tidak akan disinkronkan. Dengan kata lain, kode tidak stabil terhadap kesalahan.

Contoh numerik yang diberikan dapat digunakan untuk menggambarkan dan menjelaskan kode genetik organisme hidup, yang diciptakan oleh alam pada jalur evolusi yang panjang dan sepenuhnya diuraikan oleh ilmu pengetahuan modern pada tahun 1966. Ditetapkan bahwa kode genetik tidak tumpang tindih, dan makna (interpretasi) dari setiap kodon terungkap.
Tabel terakhir adalah sebagai berikut (Gbr. 2).

Ini mengikuti dari tabel bahwa kode mengalami degenerasi. Ini berarti ada sinonim dalam kode, misalnya, GUU = GUC = Val, CGG = AGA = Arg , dll. Tiga kodon UAA, UAG, UGA tidak memiliki arti yang tidak masuk akal. Ini adalah kodon terminasi, penampilan salah satu dari mereka dalam urutan karakter menandakan akhir terjemahan (transmisi). Suatu organisme mati jika, sebagai akibat kesalahan, huruf kodon semantik diubah menjadi kodon terminasi.

Perubahan seperti itu mungkin dan disebut mutasi.
Definisi . Mutasi adalah perubahan yang relatif stabil pada zat herediter.

Setiap kromosom mengandung gen x1, x2, ..., xn , yang membentuk sifat kompleks X tubuh. Sepasang kromosom dalam sel yang diperoleh dari fusi sel-sel kuman ibu dan ibu terbentuk selama reproduksi: satu kromosom diperoleh dari ayah, yang lain dari ibu (pasangan diploid kromosom).

Dalam kromosom homolog, semua gen bertepatan dalam fungsinya, tetapi mungkin berbeda dengan beberapa nukleotida. Perbedaan seperti itu seringkali merupakan hasil dari mutasi, yang dapat disebabkan oleh bahan kimia, radiasi, paparan radioaktif, suhu, radiasi pengion.

Penyakit keturunan disebabkan oleh mutasi yang serupa, yang menetap di set kromosom sel kuman dari salah satu orangtua. Contoh yang diketahui dari gen manusia yang mengkode hemoglobin. Ketika mengganti huruf T dengan huruf A , bentuk alternatif hemoglobin muncul di satu posisi gen. Ini memanifestasikan dirinya dalam penyakit yang disebut anemia sabit.

Ketika nilai sifat tersebut bertepatan pada kedua kromosom homolog, individu tersebut disebut homozigot untuk gen ini. Dalam kasus lain, heterozigositas terjadi. Homozigositas ditandai oleh pasangan diploid tipe a), dan heterozigositas berdasarkan pasangan tipe b) (Gbr. 3)


Gambar 3 - pasangan diploid homozigot dan heterozigot

Alih-alih satu pasangan diploid, empat kromosom homolog A, A, a, terbentukdan mereka didistribusikan secara merata antara empat gamet yang terbentuk. Setiap gamet juga menerima salah satu dari kromosom B, B, b, b, yang sesuai dengan sifat kompleks. Distribusi ini terjadi untuk kromosom secara independen antara empat gamet dan antara karakter yang berbeda. Fakta-fakta ini didirikan oleh Mendel dan pada tahun 1865 ia menerbitkan.

Fitur yang paling mengesankan dari kode genetik adalah fleksibilitasnya. Skema yang diberikan (Gbr. 1) dapat berhasil digunakan untuk mendekode RNA hewan dan tumbuhan. Pada tahun 1979, hasilnya muncul pada kode genetik mitokondria, yang berbeda dari nilai-nilai beberapa kodon dalam tabel dan dengan aturan pengakuan kodon lainnya.

Terjemahan dilakukan oleh ribosom - organ khusus sel. Sinkronisasi (pengaturan bingkai bacaan) dilakukan menggunakan awalan, AGGAGGU , yang disebut urutan Shine-Dolgarno. Urutan purin ini hadir dalam kata dalam bentuk tunggal, dan kemungkinan distorsi kecil. Tetapi jika terjadi distorsi, maka tubuh akan berada dalam bencana.

Gambar 1 - Korespondensi kata kode ke asam amino Gambar 2– DNA, mRNA dan protein helix


Gambar 2 menunjukkan bagaimana urutan asam amino dalam molekul protein dikodekan oleh urutan kodon dalam molekul DNA. Di sini, matriks mRNA adalah molekul perantara. Rantainya berbeda sesuai dengan prinsip "ritsleting", di mana peran kunci dimainkan oleh enzim yang memecah molekul melalui ikatan hidrogen.

Dalam sel, kode genetik dilakukan oleh tiga proses matriks: replikasi (terjadi dalam nukleus), transkripsi dan terjemahan .

Transkripsi (perekaman dengan bijaksana DNA β†’ mRNA) adalah proses biologis dalam sel eukariotik yang terjadi dalam inti sel (dipisahkan oleh membran nuklir dari sitoplasma) dan merupakan sintesis molekul i-RNA di bagian DNA yang sesuai. Urutan nukleotida DNA "ditulis ulang" menjadi urutan RNA yang sama.

Terjemahan (membaca dan menerjemahkan RNA β†’ protein) proses biologis dalam sel prokariotik dikombinasikan dengan proses transkripsi, terjadi dalam sitoplasma sel, pada ribosom; urutan nukleotida mRNA diangkut dari nukleus dan diterjemahkan ke dalam urutan asam amino (sintesis rantai polipeptida pada matriks mRNA): tahap ini berlanjut dengan partisipasi dari transportasi RNA (tRNA) dan enzim yang sesuai.
Dengan demikian, terjemahan adalah sintesis protein oleh ribosom berdasarkan informasi yang dicatat dalam matriks mRNA. Untuk mendapatkan 20 asam amino, serta sinyal berhenti, yang menandakan akhir dari urutan protein, tiga nukleotida berturut-turut, yang disebut triplet, sudah cukup.

Organisme hidup didistribusikan di antara tumbuhan dan hewan berdasarkan spesies.
. – , . , , .

Pembelahan sel terdiri dari dua jenis: satu untuk pembentukan sel somatik (sel tubuh), yang lain untuk pembentukan sel germinal (gamet). Jenis organisme ditentukan oleh keberadaan, jumlah dan komposisi kromosom dalam sel organisme yang tidak berubah (konstan).



Pertumbuhan normal dan perkembangan tubuh dipastikan dengan pembentukan dan pertumbuhan sel somatik sebagai hasil dari mitosis. Dalam mitosis, semua kromosom yang terletak di nukleus sel menggandakan sebelum dimulainya pembelahan sel (replikasi DNA) dan didistribusikan secara merata di antara dua sel anak. Himpunan 2n2c kromosom di setiap sel somatik adalah persis sama. Mitosis mempertahankan jumlah kromosom diploid yang konstan dalam sel.

Proses lain meiosis adalah pembentukan gamet, yang diperlukan untuk kelanjutan genus organisme. Pada meiosis, setiap sel membelah dua, dan jumlah kromosom berlipat dua sekali. Meiosis mengarah pada pembentukan sel diploid dengan gamet haploid dengan satu set n2c . Dengan pembuahan berikutnya, gamet membentuk organisme generasi baru dengan kariotipe diploid (nc + nc = 2n2c) .

Mekanisme ini diwujudkan dalam semua spesies yang bereproduksi secara seksual. Meiosis memastikan keteguhan set kromosom (kariotipe) - keturunan, dan penciptaan kombinasi baru gen gen ayah dan ibu.

Pekerjaan yang diusulkan membuka kemungkinan menggunakan kode genetik untuk menyelesaikan tugas-tugas perlindungan informasi. Pemahaman yang benar tentang fenomena alam dan penggunaannya hanya mungkin dilakukan dengan upaya dari pihak peneliti, yang tidak terhenti oleh kesulitan dalam pengetahuan mendalam tentang alam di sekitar kita dan manifestasinya.

All Articles