Informacije

Redundancija genetskog koda

Redundancija genetskog koda


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Jedan određeni kodon kodira samo jednu aminokiselinu, ali aminokiselinu može kodirati nekoliko različitih kodona. Sada prema genetskom kodu, kodonUUUkodovi za aminokiselinu fenilalanin iUUAkodovi za leucin. Ali, prema hipotezi Voble, baza na trećoj poziciji kodona i ona na antikodonu ne moraju biti komplementarne (što pomaže da se objasni zašto postoji vrlo malo tipova tRNK molekula, uprkos tome što postoji 61 kodon). Ako je ova hipoteza tačna, onda bismo mogli imati fenilalanin postavljen na poziciju koja je bila namenjena leucinu, i obrnuto (pošto se kodoni koji ih kodiraju razlikuju samo po svojoj trećoj bazi). Isto važi i za parove kao što su asparaginska kiselina i glutaminska kiselina i serin i arginin. Dakle, kako translacija određenog molekula iRNK rezultira pravom polipeptidnom sekvencom?


Uparivanje kolebanja je samo fenomen, a ne tvrdo pravilo. Postoje neka opravdanja zašto bi trebalo da postoji i zato se još uvek zove hipoteza. A ova izjava nije tačna:“baza na trećoj poziciji kodona i ona na antikodonu ne moraju biti komplementarna". Antikodonski ostatak koji odgovara trećem ostatku kodona može biti a promiskuitetni baza koja se može upariti sa dve ili više različitih baza. tRNA za fenilalanin ima antikodon -GAAkoji se mogu upariti sa obaUUUиUUCали неUUA.

Dakle, izjava hipoteze kolebanja je da prva baza antikodona (često je modifikovana/atipična nukleobaza) može pokazati promiskuitet vezivanja.


U pravu ste kada kažete da je Krik, u svojoj hipotezi Vobble, predložio da „baza na trećoj poziciji kodona i da na antikodonu ne moraju biti komplementarne“, već “ne mora biti” u vašoj izjavi je parafraza "неки" u Crickovoj originalnoj izjavi:

„Preporučuje se da, iako se standardni parovi baza mogu koristiti prilično striktno u prve dve pozicije tripleta, može postojati неки kolebanje u sparivanju treće baze“.

Ako pročitate taj rad – ili pogledate unos na Vikipediji pod Wobble – postaćete svesni da Krik koristi reč „neki“ da bi ukazao na to:

(i) Predloženo kolebanje je specifično za određene parove baza.

(ii) da će se takvi parovi baza kolebanja naći samo u slučajevima kada ne krše genetski kod.

The Wobble Хипотеза - kako je gore navedeno - nedvosmisleno se pokazalo tačnim. Specifičan Wobble Правила da je Krik predložio da zadovolji tačku (i) zasnovani su na ispitivanju hemije baza i pokazalo se da su delimično tačni:

Pravila kolebanja: Krikova predviđanja porekla u poređenju sa uočenim bazama 5'-antikodona i njihovim uparivanje baza sa kodonima.

Dakle, predviđanje da bi 5'-tRNA antikodonske baze, G i I mogli da se kolebaju (a C ne bi mogao) bilo je potvrđeno. Krik je bio svestan nedostatka A na ovoj poziciji u antikodonima, i on i U se obično nalaze u hemijski modifikovanim oblicima, čije uparivanje baza nije pokušao da predvidi (nije bio svestan većine njih) i koji razlikuje se u različitim slučajevima. Ono što treba zapamtiti je da postoji naučno obrazloženje za ovo u smislu trodimenzionalne strukture antikodona u tRNK (koja drži prve dve baze na poziciji slaganjem baza) i blizine grupa koje potencijalno vezuju vodonik. u raznim osnovama.

Tačka (ii) je da će priroda koristiti Wobble samo tamo gde genetski kod dozvoljava. G uparivanje sa C ili U uvek funkcioniše, dok će I uparivanje sa A, C ili G raditi sa amino kiselinama kodiranim sa sve četiri baze u bloku (npr. Leu, Val, Ser), ali ne tamo gde postoje blokovi od dva (npr. Tyr, His, Asn).

Još jedna stvar koja naglašava hemijsku osnovu svega ovoga. Mitohondrije sisara imaju drugačiji skup pravila kolebanja zbog svojih posebno skraćenih tRNK.


Redundancija genetskog koda - Biologija

Do kraja ovog odeljka moći ćete da:

  • Objasnite „centralnu dogmu“ sinteze proteina
  • Opišite genetski kod i kako nukleotidna sekvenca propisuje sekvencu aminokiselina i proteina

Ćelijski proces transkripcije generiše mesindžer RNK (mRNK), mobilnu molekularnu kopiju jednog ili više gena sa abecedom A, C, G i uracil (U). Prevođenje mRNA šablona pretvara genetske informacije zasnovane na nukleotidima u proteinski proizvod. Proteinske sekvence se sastoje od 20 uobičajenih aminokiselina, pa se može reći da se proteinska abeceda sastoji od 20 slova (slika 1). Svaka aminokiselina je definisana sekvencom od tri nukleotida koja se zove triplet kodon. Različite aminokiseline imaju različite hemije (kao što su kisele naspram baznih, ili polarne i nepolarne) i različita strukturna ograničenja. Varijacije u sekvenci aminokiselina izazivaju ogromne varijacije u strukturi i funkciji proteina.

Slika 1. Prikazane su strukture 20 aminokiselina koje se nalaze u proteinima. Svaka aminokiselina je sastavljena od amino grupe (NH+ 3), karboksilnu grupu (COO − ), i bočni lanac (plavo). Bočni lanac može biti nepolaran, polarni ili naelektrisan, kao i veliki ili mali. Raznovrsnost bočnih lanaca aminokiselina dovodi do neverovatnih varijacija strukture i funkcije proteina.


10.4: Genetski kod

  • Doneo E.V. Wong
  • Axolotl Academica Publishing (biologija) u Axolotl Academica Publishing

Mi smo bezbrižno opisali svrhu DNK hromozoma kao nošenje informacija za izgradnju proteina ćelije, a RNK kao posrednika za to. Međutim, kako tačno to da molekul sastavljen od samo četiri različita nukleotida spojena (iako ih ima na hiljade, pa čak i na hiljade hiljada njih), može reći ćeliji koju od dvadesetak aminokiselina da se poveže da formira funkcionalni protein ? Očigledno rešenje je bilo da pošto nema dovoljno pojedinačnih jedinstvenih nukleotida za kodiranje svake aminokiseline, moraju postojati kombinacije nukleotida koje označavaju određene aminokiseline. Dublet kod bi omogućio samo 16 različitih kombinacija (4 moguća nukleotida na prvoj poziciji x 4 moguća nukleotida na drugoj poziciji = 16 kombinacija) i ne bi bio dovoljan da kodira 20 aminokiselina. Međutim, triplet kod bi dao 64 kombinacije, dovoljno lako da kodira 20 aminokiselina. Kao i kod četvorke ili petorke, što se toga tiče, ali to bi bilo rasipanje resursa, a samim tim i manje verovatno. Dalja istraga je dokazala postojanje trojnog koda kao što je opisano u tabeli ispod.

Sa toliko kombinacija i samo 20 aminokiselina, šta ćelija radi sa ostalim mogućnostima? Genetski kod je a degenerisani kod, što znači da postoji redundantnost tako da je većina aminokiselina kodirana sa više od jedne triplet kombinacije (kodon). Iako je redundantni kod, on nije dvosmislen kod: u normalnim okolnostima, dati kodon kodira jednu i samo jednu aminokiselinu. Pored 20 aminokiselina, postoje i tri &ldquostop kodona&rdquo posvećena okončanju prevoda. Tri stop kodona takođe imaju kolokvijalne nazive: UAA (oker), UAG (ćilibar), UGA (opal), pri čemu je UAA najčešći u prokariotskim genima.

Kolokvijalni nazivi su nastali kada su otkrivači UAG-a odlučili da nazovu kodon po prijatelju čije je prezime prevedeno u &ldquoamber&rdquo. Opal i oker su imenovani da nastave sa idejom da se stop kodonima daju imena boja.

Stop kodoni se ponekad koriste i za kodiranje onoga što se danas smatra 21. i 22. aminokiselinama, selenocisteinom (UGA) i pirolizinom (UAG). Otkriveno je da su ove aminokiseline dosledno kodirane u nekim vrstama prokarija i arheja.

Imajte na umu da ne postoje namenski početni kodoni: umesto toga, AUG kodovi za metionin i početak translacije, u zavisnosti od okolnosti, kao što je odmah objašnjeno. Početni Met je metionin, ali kod prokariota, to je posebno modifikovani formil-metionin (f-Met). tRNK je takođe specijalizovana i razlikuje se od tRNK koja nosi metionin do ribozoma radi dodavanja rastućem polipeptidu. Stoga, kada se govori o napunjenoj inicijatorskoj tRNK, uobičajena nomenklatura je fMet-tRNAi ili fMet-tRNAf. Takođe se čini da postoji malo više slobode u definisanju početnog mesta kod prokariota nego kod eukariota, pošto neke bakterije koriste GUG ili UUG. Iako ovi kodoni normalno kodiraju valin, odnosno leucin, kada se koriste kao početni kodoni, inicijatorska tRNA unosi f-Met.

Iako je opisani genetski kod skoro univerzalan, postoje neke situacije u kojima je modifikovan, a modifikacije su zadržane u evolutivno stabilnom okruženju. Mitohondrije u širokom spektru organizama pokazuju stabilne promene u genetskom kodu uključujući pretvaranje AGA iz kodiranja arginina u stop kodon i promenu AAA od kodiranja lizina u kodiranje asparagina. Retko se nađe promena u prevodu organskog (nuklearnog) genoma, ali većina tih retkih promena su konverzije u ili iz stop kodona.

Postoje i druge manje izmene genetskog koda, ali univerzalnost koda generalno ostaje. Neke mitohondrijalne DNK mogu da koriste različite početne kodone: ljudski mitohondrijalni ribozomi mogu da koriste AUA i AUU. Kod nekih vrsta kvasca, kodoni CGA i CGC za arginin se ne koriste. Mnoge od ovih promena katalogizirao je Nacionalni centar za informacije o biotehnologiji (NCBI) na osnovu rada Džuksa i Osave na Kalifornijskom univerzitetu u Berkliju (SAD) i Univerzitetu u Nagoji (Japan), respektivno.


Embrionalne matične ćelije neuronske indukcije

9.3.1 Neuralna indukcija u ESC kod sisara

U nedostatku ubedljivih dokaza iz genetske analize miša, uglavnom zbog genetske redundantnosti o kojoj je ranije bilo reči, ESC predstavljaju možda najpogodniji model za rešavanje dovoljnosti inhibicije BMP za neuralnu indukciju kod sisara. Može se sa sigurnošću pretpostaviti da, kao i kod životinjskih kapa, diferencijacija mišjih i ljudskih ESC prati hijerarhijski skup signala koji regulišu embrionalni razvoj u generisanju zametnih slojeva i specifičnih tipova ćelija (Tomson i Maršal, 1998. Yu i Thomson, 2008).

Pružanje rigoroznog odgovora na ovo pitanje – u ESC-ima sisara uopšte iu hESC-ima posebno – bilo je komplikovano tehničkim ograničenjima svojstvenim in vitro aspekti ćelijske kulture. Na primer, mESC i hESC se rutinski uzgajaju u prisustvu 20% seruma da bi se obezbedili hranljivi sastojci potrebni za rast, tako da su već izloženi kontinuiranom snabdevanju spoljašnjim faktorima. Pored toga, pluripotentne mESC kulture zahtevaju inhibitorni faktor leukemije (LIF) i BMP, zajedno sa pluripotentnim hESC, Wnt, aktivin/nodal, kao i veoma visoke nivoe FGF (Singh i Brivanlou, 2010). Ovi zahtevi za ekstrinzičnu signalizaciju u velikoj meri komplikuju analizu i stvaraju konfuziju u razlikovanju između induktora i modifikatora specifikacije neuronske sudbine. Štaviše, molekularni markeri ljudske embrionalne sudbine specifični za tip ćelije, koji se rutinski koriste kao dijagnostička sudbina ćelije, ekstrapoliraju se iz mišjih embriona. Sve dok se specifičnost ovih markera u ljudskim embrionima ne potvrdi direktno, važno je zapamtiti da ova pretpostavka može biti pogrešna. Konačno, nedostatak in vivo testovi za validaciju in vitro posmatranje predstavlja veliku prepreku u slučaju hESC. Diferencijacije ESC kao jednoslojnih ili embrioidnih tela ili teratoma nisu zamena za in vivo embrionalni testovi. In vitro kulturi ili tumorima nedostaju složene interakcije klica i sloja i morfogenetski pokreti koji se javljaju in vivo, čime ne uspeva da olakša induktivne interakcije. Pokušaji dizajna in vivo esej za hESC formiranjem veoma ranog mišjeg/ljudskog himerizma ne predstavlja savršenu zamenu, pošto pate od tehničkih ograničenja i lošeg preživljavanja (James et al., 2006). Uprkos ovim ograničenjima, dokazano je da su ESC moćni alati u našem trenutnom razumevanju puteva diferencijacije.

Studije koje se bave molekularnom osnovom neuronske specifikacije u ESC-ima sisara se okreću oko tri eksperimentalne paradigme. Prvi je kokultura ESC-a sa različitim dovodnim linijama koje indukuju neuronsku sudbinu. Drugi se zasniva na eliminisanju ili minimiziranju ćelijskog kontakta gajenjem ESC-a u minimalnom medijumu upotrebom visokorazblaženih ploča (uključujući pojedinačne ćelije), čime se oponašaju eksperimenti disocijacije kap-ćelija na životinjama vodozemaca. Konačno, kokteli ili pojedinačni faktori se predstavljaju ćelijama koje se uzgajaju u različitim uslovima kako bi se testirale njihove neuralne aktivnosti. Kombinacije ovih pristupa su uspešno korišćene da se pokaže da je inhibicija BMP dovoljna i kod miševa i kod ljudi ESC da izazove neuralnu sudbinu, pružajući podršku podacima o vodozemcima o inhibiciji BMP i neuralnom podrazumevanom modelu. Dok na kraju dolazimo do zaključaka sličnih ovim, prvo ćemo razgovarati o mišu, a zatim opisati eksperimente na ljudima pre nego što pređemo na podrazumevani model.


Evolucija genetske suvišnosti

Genetska redundantnost znači da dva ili više gena obavljaju istu funkciju i da inaktivacija jednog od ovih gena ima mali ili nikakav uticaj na biološki fenotip. Čini se da je redundantnost široko rasprostranjena u genomima viših organizama. Primeri očigledno suvišnih gena potiču iz brojnih studija razvojne biologije, imunologije, neurobiologije i ćelijskog ciklusa. Ipak, postoji problem: geni koji kodiraju funkcionalne proteine ​​moraju biti pod pritiskom selekcije. Ako je gen zaista suvišan onda ne bi bio zaštićen od akumulacije štetnih mutacija. Zbog toga je široko rasprostranjeno mišljenje da takva redundantnost ne može biti evolutivno stabilna. Ovde razvijamo jednostavan genetski model za analizu pritisaka selekcije koji deluju na redundantne gene. Predstavljamo četiri slučaja koji mogu objasniti zašto je genetska redundantnost uobičajena. U tri slučaja, redundantnost je čak i evolutivno stabilna. Naša teorija pruža okvir za istraživanje evolucije genetske organizacije.


Metode

Model 1. Razmotrite haploidnu populaciju sa genima na dva lokusa, A и B. Nefunkcionalni aleli, a и b, nastaju pri stopama mutacija ua и ub. Postoje četiri genotipa, AB, Ab, aB и ab. Frekvencije su Икс1, Икс2, Икс3 и Икс4, a kondicije su f1, f2, f3 и f4, редом. U svakoj generaciji postoji parenje (sa rekombinacijom), praćeno mutacijom i selekcijom. Parenje je opisano jednačinama razlike: Икс1 = Икс1 + D, Икс2 = Икс2D, Икс3 = Икс3D, и Икс4 = Икс4 + D. ovde, D = r(Икс2Икс3Икс1Икс4), где r je stopa rekombinacije između A и B loci, i r je broj između 0 i 0,5. Mutaciju opisuje Икс1 = Икс1(1 − ua)(1 − ub), Икс2 = Икс1(1 − ua)ub + Икс2(1 − ua), Икс3 = Икс1ua(1 − ub) + Икс3(1 − ub), и Икс4 = Икс1uaub + Икс2ua + Икс3ub + Икс4. Izbor je opisan od Иксi = fiИксi/f, где f = ΣiИксifi označava prosečnu kondiciju stanovništva. Pretpostavimo da oba gena obavljaju funkciju F sa jednakom efikasnošću. Имамо f1 = f2 = f3 = 1 i f4 = 0. Za potpuno jednake stope mutacije, ua = ub = u, postoji linija ravnoteže data sa Икс1 = Икс2Икс3r(1 − u)/u. Za nejednake stope mutacija, gen sa većom stopom mutacije će izumreti.

Model 2. Ovo ima isti okvir kao model 1, ali gene A и B obavljaju funkciju F sa različitom efikasnošću, ha и hb. Дозволити ha > hb. Pogodnosti genotipa su f1 = f2 = ha, f3 = hb и f4 = 0. Redundancija može biti evolutivno stabilna ako B ima nižu stopu mutacije od A, ub < ua. Ako je 1− (hb/ha) > ua > ub[1 + (1/r)(hahb)/hb] ravnoteža je Икс1 * = (1 − Икс2 * ) × [ha(1 − ua) − hb(1 − ub)] / [(hahb)(1 − ua)], Икс2 * = (1/r)[ub/(1 − ub) × [ha(1 − ua) − hb(1 − ub)] / [hb(uaub)], Икс3 * = 1 − Икс1 * − Икс2 * , и Икс4 * = 0. Za niske stope mutacije, ravnotežna frekvencija redundantnog AB genotip je približno Икс1 * ≈ 1 − (1/r)[ub/(uaub)](hahb)/hb. Na primer, ako ha = 1, hb = 0.99, ua = 1.1 × 10 −6 , ub = 10 −6 i r = 0,5, onda je ravnotežna frekvencija od AB je oko 0,8.

Ovaj model se može proširiti na n geni sa različitim stopama mutacija i različitom efikasnošću. Prikladnost određenog genotipa je data efikasnošću najefikasnijeg gena. Ako manje efikasni geni imaju niže stope mutacije onda je moguća stabilnost nekoliko redundantnih gena. Za veliki broj gena, međutim, uslovi efikasnosti i stope mutacije postaju veoma restriktivni.

Model 3. Razmotrite dva gena, A и Bi dve funkcije, F1 и F2. Gene A vrši funkciju F1 sa efikasnošću ha, i gen B vrši funkciju F1 sa manjom efikasnošću hb i funkcija F2 sa efikasnošću od jednog. Mutacije u A dovesti do neaktivne varijante a stopa mutacije je ua. Mutacije u B ili može dovesti do varijante b1, koji je izgubio sposobnost obavljanja funkcije F1 ali ipak izvodi F2, ili na varijantu b2, što je potpuno neaktivno stope mutacija su ub1 и ub2, редом. Varijanta b2 može nastati i iz b1 po stopi mutacije ub3. Suvišna organizacija za obavljanje funkcije F1, je evolutivno stabilan ako ub1 < ua. Analiza je slična modelu 2 ako ub2ub3: za niske stope mutacija, ravnotežna frekvencija od AB je približno Икс1 * ≈ 1 − (1/r)[ub1/(uaub1)] × (hahb)/ha. Za iste numeričke vrednosti kao model 2, i pod pretpostavkom da ub1 je 10 puta manji od ua, nalazimo da je ravnotežna frekvencija od AB je 0,998. Pleiotropija olakšava redundantnost.

Model 4. Razmotrite dva gena A и B sa stopama mutacija ua и ub i stope razvojnih grešaka δa i δb. Mutacija i selekcija su opisani jednačinama razlike Икс1 = (1 − δaδb)(1 − ua)(1 − ub)Икс1/f, Икс2 = (1 − δa) × (Икс1ub + Икс2)/f, Икс3 = (1 − δb)(1 − ub)(Икс1ua + Икс3)/f, Икс4 = 0, gde f je takav da Икс1 + Икс2 + Икс3 = 1. Za razliku od modela 1–3, rekombinacija ovde nije bitna. Ravnotežna frekvencija od AB je Икс1 = 1/<1 + [ua(1 − δb)]/ [δb(1 − δa) − ua(1 − δaδb)] + [ub(1 − δa)] / [δa(1 − δb) − ub(1 − δaδb)]>. Za male vrednosti od u i δ, dobijamo Икс1 ≈ 1/<1 + [ua/(δbua)] + [ub/(δaub)]>. Tako neophodni uslovi za veliku Икс1 su ua < δb и ub < δa.

Model se može proširiti na n gene. Pretpostavimo da svi geni imaju stopu mutacijeu i stopa razvojne greške δ. Дозволити Иксi označavaju genotipove sa i geni (i = 0,…, n). Dinamika stanovništva je Иксnk = (fnk/f) Σi = 0 k (ki ni ) × u ki Иксni, где fj = (1 − δ j )(1 − u) j и f je takav da se sve frekvencije sabiraju jednoj. Ravnoteža se može rešiti rekurzivno. Ravnoteža sa genotipom koji sadrži sve n suvišni geni je moguć ako fn > fn−1. То доводи до n < 1 + (log u)/(log δ).

Diploidni modeli. Naši rezultati za haploidne modele takođe se odnose na diploidne modele. U diploidnim modelima razlikujemo četiri gamete, AB, Ab, aB и ab, koji formiraju devet zigota: AB/AB, AB/Ab, Ab/Ab, AB/aB, aB/aB, AB/ab, Ab/ab, aB/ab и ab/ab. Za svaku generaciju pretpostavljamo da mutacija deluje na frekvenciju gameta, zatim se formiraju zigote, selekcija deluje na zigote i konačno se formiraju nove gamete, uključujući mogućnost rekombinacije. U skladu sa haploidnim modelom 1, nalazimo da je slučaj kada svi zigoti imaju visoku sposobnost osim ab/ab koji ima nisku kondiciju, ne dovodi do stabilnog viška. Slučajevi slični modelima 2 i 3 daju stabilnu redundantnost. Diploidni modeli sa razvojnim greškama takođe daju stabilnu redundantnost.

Postoje neki dodatni slučajevi koji mogu dovesti do redundancije u diploidnim modelima. Jedan takav slučaj je otkrio Brukfild: pretpostavlja se da je dvostruki heterozigot, AB/ab, odgovara kao divlji tip, AB/AB, али Ab/ab, aB/ab и ab/ab imaju nisku kondiciju 1. Pored toga, stabilna redundantnost je takođe moguća za delimičnu dominaciju gde svi homozigoti imaju visoku sposobnost, dvostruki heterozigot ima nižu sposobnost, pojedinačni heterozigoti imaju još nižu sposobnost i ab/ab ima najnižu kondiciju.

Klasifikacija viška. Korisno je razlikovati tri tipa genetske suvišnosti. (1) Pravi višak 1 označava situaciju u kojoj pojedinac sa suvišnim genotipom, AB, nije sposoban od one u kojoj je jedan od suvišnih gena nokautiran, Ab. U modelu 2, B je zaista suvišno, ali A није. U slučajevima sa pleiotropijom, „prava redundantnost“ implicira da potpuno redundantni genotip nije bolji od genotipa gde je pleiotropna funkcija jednog gena eliminisana. (2) „Generički višak“ je slučaj kada an AB pojedinac je samo povremeno sposobniji od a Ab појединац. Ovo može biti posledica retkih razvojnih grešaka. Druga mogućnost je to AB je samo sposobniji od Ab u nekim sredinama. (3) „Skoro redundancija“ znači nego suvišan genotip AB je uvek nešto bolje od bilo kog genotipa gde je jedan od suvišnih gena nokautiran. Naravno, razlika u kondiciji treba da bude mala ako se situacija posmatra kao višak. Nekoliko takvih primera je ranije razmatrano 5 .


Dihotomija ribozomalnog translacionog savijanja

Mehanistički pogled

Nekoliko studija sugeriše da ribozomi koriste višestruke puteve za promovisanje strukturnih formacija u lancima u nastajanju. Ribozomi mogu da promovišu formacije heliksa (Woolhead et al., 2004), zbijanje zaustavljenih lanaca u nastajanju (Lu i Deutsch, 2005) i moguću kotranslacionu formaciju sekundarnih i nekih tercijarnih struktura (Evans et al., 2008 Kosolapov i Deutsch, 2009 ). Kod prokariota ko-translaciono savijanje uključuje faktore okidača i pratioce. Kod eukariota uključuje prvenstveno pratioce i vezujuće proteine. Na primer, tunel ribosoma deluje kao cev koja može da podnese proširene konformacije i sekundarne strukture peptidnog lanca. Obod tunela se sastoji od RNK i ribozomalnih proteina. Ovi proteini su mesta interakcije faktora povezanih sa ribozomima koji se koriste za ciljanje i savijanje peptidnog lanca. Specifični ostaci naelektrisanja peptida u nastajanju usporavaju ili zaustavljaju proces translacije (Kramer et al., 2009). Uočeno je da drugi putevi regulišu sintezu proteina i pomažu u povezivanju faktora kao što je čestica prepoznavanja signala (SRP) (Kramer et al., 2009). Ribozomi prenose signale koji povezuju nastali lanac i njegovu poziciju u tunelu sa njihovom površinom, čime kontrolišu interakcije sa SRP (Walter i Blobel, 1983 Kramer et al., 2009). Vezivanje SRP za belančevine u nastajanju kod eukariota može zaustaviti proces translacije (Kramer et al., 2009). Ribosomalna arhitektura koristi povratne informacije kroz tunelske interakcije i signalizaciju proteina za kontrolu translacionog savijanja (Marin, 2008).

Šaperoni su takođe uključeni u de-novo savijanje proteina. Šaperoni rade zajedno sa ribozomima u njihovoj blizini. Ove ko-translacione aktivnosti pokazuju vremensku orkestraciju i obično deluju nizvodno u procesu savijanja. Veliki broj mehanizama pratioca i njihove vremenske interakcije sa nastalim polipeptidnim lancima deluju na koordinaciju ko-translacionog savijanja tokom njegovih faza rasta. Faktori okidača bakterija su pratioci povezani sa ribozomima. Oni rade zajedno sa nastalim lancima i njihovom blizinom izlaznim tunelima ribozoma. Interakcija faktora okidača sa ribozomom i nastalim lancem je funkcija njihove dužine, sekvence i statusa savijanja (Kaiser et al., 2006 Raine et al., 2006). Smanjenjem brzine preklapanja in vitro и in vivo, pokazalo se da faktori okidača poboljšavaju savijanje modelnih multi-domenskih supstrata (Agashe et al., 2004). Prokarioti koriste faktore pokretača pratioca vezanog za ribozome. Eukarioti koriste faktore kao što su J, Hsp70, Hsp 40 i sisteme zasnovane na proteinima povezanim sa kompleksnim lancem (NAC), zajedno sa drugim takvim mehanizmima.

Co-TP se takođe može indukovati kao odgovor na stres okoline (Liu et al., 2013). Pauziranje omogućava ćelijama da se prilagode promenljivim uslovima životne sredine kao što je toplotni stres. Ova pauza je primećena tamo gde nastali polipeptid izlazi iz ribozomalnog izlaznog tunela. Ovo ima efekat inhibicije operacije pratioca dominantno negativnim mutantom ili drugim hemijskim inhibitorima. Ovo sugeriše dvostruku ulogu pratioca i za elongaciju i za ko-TP (Liu et al., 2013). Studije su pokazale da ribozomi mogu fino podesiti proces elongacije tako što će osetiti i reagovati na međućelijsko okruženje.

Unutrašnja kontrola (nukleotidni aranžman)

TP proteina u nastajanju je takođe povezan sa rasporedom nukleotida u mRNK, kao i sa delovima regiona koji kodiraju nukleotide koji destabilizuju ili prekidaju sintezu proteina. Pauziranje može biti izazvano strukturom mRNA (Somogyi et al., 1993), vezivanjem SRP (Lipp et al., 1987), proteinima koji vezuju mRNA, retkim kodonima (Varenne et al., 1984) i anti-Shine-Dalgarno (aSD ) sekvence kodona (Li et al., 2012). Pokazalo se da zamena retkih kodona sa obilnijim kodonima u Escherichia coli ili Saccharomyces cerevisiae je rezultiralo bržim translacijama proteina. Ali, ovi faktori takođe negativno smanjuju aktivnost tih proteina (Crombie et al., 1992 Komar et al., 1999). Ova tiha mutageneza je rezultirala 20% nižom specifičnom aktivnošću što je dovelo do povećanog nivoa pogrešnog savijanja. Dalje, pokazalo se da je efikasnost savijanja višedomenskog proteina u E. coli je uznemiren sinonimnim supstitucijama retkih kodona obilnim tRNK (Zhang et al., 2009). Međutim, podaci pokazuju da se sa fiksnim nivoima tRNA', sinonimno kodirane mRNA' prevode različitim brzinama (Sorensen et al., 1989 Sorensen i Pedersen, 1991 Li et al., 2012). Na primer, tiha mutacija u humanom genu ABCB1 izazvala je konformacionu promenu u P-glikoproteinu. Ovaj protein se drugačije savijao uzrokovano vremenskom promenom u translaciji koja utiče na vreme procesa savijanja (Kimchi-Sarfaty et al., 2007). Dakle, na puteve savijanja proteina utiču promene u kodirajućim regionima DNK.

Primer vezivanja čestica za mRNK može se naći u regionu od 249 nukleotida c-myc iRNK poznatom kao determinanta nestabilnosti regiona kodiranja (CRD) (Lemm i Ross, 2002). Pretpostavlja se da se TP javlja u CRD regionu, što uzrokuje da nizvodni regioni c-myc mRNK budu podložni cepanju endonukleaze (Lemm i Ross, 2002). Ovaj napad se može desiti tokom vremena pauze osim ako se određeni vezujući proteini (CRD-BP) ne vežu za ovaj region koji ga štiti od procesa endonukleaze. Mesta pauze se javljaju unutar CRD c-myc regiona i mapiraju se na retke argininske (CGA) i susedne treoninske (ACA) kodone (Lemm i Ross, 2002). Podaci iz Lemma (Lemm i Ross, 2002) pokazuju da se mesta pauze takođe javljaju na različitim kodonima unutar CRD. Međutim, prvi argininski kodon je najjače mesto. Promena i argininskog CGA i treoninskog ACA kodona u uobičajenije sinonimne kodone nije izazvala pauzu ribozoma. Ovo podržava tvrdnju da su CGA i ACA kodoni mesto za pauzu (Lemm i Ross, 2002), pošto CGA i ACA proizvode pauzu, dok njihova zamena sinonimnim kodonima ne daje efekat pauze.

Nedavni rad je izgrađen na gore navedenim zapažanjima koja pokazuju jaku vezu između specifičnih rasporeda kodona u iRNK i stope translacije (Li et al., 2012). Parovi kodona unutar kodirajućih regiona koji su slični Shine Dalgarno (SD) sekvencama pokazali su direktnu korelaciju sa TP. Kod bakterija, započinjanju procesa translacije prethodi sticanje sekvence od šest nukleotidnih elemenata poznate kao SD sekvenca. Obično ova SD sekvenca prethodi kodirajućem regionu transkripta mRNK i omogućava vezivanje ribozoma na početnom kodonu (Chen et al., 1994). SD sekvenca je generalno uzvodno od startnog kodona AUG (Shine i Dalgarno, 1975). Brzina translacije je funkcija slobodne energije hibridizacije heksanukleotida u aSD sekvencu u 16S rRNK ribozoma. Ove neuniformne stope zavise od ugrađenog koda (u obliku sličnih aSD sekvenci) unutar tela kodirajućih regiona genetske poruke sadržane u transkriptu mRNK (Li et al., 2012). Pokazalo se da prolazne pauze utiču na ko-translaciono savijanje proteina u nastajanju modulacijom procesa elongacije (Li et al., 2012). Ova vremenska kontrola igra glavnu ulogu u propisivanju funkcionalnosti proteina.

TP je do sada proučavan kod vrlo malo nebakterijskih vrsta. Shalgi et al. (2013) su prijavili dokaze o TP koji je rezultirao pauzom elongacije zbog događaja toplotnog šoka u ćelijama miša i čoveka. Pogrešno savijanje proteina u citoplazmi i tokom translacije, pokreće ćeliju da reaguje korišćenjem pojačano regulisane ekspresije proteina toplotnog šoka. Tokom događaja toplotnog stresa, TP se pokreće u ribozomu oko kodona 65 u većini mišjih i ljudskih ćelija. Predloženo je da ovaj fenomen koji obuhvata čitav genom uključuje pratioce povezane sa ribozomima. Regulatorni mehanizmi mogu biti uključeni u TP oko kodona 65 većine mRNK gena, što dovodi do elongacijske pauze u kojoj se određena klasa pratioca koristi da odgovori na pogrešno savijanje izazvano toplotom (Richter et al., 2010). Još uvek ostaje da se vidi da li kodoni na poziciji kodona 65 pokazuju vremensko podešavanje kao funkciju redundancije kodona.

Zajednička nit između mehaničke i interne kontrole

Zajednička nit postoji između mehaničkog izvođenja procesa savijanja (izlazni tunel/faktori/pratioci) do unutrašnjih procesa mRNA koji su uključeni u savijanje proteina u nastajanju. Mi tvrdimo da je uzročna veza sa ko-translacionim savijanjem posledica propisanog rasporeda kodona unutar iRNK. Ovo zasnivamo na činjenici da su za faktore okidača, pratioci i vezujući proteini povezani sa sekvencom lanca aminokiselina u nastajanju. Aminokiselinska sekvenca, kao neophodna posledica, ukazuje na sekvence mRNK. Dalje tvrdimo da se interakcije sa pauziranjem translacije mogu pratiti do specifičnih aranžmana redundantnih kodona u mRNK, i na kraju do genoma. Predlažemo da se funkcije pauze olakšaju tako što se prvo generiše stanje pauze u translaciji kodona mRNK unutar ribozoma. Ovo daje proteinskim faktorima, faktorima okidača i drugim pratiocima potrebno vreme da mehanički izvrše operacije savijanja.

“PFunkcija pauziranja” je uzrokovana specifičnim sekvencama kodona mRNA, a ne interakcijama tunela i proteina sa sekvencama aminokiselina. Ovu tvrdnju podržavaju podaci koji uključuju zamenu retkih kodona sinonimnim kodonima u E. coli. Ako je efekat pauze bio isključivo povezan sa sekvencom lanca aminokiselina, onda bi zamena kodona sinonimnim kodonima i dalje trebalo da proizvede isti presavijeni lanac aminokiselina sa istom brzinom translacije. Međutim, zamena retkih kodona sinonimnim kodonima jeste dovela do promene u brzini i promenama konformacije (Gong i Yanofsky, 2002 Lemm i Ross, 2002 Chiba et al., 2011 Li et al., 2012).

Globalna analiza kod bakterija pokazuje da se 70% jakih pauziranja dešava kada su unutrašnje sekvence slične SD dominantne u kodirajućim regionima (Li et al., 2012). Treba napomenuti da su kanonska SD mesta unutar tela kodirajućih regiona retka za razliku od heksamera niskog afiniteta koji imaju promenljivu stopu pojavljivanja. Ova logika je u skladu sa hipotezom da je uzročnost TP posledica sekvence kodona, koja se na kraju može pratiti do genoma. Ova uzročno-posledična veza pruža koherentno objašnjenje za uzročnost TP fenomena.

Koristeći ovo rezonovanje, ispitali smo SD sekvence u iRNK koja dovodi do pauze translacije unutar ribozoma. Ispitali smo ovaj fenomen da bismo utvrdili da li je kod uključen, sa inherentnom redundantnošću genetskog koda. Detaljno smo ispitali ove podatke i pokazaćemo da oni pokazuju svojstva koda koji se koristi da omogući savijanje proteina. Pokazaćemo da se ovaj kod nalazi u istoj ontološkoj preskriptivnoj informaciji (PIo) prostor kao genetski kod koji se koristi u procesu sinteze proteina. Ova dvostruka upotreba istog koda unutar kodirajućih regiona gena bi se normalno kontrolisala semiotički ako bi svaki kodon imao samo jedno mapiranje na svoju odgovarajuću amino kiselinu. Međutim, poznato je da je genetski kod suvišan, što znači da više kodona može propisati istu aminokiselinu. Pokazaćemo da je ova redundantnost upravo ono što omogućava dvostrukoj funkcionalnosti genetskog koda da kodira simultane funkcije unutar istog prostora kodiranja, i koristeći isti niz nukleotida bez dvosmislenosti. Na taj način pokazujemo zašto je izraz �generacija” potpuno neprikladan. Funkcionalnost dvostrukog kodiranja redundanse je sve samo ne �generisana.” Ona predstavlja, umesto toga, mnogo više sofisticiranosti, slojeva i dimenzija formalnog recepta.

We posit that the translation pausing function is enabled by a code that is superimposed upon the genetic code, yet remains distinct and independent from the genetic code. We further posit that the genetic code consist of multi-threads of information co-existing in the same physical space which is made possible by the redundancy of the genetic code itself. To support these propositions we begin by examining the data for aSD hexamer sequences to determine the logic and rules that give it the property of code.


Genetic code redundancy and its influence on the encoded polypeptides

The genetic code is said to be redundant in that the same amino acid residue can be encoded by multiple, so-called synonymous, codons. If all properties of synonymous codons were entirely equivalent, one would expect that they would be equally distributed along protein coding sequences. However, many studies over the last three decades have demonstrated that their distribution is not entirely random. It has been postulated that certain codons may be translated by the ribosome faster than others and thus their non-random distribution dictates how fast the ribosome moves along particular segments of the mRNA. The reasons behind such segmental variability in the rates of protein synthesis, and thus polypeptide emergence from the ribosome, have been explored by theoretical and experimental approaches. Predictions of the relative rates at which particular codons are translated and their impact on the nascent chain have not arrived at unequivocal conclusions. This is probably due, at least in part, to variation in the basis for classification of codons as "fast" or "slow", as well as variability in the number and types of genes and proteins analyzed. Recent methodological advances have allowed nucleotide-resolution studies of ribosome residency times in entire transcriptomes, which confirm the non-uniform movement of ribosomes along mRNAs and shed light on the actual determinants of rate control. Moreover, experiments have begun to emerge that systematically examine the influence of variations in ribosomal movement and the fate of the emerging polypeptide chain.


Референце

Amoeba Sisters. (2019, September 17). How to read a codon chart. ЈуТјуб. https://www.youtube.com/watch?v=LsEYgwuP6ko&feature=youtu.be

Bozeman Science. (2012, September 15). Comparing DNA sequences. ЈуТјуб. https://www.youtube.com/watch?v=OSKwuOccAak&feature=youtu.be

Wikipedia contributors. (2020, July 2). Marshall Warren Nirenberg. In Wikipedia. https://en.wikipedia.org/w/index.php?title=Marshall_Warren_Nirenberg&oldid=965562106

Najmanja jedinica života, koja se sastoji od najmanje membrane, citoplazme i genetskog materijala.

Nukleinska kiselina za koju je sada poznato mnogo različitih vrsta, uključujući RNK za prenos, RNK za prenos i ribozomalnu RNK.

Sekvenca od 3 nukleotida DNK ili RNK koja odgovara specifičnoj aminokiselini ili stop signalu tokom sinteze proteina.

Aminokiseline su organska jedinjenja koja se kombinuju i formiraju proteine.

Specifična lokacija u DNK gde će skup kodona kodirati određeni protein. Okvir čitanja počinje početnim kodonom (AUG).

Deoksiribonukleinska kiselina - molekul koji nosi genetska uputstva za razvoj, funkcionisanje, rast i reprodukciju svih poznatih organizama i mnogih virusa.

Velika porodica molekula RNK koji prenose genetske informacije od DNK do ribozoma, gde određuju sekvencu aminokiselina proteinskih proizvoda ekspresije gena.


Sadržaj

There are many theories behind the origin of genetic codes. The genetic code used by all known forms of life is nearly universal. However, there are a huge number of possible genetic codes. If amino acids are randomly associated with triplet codons, there will be 1.5 x 10 84 possible genetic codes. Phylogenetic analysis of transfer RNA suggests that tRNA molecules evolved before the present set of aminoacyl-tRNA synthetases.

Theoretically the genetic code could be completely random (a "frozen accident"), completely non-random (optimal) or a combination of random and nonrandom. There are sufficient data to refute the first possibility. For a start, a quick view on the table of the genetic code already shows a clustering of amino acid assignments. Furthermore, amino acids that share the same biosynthetic pathway tend to have the same first base in their codons, and amino acids with similar physical properties tend to have similar codons.

There are four themes running through the many theories that seek to explain the evolution of the genetic code (and hence the origin of these patterns):

1. Chemical principles govern specific RNA interaction with amino acids. Aptamer experiments showed that some amino acids have a selective chemical affinity for the base triplets that code for them. Recent experiments show that of the 8 amino acids tested, 6 show some RNA triplet-amino acid association. This has been called the stereochemical code. The stereochemical code could have created an ancient core of assignments. The current complex translation mechanism involving tRNA and associated enzymes may be a later development, and that originally, protein sequences were directly templated on base sequences.

2. Biosynthetic expansion. The standard modern genetic code grew from a simpler earlier code through a process of "biosynthetic expansion". Here the idea is that primordial life "discovered" new amino acids (e.g., as by-products of metabolism) and later back-incorporated some of these into the machinery of genetic coding. Although much circumstantial evidence has been found to suggest that fewer different amino acids were used in the past than today, precise and detailed hypotheses about exactly which amino acids entered the code in exactly what order have proved far more controversial.

3. Natural selection has led to codon assignments of the genetic code that minimize the effects of mutations. A recent hypothesis suggests that the triplet code was derived from codes that used longer than triplet codons. Longer than triplet decoding has higher degree of codon redundancy and is more error resistant than the triplet decoding. This feature could allow accurate decoding in the absence of highly complex translational machinery such as the ribosome.

4. Information channels: Information-theoretic approaches see the genetic code as an error-prone information channel. The inherent noise (i.e. errors) in the channel poses the organism with a fundamental question: how to construct a genetic code that can withstand the impact of noise while accurately and efficiently translating information? These “rate-distortion” models suggest that the genetic code originated as a result of the interplay of the three conflicting evolutionary forces: the needs for diverse amino-acids, for error-tolerance and for minimal cost of resources. The code emerges at a coding transition when the mapping of codons to amino-acids becomes nonrandom. The emergence of the code is governed by the topology defined by the probable errors and is related to the map coloring problem.

Ribonucleic acid (RNA) with two repeating units (UCUCUCU → UCU CUC UCU) produced two alternating amino acids. This, combined with the Nirenberg and Leder experiment, showed that UCU codes for Serine and CUC codes for Leucine. RNAs with three repeating units (UACUACUA → UAC UAC UAC, or ACU ACU ACU, or CUA CUA CUA) produced three different strings of amino acids. RNAs with four repeating units including UAG, UAA, or UGA, produced only dipeptides and tripeptides thus revealing that UAG, UAA and UGA are stop codons. With this, Khorana and his team had established that the mother of all codes, the biological language common to all living organisms, is spelled out in three-letter words: each set of three nucleotides codes for a specific amino acid. Their Nobel lecture was delivered on December 12, 1968. To do this Khorana was also the first to synthesize oligonucleotides, that is, strings of nucleotides.

The table of Genetic Code Edit

2nd base
T C A G
1st base T TTT (Phe/F) Phenylalanine TCT (Ser/S) Serine TAT (Tyr/Y) Tyrosine TGT (Cys/C) Cysteine
TTC (Phe/F) Phenylalanine TCC (Ser/S) Serine TAC (Tyr/Y) Tyrosine TGC (Cys/C) Cysteine
TTA (Leu/L) Leucine TCA (Ser/S) Serine TAA Ochre (Зауставити) TGA Opal (Зауставити)
TTG (Leu/L) Leucine TCG (Ser/S) Serine TAG Amber (Зауставити) TGG (Trp/W) Tryptophan
C CTT (Leu/L) Leucine CCT (Pro/P) Proline CAT (His/H) Histidine CGT (Arg/R) Arginine
CTC (Leu/L) Leucine CCC (Pro/P) Proline CAC (His/H) Histidine CGC (Arg/R) Arginine
CTA (Leu/L) Leucine CCA (Pro/P) Proline CAA (Gln/Q) Glutamine CGA (Arg/R) Arginine
CTG (Leu/L) Leucine CCG (Pro/P) Proline CAG (Gln/Q) Glutamine CGG (Arg/R) Arginine
A ATT (Ile/I) Isoleucine ACT (Thr/T) Threonine AAT (Asn/N) Asparagine AGT (Ser/S) Serine
ATC (Ile/I) Isoleucine ACC (Thr/T) Threonine AAC (Asn/N) Asparagine AGC (Ser/S) Serine
ATA (Ile/I) Isoleucine ACA (Thr/T) Threonine AAA (Lys/K) Lysine AGA (Arg/R) Arginine
ATG (Met/M) Methionine ACG (Thr/T) Threonine AAG (Lys/K) Lysine AGG (Arg/R) Arginine
G GTT (Val/V) Valine GCT (Ala/A) Alanine GAT (Asp/D) Aspartic acid GGT (Gly/G) Glycine
GTC (Val/V) Valine GCC (Ala/A) Alanine GAC (Asp/D) Aspartic acid GGC (Gly/G) Glycine
GTA (Val/V) Valine GCA (Ala/A) Alanine GAA (Glu/E) Glutamic acid GGA (Gly/G) Glycine
GTG (Val/V) Valine GCG (Ala/A) Alanine GAG (Glu/E) Glutamic acid GGG (Gly/G) Glycine
nonpolar polarni osnovni kiselo (stop codon)

Degeneracy is the redundancy of the genetic code. The genetic code has redundancy but no ambiguity ( above for the full correlation). For example, although codons GAA and GAG both specify glutamic acid (redundancy), neither of them specifies any other amino acid (no ambiguity). The codons encoding one amino acid may differ in any of their three positions. For example the amino acid glutamic acid is specified by GAA and GAG codons (difference in the third position), the amino acid leucine is specified by UUA, UUG, CUU, CUC, CUA, CUG codons (difference in the first or third position), while the amino acid serine is specified by UCA, UCG, UCC, UCU, AGU, AGC (difference in the first, second or third position).

A position of a codon is said to be a fourfold degenerate site if any nucleotide at this position specifies the same amino acid. For example, the third position of the glycine codons (GGA, GGG, GGC, GGU) is a fourfold degenerate site, because all nucleotide substitutions at this site are synonymous i.e., they do not change the amino acid. Only the third positions of some codons may be fourfold degenerate. A position of a codon is said to be a twofold degenerate site if only two of four possible nucleotides at this position specify the same amino acid. For example, the third position of the glutamic acid codons (GAA, GAG) is a twofold degenerate site. In twofold degenerate sites, the equivalent nucleotides are always either two purines (A/G) or two pyrimidines (C/U), so only transversional substitutions (purine to pyrimidine or pyrimidine to purine) in twofold degenerate sites are nonsynonymous.

A position of a codon is said to be a non-degenerate site if any mutation at this position results in amino acid substitution. There is only one threefold degenerate site where changing to three of the four nucleotides may have no effect on the amino acid (depending on what it is changed to), while changing to the fourth possible nucleotide always results in an amino acid substitution. This is the third position of an isoleucine codon: AUU, AUC, or AUA all encode isoleucine, but AUG encodes methionine. In computation this position is often treated as a twofold degenerate site.

There are three amino acids encoded by six different codons: serine, leucine, and arginine. Only two amino acids are specified by a single codon. One of these is the amino-acid methionine, specified by the codon AUG, which also specifies the start of translation the other is tryptophan, specified by the codon UGG. The degeneracy of the genetic code is what accounts for the existence of synonymous mutations.

Degeneracy results because there are more codons than encodable amino acids. For example, if there were two bases per codon, then only 16 amino acids could be coded for (4²=16). Because at least 21 codes are required (20 amino acids plus stop), and the next largest number of bases is three, then 4³ gives 64 possible codons, meaning that some degeneracy must exist.

These properties of the genetic code make it more fault-tolerant for point mutations. For example, in theory, fourfold degenerate codons can tolerate any point mutation at the third position, although codon usage bias restricts this in practice in many organisms twofold degenerate codons can tolerate one out of the three possible point mutations at the third position. Since transition mutations (purine to purine or pyrimidine to pyrimidine mutations) are more likely than transversion (purine to pyrimidine or vice-versa) mutations, the equivalence of purines or that of pyrimidines at twofold degenerate sites adds a further fault-tolerance.

Despite the redundancy of the genetic code, single point mutations can still cause dysfunctional proteins. For example, a mutated hemoglobin gene causes sickle-cell disease. In the mutant hemoglobin a hydrophilic glutamate (Glu) is substituted by the hydrophobic valine (Val), that is, GAA or GAG becomes GUA or GUG. The substitution of glutamate by valine reduces the solubility of Beta globulins|β-globin which causes hemoglobin to form linear polymers linked by the hydrophobic interaction between the valine groups, causing sickle-cell deformation of erythrocytes. Sickle-cell disease is generally not caused by a de novo mutacija. Rather it is selected for in geographic regions where malaria is common (in a way similar to thalassemia), as heterozygous people have some resistance to the malarial Plasmodium parasite (heterozygote advantage). [5]

These variable codes for amino acids are allowed because of modified bases in the first base of the anticodon of the tRNA, and the base-pair formed is called a wobble base pair. The modified bases include inosine and the Non-Watson-Crick U-G basepair. [6]

Initiation or Start Codon Edit

The start codon is generally defined as the point, sequence, at which a ribosome begins to translate a sequence of RNA into amino acids. When an RNA transcript is "read" from the 5' carbon to the 3' carbon by the ribosome the start codon is the first codon on which the tRNA bound to Met, methionine, and ribosomal subunits attach. ATG and AUG denote sequences of DNA and RNA, respectively, that are the start codon or initiation codon encoding the amino acid methionine (Met) in eukaryotes and a modified Met (fMet) in prokaryotes. The principle called the Central dogma of molecular biology describes the process of translation of a gene to a protein. Specific sequences of DNA act as a template to synthesize mRNA in a process termed "transcription" in the nucleus. This mRNA is exported from the nucleus into the cytoplasm of the cell and acts as a template to synthesize protein in a process called "translation." Three nucleotide bases specify one amino acid in the genetic code, a mapping encoded in the tRNA of the organism. The first three bases of the coding sequence (CDS) of mRNA to be translated into protein are called a start codon or initiation codon. The start codon is almost always preceded by an untranslated region 5' UTR. The start codon is typically AUG (or ATG in DNA this also encodes methionine). Very rarely in higher organisms (eukaryotes) are non AUG start codons used. In addition to AUG, alternative start codons, mainly GUG и UUG are used in prokaryotes. For example E. coli uses 83% ATG (AUG), 14% GTG (GUG), 3% TTG (UUG) and one or two others (e.g., ATT and CTG).

Termination or Stop codon Edit

In the genetic code, a stop codon (also known as termination codon) is a nucleotide triplet within messenger RNA that signals a termination of translation. Proteins are based upon polypeptides, which are unique sequences of amino acids and most codons in messenger RNA correspond to the addition of an amino acid to a growing polypeptide chain, which may ultimately become a protein — stop codons signal the termination of this process, releasing the amino acid chain.

Stop codons were historically given many different names, as they each corresponded to a distinct class of mutants that all behaved in a similar manner. These mutants were first isolated within bacteriophages (T4 and lambda), viruses that infect the bacteria Escherichia coli. Mutations in viral genes weakened their infectious ability, sometimes creating viruses that were able to infect and grow within only certain varieties of E coli.

1. Amber mutations were the first set of nonsense mutations to be discovered. They were isolated by Richard Epstein and Charles Steinberg, but named after their friend Harris Bernstein (see Edgar pgs. 580-581 [7] ) for the story behind this incident)

Viruses with amber mutations are characterized by their ability to infect only certain strains of bacteria, known as amber suppressors. These bacteria carry their own mutation that allow a recovery of function in the mutant viruses. For example, a mutation in the tRNA that recognizes the amber stop codon allows translation to "read through" the codon and produce full-length protein, thereby recovering the normal form of the protein and "suppressing" the amber mutation. Thus, amber mutants are an entire class of virus mutants that can grow in bacteria that contain amber suppressor mutations.

2.Ochre Ochre mutation was the second stop codon mutation to be discovered. Given a color name to match the name of amber mutants, ochre mutant viruses had a similar property in that they recovered infectious ability within certain suppressor strains of bacteria. The set of ochre suppressors was distinct from amber suppressors, so ochre mutants were inferred to correspond to a different nucleotide triplet. Through a series of mutation experiments comparing these mutants with each other and other known amino acid codons, Sydney Brenner concluded that the amber and ochre mutations corresponded to the nucleotide triplets "UAG" and "UAA". [8]

3. Opal mutations or umber mutations the third and last stop codon in the standard genetic code was discovered soon after, corresponding to the nucleotide triplet "UGA". Nonsense mutations that created this premature stop codon were later called opal mutations or umber mutations.

In RNA: UAG ("amber") UAA ("ochre") UGA ("opal")

In DNA: TAG ("amber") TAA ("ochre") TGA ("opal" or "umber").

Exceptions to the Universal Genetic Code (UGC) in mitochondria
Organizam Codon Standard Роман
sisara AGA, AGG arginin Stop codon
AUA Isoleucine metionin
UGA Stop codon Triptofan
Beskičmenjaci AGA, AGG arginin Serine
AUA Isoleucine metionin
UGA Stop codon Triptofan
Квасац AUA Isoleucine metionin
UGA Stop codon Triptofan
CUA Leucine Treonin

Exceptions to the genetic code: Although the vast majority of living organisms today use the standard genetic code, geneticists have discovered a few variations on this code. Moreover, these variants are found in different evolutionary lineages and consist of different translations of a few codons.

The CUG codon, usually translated as leucine , corresponds to the serine 2 in many species of fungi Candida 3 .

Many species of green algae of the genus Acetabularia use stop codons UAG and UAA to encode glycine .

Many ciliates like Paramecium tetraurelia , Tetrahymena thermophila or Stylonychia 4 lemnae use codons UAG and UAA to code for glutamine instead of stop. UGA is the one stop codon used by these cells.

The ciliate Euplotes octocarinatus uses the codon UGA to encode cysteine, leaving UAG and UAA as stop signs.

In the three kingdoms of life , we sometimes find a twenty-first amino acid, selenocysteine , encoded by the UGA codon (normally a stop codon).

In archaea and eubacteria , a twenty-second amino acid, pyrrolysine is sometimes met, encoded by UAG (also usually a stop codon).

The first amino acid incorporated (determined by the start codon AUG) is a methionine in most eukaryotes , more rarely a valine (in some eukaryotes ), and formyl-methionine in most prokaryotes . In addition, this codon is GUG or GUU sometimes in some prokaryotes.

We therefore believe that life today originally had a smaller number of amino acids. These amino acids have been modified and have seen their numbers increase (by a phenomenon similar to the formation of sélénocytéine and pyrrolysine derived from serine and lysine, respectively, modified as they are on their transfer RNA on the ribosome .) These new amino acids were then used a subset of transfer RNAs and their associated coding. Maybe we notice signs of this phenomenon with glutamine , which in some bacteria, derived from glutamate still attached to its tRNA.

Another exception: the code is sometimes ambiguous. For example, the codon UGA is in the same organism ( Escherichia coli , for example) sometimes code for the 21st amino acid mentioned above ( selenocysteine ) or "stop".