A Cistanche Deserticola húsos szár transzkriptum-összeállítása és génfelfedezése-Ⅰ

Sep 06, 2024

Hátterek

A Cistanche deserticola egy teljesen nem fotoszintetikus parazita növény, nagy gyógyászati ​​értékkel, és főleg Északnyugat-Kína sivatagában terjesztik. Szárított, húsos szára döntő fontosságú tonikhagyományos kínai orvoslásfőként a férfiak szexuális funkcióinak javítása és az immunitás erősítése szerepe van, de kevés mechanisztikus vizsgálatot végeztek, részben a genomikai és transzkriptomikai erőforrások hiánya miatt.

Natural cistanche tubulosa

TERMÉSZETES CISTANCHE TUBULOSA KÍNAI HAGYOMÁNYOS GYÓGYSZER PHGS75% ECH 30% ACT 12%

Eredmények

Ebben a tanulmányban mély transzkriptom szekvenálást végeztünk a C. deserticola húsos szárán, és körülbelül 80 millió leolvasást generáltunk az Illumina párvégű szekvenálás segítségével a HiSeq2000 platformon. A trinity assembler használatával 95 787 transzkriptum szekvenciát kaptunk 200 bp és 15 698 bp közötti transzkriptumhosszúsággal, átlagos hossza 950 bázis és N50 hossza 1519 bázis. 63 957 transzkriptumot azonosítottak úgy, hogy aktívan expresszálódnak FPKM 0,5-nél nagyobb vagy egyenlő, amelyekben 30 098 transzkriptumot génleírásokkal vagy génontológiai kifejezésekkel láttak el a szekvenciahasonlósági elemzések segítségével több nyilvános adatbázis (Uniprot, NR és Nt az NCBI-nál és KEGG) alapján. . Ezenkívül azonosítottuk a lignin és a fenil-etanol-glikozidok (PhG-k) bioszintézisében részt vevő kulcsfontosságú enzimgéneket, amelyekről ismert, hogy az elsődleges hatóanyagok. Szekvencia-összehasonlítás és filogenetikai analízis alapján négy fenilalanin ammónia-liáz (PAL) gént azonosítottunk, amely a lignin és PhG bioszintézis első kulcsenzime. A PhG-k két bioszintézisútját is először javasolták.

Következtetések

Összességében elvégeztük a C. deserticola húsos szár transzkriptomjának globális elemzését RNA-seq technológia segítségével. Az összeállított és annotált transzkriptumokból a lignin és a fenil-etanoid glikozidok bioszintézisével kapcsolatos enzimgének gyűjteményét azonosították, és megjósolták a PAL géncsaládját is. Az ebből a tanulmányból származó szekvenciaadatok értékes forrást biztosítanak a jövőbeni fenil-etanol-glikozidok bioszintézis-kutatásához és funkcionális genomikai vizsgálatokhoz ebben a fontos gyógynövényben.

Bevezetés

A C. deserticola az Orobanchaceae családból származó évelő sivatagi növények világméretű nemzetsége, és egy teljesen nem fotoszintetikus faj, és általában a föld alatti holoparazita növény. A Haloxylon ammodendron (Chenopodiaceae) psammofita gyökerein élősködik, amely főként sivatagokban és félsivatagokban él, köszönhetően a szárazságnak és a sótartalomnak. A C. deserticola erősen ellenáll a zord környezeti feltételeknek, és főként Északnyugat-Kínában, különösen Belső-Mongóliában, Gansuban és Hszincsiangban elterjedt. Az utóbbi években a megnövekedett emberi fogyasztás miatt veszélyeztetett vadon élő fajnak számít. A C. deserticolát, amelyet gyakran sivatagi ginzengnek is neveznek, sivatagi seprűként ismerik, és a szárított húsos szárat Kínában és Japánban már évek óta széles körben használják hagyományosan fontos tonikként. Eredetileg a Shen Nong Ben Cao Jingben (Kínai Materia Medica szótár, 1977) jegyezték fel körülbelül 1800 évvel ezelőtt, és az egyik fő forrásnak tekintették.Kínai gyógynövény Cistanche.

Chinese cistanche tubulosa

TERMÉSZETES CISTANCHE TUBULOSA A SZEXUÁLIS FUNKCIÓ JAVÍTÁSÁRA PHGS75% ECH 30% ACT 12%

A C. deserticola kivonatai számos gyógyászati ​​funkcióval rendelkeznek, különösen a szexuális funkciók javításában, a vesék tonizálásában, a máj védelmében, a periódus aktivitásában, a memória javításában, az immunmoduláló, antioxidáns, gyulladáscsökkentő, vírusellenes aktivitásban stb. A C. deserticola fő bioaktív komponensei a feniletanoid-glikozidok (PheG-k, PhG-k). Eddig több mint 20 fenil-etanol-glikozidot izoláltak a C. deserticola zamatos szárából. Köztükakteozid és echinakozidkét fő összetevő, amelyek jelentős farmakológiai aktivitással rendelkeznek, és a kínai gyógyszerkönyvben (2005-ös és 2010-es kiadások) a C. deserticola minőségi szabványaként dokumentálják. A PhG-k három kémiai komponense a szerves sav, a szacharid és a fenil-etanoid, azonban a fenil-etanoid bioszintetikus folyamatainak részletei továbbra is kevéssé ismertek a C. deserticola esetében.

A C. deserticola kereskedelmi és gyógyászati ​​jelentősége ellenére e faj genomikai és transzkriptomikai adatai nagyon korlátozottak. Az NCBI-adatbázisban nem állnak rendelkezésre EST-k, és ennek a fajnak a teljes genominformációi nem állnak rendelkezésre, kivéve a kloroplaszt genomszekvenciáját. A korlátozott transzkriptomikai adatok hátráltatják a PhG bioszintetikus mechanizmusainak tanulmányozását. Az RNS-seq technológia az NGS technológiai platformok (például Applied Biosystems SOLiD, Illumina HiSeq és Roche 454) segítségével szekvenciákat generálhat a megcélzott genom kifejezett részeiről, és azonosíthatja a géneket [18]. Egyre népszerűbb a transzkriptum de novo összeállításban, mivel ez egy költséghatékony és hatékony megközelítés nagy felbontással és széles dinamikatartománnyal, különösen azért, mert előnye az alacsony gyakoriságú átiratok feltárása. A különféle előnyök miatt az RNS-seq kifejezetten vonzó a korlátozott genetikai erőforrásokkal rendelkező, nem modellszervezetek számára. Nincs azonban részletes kutatás a C. deserticola RNS-seq.

Ebben a tanulmányban globálisan szekvenáltuk a C. deserticola szár-transzkriptumát az Illumina Hiseq2000 platform segítségével, és 7,9 G nyers adatot kaptunk. Összeállítással és annotációval kibányásztuk a PhG bioszintézisében részt vevő géneket és a teljes lignin bioszintézisért felelős géneket. RNS-seq elemzésünk létrehozta az első C. deserticola konszenzus transzkriptumot, és új betekintést nyújtott a C. deserticola gyógyászati ​​értékének átfogó megértéséhez. Ezenkívül az itt leírt módszer széles körben alkalmazható profil-transzkriptomokra, hogy megkönnyítse a specifikus gyógyászati ​​komponensek bioszintézis-útvonalaiban részt vevő gének felfedezését egy másik, nagyon korlátozott genomi erőforrással rendelkező gyógynövényben.

Anyagok és módszerek

Növényanyag gyűjtés

A C. deserticola friss, zamatos szárát az ásatási szakaszban a Belső-Mongóliában található Alxa League BayanHot City-ben található növénybázisról gyűjtötték össze, Kína északnyugati részén. A begyűjtési engedélyt az üzembázis tulajdonosától (HongKui CongRong Group) szerezték be. Az utalványmintát a Kínai Tudományos Akadémia Pekingi Genomikai Intézetének központi genomikai létesítményében helyezték letétbe. A szukkulens szárszöveteket tisztítás után apró darabokra vágva folyékony nitrogénben azonnal lefagyasztottuk, majd további feldolgozásig -80 fokon tároltuk.

RNS extrakció, cDNS könyvtár felépítése és Illumina szekvenálás

A teljes RNS-t a szukkulens szárból TRIzol Reagent (Invitrogen Inc., California, USA) segítségével extraháltuk a gyártó utasításai szerint. A kapott mintákat DNáz I-gyel kezeltük, hogy eltávolítsuk a genomiális DNS-t. Az extrahált RNS-ek mennyiségét Agilent 2100 bioanalizátorral (Agilent Technologies) határoztuk meg, és az integritást denaturáló agaróz gélelektroforézissel, etidium-bromid festéssel ellenőriztük. Az 1,9 és 2,1 közötti A260/A280 arányú RNS-mintákat, az 1,0-nál nagyobb RNS 28S:18S arányokat és az RNS-integritási számokat (RIN-számokat) -8.5,5-ös RNS-mintákkal használtuk a további elemzésekhez.

Az RNA-seq könyvtárakat Illumina Truseq RNS Sample Preparation Kits segítségével hoztuk létre. A poli(A)+ RNS-t a teljes RNS-ből Dynal ligo(dT)25 gyöngyök alkalmazásával izoláltuk a gyártó utasításai szerint. A tisztítást követően fragmentációs puffert adtunk hozzá, hogy az mRNS-t rövid fragmensekre bontsuk. Az első cDNS-szálat ezeket a rövid fragmenseket, mint templátokat, SuperScript III reverz transzkriptázzal és N6 random hexamer primerrel együtt szintetizáltuk. A második szálú cDNS-t ezután pufferrel, dNTP-kkel, RNázH-val és DNS-polimeráz I-vel szintetizáltuk. A kapott kétszálú cDNS-t T4 DNS-polimeráz, DNS-polimeráz I-es Klenow-fragmens és T4-polinukleotid-kináz alkalmazásával vég-javításnak vetettük alá, majd ligáltuk adapterek T4 DNS-ligázt használva. Az adapterrel ligált fragmenseket QiaQuick PCR extrakciós kittel tisztítottuk, és EB pufferrel eluáltuk. Agaróz gélelektroforézissel végzett elemzés után a megfelelő fragmenseket választottuk ki templátként a PCR-amplifikációhoz. A kapott cDNS-könyvtár szekvenálását Illumina HiSeq 2000 rendszerrel végeztük.

Átiratok de novo összeállítása és génexpresszió mennyiségi meghatározása

A szekvenálásból előállított nyers leolvasásokat az adapterszekvenciák (ATCTCGTATGCCGTC) eltávolításával házon belüli módszerrel tisztítottuk. Ezt követően szigorú, alacsony minőségű szűrési eljárást hajtottunk végre. Először is, a 20-nál alacsonyabb phred minőségi pontszámú bázisokat a szekvencia 3' végétől levágják, amíg egy jobb minőségű bázisba futnak (20-nál nagyobb vagy egyenlő). Ha az olvasási hossz rövidebb lenne 50 bp-nél, akkor el kell vetni. Másodszor, az olvasmányokat tovább szűrjük azon kritérium alapján, hogy egy leolvasás során az alapok 70%-a jó minőségű pontszámmal rendelkezik (20-nál nagyobb vagy egyenlő). Harmadszor, csak páros végű leolvasásokat használtak a további összeállításhoz. A de novo átirat összeállítása a Trinity kiadással{10}} [30] történt, amely három egymást követő szoftvermodulból állt: Inchworm, Chrysalis és Butterfly. Az összeállítási paraméterek az alábbiak szerint lettek beállítva:-seqType fq-JM 300G -min_contig_length 200-CPU 20-inchworm_cpu {{21} }bflyCPU 20.

Az átiratok mennyiségének számszerűsítéséhez a szekvenált párvégi leolvasásokat újra igazították az összeállított átiratokhoz a Trinity script segítségével. A feltérképezett leolvasásokat az RSEM (RNA-Seq by Expectation Maximization) szoftverrel használtuk a kvantifikáláshoz. A gén- vagy izoforma abundanciát a transzkriptum egy kilobázisonkénti fragmense és egy millió fragmentum leképezett érték (FPKM) reprezentálta, azokat a transzkriptumokat, amelyek FPKM értéke egyenlő vagy nagyobb, mint 0.05, kifejezettnek minősült.

A kifejezett átiratok funkcionális annotációja

A kloroplasztisz genom kivételével a C. deserticola génannotáció-készletei nincsenek [1]. A kifejezett átiratokat a BLAST programmal külön-külön a Genbank Nt, Genbank Nr és a TAIR{1}} pep_20101214_frissített adatkészletekhez hasonlítottuk (E< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.

Génontológia és KEGG útvonal annotáció A szekvencia-hasonlósági illesztéssel az Uniprot adatbázishoz ( az összes összeállított transzkriptum Gene Ontology (GO) annotációját egy asszociációs fájl használatával kaptuk meg, amelyet a (ftp://ftp.ebi.ac.uk/pub/) címről töltöttünk le adatbázisok/GO/goa/UNIPROT/gene{0}}goa_uniprot.gz). CC, BP ​​és MF kategóriák külön-külön.

A KEGG útvonal információit minden előre jelzett fehérjeszekvenciához hozzárendeltük a KAAS (KEGG Automatic Annotation Server) online eszközzel [34]. A fasta formátumú szekvenciákat elküldtük a KAAS kérésére, és letöltöttük a C. deserticola szárátirathoz kapcsolódó összes útvonalinformációt tartalmazó fájlokat. A BBH (bi-directional best hit) módszerrel annotáláshoz 13 növényi organizmus KEGG-ben tárolt génadatait használtuk fel.

cistanche tubulosa extract

TERMÉSZETES CISTANCHE TUBULOSA CISTANCHE KIVONAT PHGS75% ECH 30% ACT 12%

RT-qPCR elemzés

A DNáz I-gyel végzett emésztés után körülbelül 5 ug teljes RNS-t alakítottunk át első szálú cDNS-vé az oligo(dT)15 primerekkel és GoScript Reverse Transcription System (Promega) végzett reverz transzkripciós reakcióval. A cDNS-termékeket ezután 10-szeresére hígítottuk nukleázmentes ionmentesített vízzel, mielőtt templátként használták volna fel a valós idejű PCR-ben. A specifikus cDNS-eket a GoTaq 2-Step RT-qPCR rendszer (Promega) amplifikáltuk 20 ul térfogatban. A PCR amplifikációt 60 fokos hőkezelési hőmérsékleten hajtottuk végre a 7500 Real-Time PCR Detection System (Applied Biosystems) rendszerrel a gyártó utasításai szerint. A relatív transzkriptumot a ciklusküszöb-módszerrel számítottuk ki, belső standardként a „comp10579_c0” génnel, a 7500 Manager szoftver használatával.

Az RT-PCR primer párjait online szoftver (http://primer3.ut.ee/) alapján tervezték, és az S1 adatkészletben szerepelnek.

Eredmények

RNS szekvenálás és de novo transzkriptom összeállítás a C. deserticola húsos szárból

A C. deserticola szárát Kínában és Japánban már évek óta széles körben használják hagyományosan fontos tonikként. Ahhoz, hogy átfogó képet kapjunk a C. deserticola húsos szár génexpressziójáról, 2013-ban, illetve 2014-ben ugyanabból a növénybázisból gyűjtöttünk C. deserticola szármintákat. Az összes RNS-t extraháltuk, és a poliA+ RNS-eket tisztítottuk a páros végű RNS-seq könyvtárak létrehozásához. Az Illumina HiSeq 2000 szekvenálás segítségével 79 433 734 és 86 019 176 párvégi leolvasást kaptunk, amelyek a szekvencia közel 8 milliárd és 8,6 milliárd bázisának felelnek meg.

image

platform 2013-év és 2014-év mintáiban (1. táblázat). Az adapterszekvenciák eltávolítása és az alacsony minőségű leolvasások kiszűrése után (a részleteket lásd a Módszerek részben) a 2013-évi mintában 64 831 040 jó minőségű párvégi olvasást használtak fel a de novo transzkriptom összeállításához. A Trinity szekvencia-összeszerelő [30] segítségével 51 719 gént és 95 787 transzkriptum szekvenciát állítottunk elő 200 bp és 15 698 bp közötti transzkriptumhosszúsággal. Az összeállított átiratok átlagos hossza 950 bázis, az N50 hossza pedig 1519 bázis. A különböző hosszúságú átiratok száma azt mutatta, hogy az összeállított átiratok 57,32%-a körülbelül 500 bp vagy annál hosszabb volt (1A. ábra). Az 2014-évi mintában található jó minőségű párvégi leolvasásokat leképeztük az összeállított átiratra. Emellett azt találtuk, hogy az egyes összeállított gének transzkriptumszáma változott, és az egy expresszált izoformájú gének 69%-a, míg a gének 31%-a kettő vagy több transzkriptumot expresszált (1B. ábra).

Összeállított átiratok expressziós kvantifikálása és funkcionális annotációja

A gén- vagy átirat-bőséget az RSEM-csomag segítségével határoztuk meg, amelyben a szekvenált leolvasásokat Bowtie segítségével újra igazítottuk az összeállított génekhez vagy transzkriptum-szekvenciákhoz, és ezeket a feltérképezett leolvasásokat használtuk a mennyiségi meghatározáshoz. Minden génre vagy transzkriptumra kiszámítottuk az FPKM-értéket, és végül 63 957 és 52 857 aktívan expresszált transzkriptumot (FPKM érték nagyobb vagy egyenlő, mint 0,5) azonosítottunk a C. deserticola húsos szármintáiban 2{{17} }13, illetve 2014. 44 776 átirat (70,01% az 2013-év mintában, 84,71% a 2014-év mintában) általánosan kifejeződött a két ismétlésben, és az expressziós adataik korrelációja (Pearson korrelációs együttható: 0,91979) A szekvenálás nyers adatait feltöltötték az NCBI SRA adatbázisba (hozzáférési számok: SRX857402 és SRX858938). Az 2013-évi mintában azonosított expresszált géneket használtuk a további elemzéshez. Az összes kifejezett transzkriptum funkcionális annotációs információit két módszerrel szereztük meg. Először is, az összes expresszált transzkriptumot a BLAST algoritmussal külön-külön igazítottuk ismert nukleotid (GenBank nt) és peptidszekvencia adatbázisokhoz (GenBank nr és Arabidopsis peptid). A 63 957 kifejezett átiratból

image

29 220 (45,7%) volt annotálva, és homológiát mutatott a három alany adatbázis bármelyikében található szekvenciákkal, amelyek E-érték határértéke 1e-20. Eközben az összes expresszált transzkriptum szekvencia jelölt kódoló régióit a TransDecoder szoftverrel megjósoltuk, és az egyes transzkriptumok leghosszabb ORF-eit használtuk a Pfam domén kereséshez. Ennek eredményeként 21 358 (33,4%) átiratot annotáltak a Pfam adatbázis alapján. Összességében 30 098 (47,1%) átiratot sikerült szignifikánsan megfeleltetni a nyilvános adatbázisokban szereplő ismert génekkel a fenti két módszer kombinálásával. A teljes kifejezett átiratok listája a funkció annotációjával a kiegészítő adatokban (S2 Dataset) volt látható.

Felmértük a 20 legjobban kifejezett transzkriptumot (2. táblázat), amelyek az összes szekvenálási leolvasás 18,99%-ának felelnek meg, és megállapítottuk, hogy ezek többsége abiotikusra reagáló gén.

image

stressz inger. A dehidrin (DHN), a hidrofil és hőstabil stresszfehérjék egy osztálya, amely nagyszámú töltött aminosavat tartalmaz, és a II. csoportba tartozó késői embriogenezis abundant (LEA) családjába tartozik, a legerősebben expresszált gén. Három különböző Dehyrin-transzkriptumot (komp28713_c0_seq1/2/4) észleltek, amelyek nagymértékben expresszálódnak a húsos szárban, amelyek szerepet játszhatnak a sejtek aszályos stressz okozta károsodásokkal szembeni védelmében. Más stresszhez kapcsolódó gének, például hősokk-fehérje, kórokozókkal kapcsolatos fehérje és metallotionein szintén erősen expresszálódnak, ami összefüggésbe hozható a súlyos túlélési környezettel. Ezenkívül néhány konstitutív gén, beleértve a 26S riboszomális RNS gént (comp22329_c2_seq1), az auxinnal elnyomott/nyugalmi állapothoz kapcsolódó fehérjét (comp20999_c0_seq1), Az ADP-ribozilációs faktor (comp20499_ c0_seq1) szintén erősen átíródott.

Cistanche tubulosa extract

TERMÉSZETES CISTANCHE TUBULOSA AZ IMUNITÁS JAVÍTÁSÁRA PHGS75% ECH 30% ACT 12%

drk-green-rounded-corner-button-buy-now-web


Akár ez is tetszhet