Histogram przedstawia sumÄ wszystkich odczytĂłw w odniesieniu dla zmapowanych genĂłw. W przypadku surowych danych moĆŒna zaobserwowaÄ, ĆŒe kaĆŒda prĂłbka ma innÄ liczbÄ odczytĂłw. NiektĂłre prĂłbki mogÄ posiadaÄ wiÄcej odczytĂłw co nie koniecznie oznacza wiÄkszÄ ekspresjÄ.
RĂłĆŒnice mogÄ wynikaÄ z gĆÄbokoĆci sekwencjonowania (wiÄksza liczba odczytĂłw) jak rĂłwnieĆŒ dĆugoĆci genĂłw (dĆuĆŒsze geny bÄdÄ miaĆy wiÄcej odczytĂłw).
Ze wzglÄdu na wystÄpowanie dysproporcji w liczbie odczytĂłw pomiÄdzy prĂłbkami, przed dalszÄ analizÄ ekspresji genĂłw istnieje koniecznoĆÄ wykonania normalizacji danych.
Po wstÄpnej selekcji danych (majÄ cej na celu usuniÄcie genĂłw o niskich odczytach) oraz normalizowaniu odczytĂłw zastosowano tranformacjÄ logarytmicznÄ . Transformacje logarytmiczne wykorzystuje siÄ w celu odwzorowania rĂłĆŒnic ekspresji genĂłw (w przypadku surowych danych taka analiza jest niemoĆŒliwa).
WartoĆci w tej skali sÄ bezwymiarowe, a najczÄĆciej wykorzystywanym przeksztaĆceniem jest logarytm o podstawie 2 (log2). TakÄ funkcjÄ jest rlog, ktĂłra przed przeksztaĆceniem log2 dodatkowo normalizuje dane (przeksztaĆca dane minimalizujÄ c rĂłĆŒnice miÄdzy prĂłbkami dla wierszy o maĆych zliczeniach oraz normalizuje zliczenia w odniesieniu do wielkoĆci biblioteki).
PoniĆŒszy wykres przedstawia ekspresjÄ funkcji gÄstoĆci. Funkcja gÄstoĆci profili ekspresji genĂłw okreĆla w jaki sposĂłb geny wykazujÄ ekspresjÄ (dla danej prĂłbki). Przyjmuje siÄ, ĆŒe dla danych znormalizowanych wykresy gÄstoĆci badanych prĂłbek powinny siÄ pokrywaÄ - Ćwiadczy to o podobnej dystrybucji odczytĂłw.
Interpretacja wykresu:
- Zakres ekspresji od -1 do +1 opisuje geny nie wykazujÄ ce zmian w ekspresji. W tym przedziale zazwyczaj obserwuje siÄ maksimum funkcji.
- Zakres ekspresji od +1 opisuje geny wykazujÄ ce ekspresjÄ rosnÄ cÄ wraz ze skalÄ . W tym przedziale zazwyczaj moĆŒna zaobserwowaÄ lokalne maksimum funkcji.
Aby zbadaÄ podobieĆstwo prĂłbek przeprowadzono kontrolÄ jakoĆci przy uĆŒyciu analizy gĆĂłwnych skĆadowych (PCA) oraz hierarchicznych metod klastrowania. Analiza jakoĆci na poziomie prĂłbki pozwala zobaczyÄ jak dobrze powtĂłrzenia z jednej grupy eksperymentalnej ukĆadajÄ siÄ razem, a takĆŒe sprawdziÄ czy warunki eksperymentalne stanowiÄ gĆĂłwne ĆșrĂłdĆo zmiennoĆci danych. DziÄki kontroli jakoĆci moĆŒna zidentyfikowaÄ rĂłwnieĆŒ wartoĆci odstajÄ ce, ktĂłre mogÄ wymagaÄ dalszego zbadania przed analizÄ zrĂłĆŒnicowanej ekspresji.
Analiza gĆownych skĆadowych (PCA) genĂłw w badanej populacji.
Wynikiem analizy jest wykres przedstawiajÄ cy zaleĆŒnoĆci/rĂłĆŒnice pomiÄdzy prĂłbkami (przedstawionymi jako indywidualne kropki) jak rĂłwnieĆŒ pomiÄdzy grupami (kaĆŒda grupa reprezentowana przez elipsÄ).
Macierz korelacji pomiÄdzy prĂłbkami daje przeglÄ d podobieĆstw i rĂłĆŒnic miÄdzy prĂłbkami. KtĂłre prĂłbki sÄ do siebie podobne, a ktĂłre siÄ rĂłĆŒniÄ ?
PoĆŒÄ danym wynikiem jest, aby prĂłbki z jednej grupy miaĆy wiÄkszy stopieĆ korelacji niĆŒ te z rĂłĆŒnych grup.
Wykresy poniĆŒej przedstawiajÄ rozkĆad ekspresji genĂłw dla dwĂłch porĂłwnywanych grup. W celu selekcji najbardziej zrĂłĆŒnicowanych ekspresji pomiÄdzy grupami zastosowano dwa filtry:
- skorygowana wartoĆÄ p < 0,05
- zmiana ekspresji LFC †-1 oraz LFC ℠+1
OĆ x âEkspresja [LFC]â - opisuje zmianÄ ekspresji genĂłw w skali log2 OĆ y âSkorygowana wartoĆÄ pâ - przedstawiaja zmianÄ wartoĆci p w skali -log10
RozkĆad danych przedstawiono w postaci dwĂłch wykresĂłw:
- Wykres typu punktowy
- Wykres typu wulkan
Obszar szary charakteryzuje geny, ktĂłre nie wykazujÄ zmian w ekspresji pomiÄdzy badanymi grupami. Geny o podwyĆŒszonej ekspresji wzglÄdem drugiej grupy oznaczone sÄ kolorem czerwonym, analogicznie kolor niebieski oznacza geny o obniĆŒonej ekspresji wzglÄdem porĂłwnywanej grupy. Im dalej dany gen (kropka) znajduje siÄ od przekÄ tnej oznaczonej kolorem szarym tym ekspresja tego genu jest odpowienio niĆŒsza lub wyĆŒsza.
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Tabele przedstawiajÄ 10 genĂłw, ktĂłre wykazujÄ najsilniejsze zmiany w poszczegĂłlnych porĂłwnaniach grup.
WytĆumaczenie danych zawartych w zbiorczych tabelach:
- baseMean - Ćrednia ze znormalizowanych wartoĆci zliczeĆ
- log2FoldChange - oszacowanie wielkoĆci efektu. Zmienna ta mĂłwi, jak bardzo ekspresja genu zmieniĆa siÄ w jednej grupie w stosunku do drugiej. WartoĆÄ ta jest przedstawiona w skali logarytmicznej do podstawy 2: na przykĆad log2 krotnoĆÄ zmiany 1,5 oznacza, ĆŒe ekspresja genu jest zwiÄkszana przez wspĂłĆczynnik wynoszÄ cy 2^1,5, czyli w przybliĆŒeniu zmiana wynosi 2,82.
- lfcSE - szacowana wartoĆÄ bĆÄdu dla log2 fold change
- p-value - p wartoĆÄ dla log2 fold change
- padj - skorygowana p wartoĆÄ
Tabela z genami o obniĆŒonej ekspresji
Tabela z genami o podwyĆŒszonej ekspresji
Szlak sygnaĆowy opisuje szereg ĆŒyciowych procesĂłw biochemicznych pochodzÄ cymi zarĂłwno z zewnÄ trz jak i wewnÄtrza komĂłrki.
Przedstawione poniĆŒej ĆcieĆŒki sygnaĆowe pochodzÄ z bazy danych KEGG (ang. Kyoto Encyclopedia of Genes and Genomes). Ilustracje KEGG Pathway zawierajÄ informacje na temat sieci komĂłrkowych interakcji molekularnych i ich wariantĂłw na podstawie publikacji naukowych.
PeĆna nazwa szlaku sygnaĆowego znajduje siÄ w lewym gĂłrym rogu.
Rodzaje KEGG Pathway:
- Metabolizm
- Przetwarzanie Informacji Genetycznej
- Przetwarzanie Informacji ze Ćrodowiska
- Procesy na Poziomie KomĂłrki
- Procesy na Poziomie Organizmu
- Procesy ChorobotwĂłrcze
- Projektowanie LekĂłw
Wykres szlaku sygnaĆowego wykonywany jest rÄcznie w oprogramowanu o nazwie KegSketch. DomyĆlnie kaĆŒda mapa stanowi interaktyny szablon. Referencyjne mapy KEGG Pathway oznaczone sÄ kolorem biaĆym. Zmiany przedstawiane sÄ za pomocÄ palety kolorĂłw, np. zielony i czerwony ozanczajÄ kolejno zmiejszonÄ i zwiÄkszonÄ ekspresjÄ.
InteraktywnÄ i szczegĂłĆowÄ interpretacjÄ ĆcieĆŒki KEGG moĆŒna znaleĆșÄ w bazie KEGG Pathway po podaniu peĆnej nazwy ĆcieĆŒki lub ID.
Baza GO skupia caĆÄ dotychczasowÄ wiedze o genach z podziaĆem na 3 domeny: elementy komĂłrkowe (CC), funkcje molekularne genĂłw (MF) oraz procesy biologiczne, w ktĂłrych uczestniczÄ (BP).
OntologiÄ genĂłw stusuje siÄ do lepszego zrozumienia procesĂłw biologicznych czy teĆŒ profilu funkcjonalnego zestawu genĂłw ulegajÄ cych zrĂłĆŒnicowanej ekspresji w badanych warunkach. Ontologia genĂłw moĆŒe byÄ zwizualizowana w nastÄpujÄ cy sposĂłb:
- Wykres sĆupkowy jest najczÄĆciej stosowanÄ metodÄ wizualizacji wzbogaconych terminĂłw.
- Wykres punktowy rĂłwnieĆŒ przedstawia najbardziej wzbogacone terminy biologiczne.
- Mapa organizuje wzbogacone terminy w sieÄ, ktĂłra ĆÄ czy geny w zestawy. Taka wizualizacja uĆatwia identyfikacjÄ genĂłw np. o podobnym znaczeniu biologicznym.
- SieÄ przedstawia poĆÄ czenia genĂłw oraz pojÄÄ biologicznych. Wykres pozwala na zobrazowanie zĆoĆŒonoĆci biologicznej, w ktĂłrej kaĆŒdy gen moze naleĆŒeÄ do wielu kategorii.
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Tabele przedstawiajÄ 10 genĂłw, ktĂłre wykazujÄ najsilniejsze zmiany w poszczegĂłlnych porĂłwnaniach grup.
WytĆumaczenie danych zawartych w zbiorczych tabelach:
- baseMean - Ćrednia ze znormalizowanych wartoĆci zliczeĆ
- log2FoldChange - oszacowanie wielkoĆci efektu. Zmienna ta mĂłwi, jak bardzo ekspresja genu zmieniĆa siÄ w jednej grupie w stosunku do drugiej. WartoĆÄ ta jest przedstawiona w skali logarytmicznej do podstawy 2: na przykĆad log2 krotnoĆÄ zmiany 1,5 oznacza, ĆŒe ekspresja genu jest zwiÄkszana przez wspĂłĆczynnik wynoszÄ cy 2^1,5, czyli w przybliĆŒeniu zmiana wynosi 2,82.
- lfcSE - szacowana wartoĆÄ bĆÄdu dla log2 fold change
- p-value - p wartoĆÄ dla log2 fold change
- padj - skorygowana p wartoĆÄ
Tabela z genami o obniĆŒonej ekspresji
Tabela z genami o podwyĆŒszonej ekspresji
Szlak sygnaĆowy opisuje szereg ĆŒyciowych procesĂłw biochemicznych pochodzÄ cymi zarĂłwno z zewnÄ trz jak i wewnÄtrza komĂłrki.
Przedstawione poniĆŒej ĆcieĆŒki sygnaĆowe pochodzÄ z bazy danych KEGG (ang. Kyoto Encyclopedia of Genes and Genomes). Ilustracje KEGG Pathway zawierajÄ informacje na temat sieci komĂłrkowych interakcji molekularnych i ich wariantĂłw na podstawie publikacji naukowych.
PeĆna nazwa szlaku sygnaĆowego znajduje siÄ w lewym gĂłrym rogu.
Rodzaje KEGG Pathway:
- Metabolizm
- Przetwarzanie Informacji Genetycznej
- Przetwarzanie Informacji ze Ćrodowiska
- Procesy na Poziomie KomĂłrki
- Procesy na Poziomie Organizmu
- Procesy ChorobotwĂłrcze
- Projektowanie LekĂłw
Wykres szlaku sygnaĆowego wykonywany jest rÄcznie w oprogramowanu o nazwie KegSketch. DomyĆlnie kaĆŒda mapa stanowi interaktyny szablon. Referencyjne mapy KEGG Pathway oznaczone sÄ kolorem biaĆym. Zmiany przedstawiane sÄ za pomocÄ palety kolorĂłw, np. zielony i czerwony ozanczajÄ kolejno zmiejszonÄ i zwiÄkszonÄ ekspresjÄ.
InteraktywnÄ i szczegĂłĆowÄ interpretacjÄ ĆcieĆŒki KEGG moĆŒna znaleĆșÄ w bazie KEGG Pathway po podaniu peĆnej nazwy ĆcieĆŒki lub ID.
Baza GO skupia caĆÄ dotychczasowÄ wiedze o genach z podziaĆem na 3 domeny: elementy komĂłrkowe (CC), funkcje molekularne genĂłw (MF) oraz procesy biologiczne, w ktĂłrych uczestniczÄ (BP).
OntologiÄ genĂłw stusuje siÄ do lepszego zrozumienia procesĂłw biologicznych czy teĆŒ profilu funkcjonalnego zestawu genĂłw ulegajÄ cych zrĂłĆŒnicowanej ekspresji w badanych warunkach. Ontologia genĂłw moĆŒe byÄ zwizualizowana w nastÄpujÄ cy sposĂłb:
- Wykres sĆupkowy jest najczÄĆciej stosowanÄ metodÄ wizualizacji wzbogaconych terminĂłw.
- Wykres punktowy rĂłwnieĆŒ przedstawia najbardziej wzbogacone terminy biologiczne.
- Mapa organizuje wzbogacone terminy w sieÄ, ktĂłra ĆÄ czy geny w zestawy. Taka wizualizacja uĆatwia identyfikacjÄ genĂłw np. o podobnym znaczeniu biologicznym.
- SieÄ przedstawia poĆÄ czenia genĂłw oraz pojÄÄ biologicznych. Wykres pozwala na zobrazowanie zĆoĆŒonoĆci biologicznej, w ktĂłrej kaĆŒdy gen moze naleĆŒeÄ do wielu kategorii.
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Wykresy Analizy Ekspresji GenĂłw (kaĆŒda kropka charakteryzuje jeden gen).
Tabele przedstawiajÄ 10 genĂłw, ktĂłre wykazujÄ najsilniejsze zmiany w poszczegĂłlnych porĂłwnaniach grup.
WytĆumaczenie danych zawartych w zbiorczych tabelach:
- baseMean - Ćrednia ze znormalizowanych wartoĆci zliczeĆ
- log2FoldChange - oszacowanie wielkoĆci efektu. Zmienna ta mĂłwi, jak bardzo ekspresja genu zmieniĆa siÄ w jednej grupie w stosunku do drugiej. WartoĆÄ ta jest przedstawiona w skali logarytmicznej do podstawy 2: na przykĆad log2 krotnoĆÄ zmiany 1,5 oznacza, ĆŒe ekspresja genu jest zwiÄkszana przez wspĂłĆczynnik wynoszÄ cy 2^1,5, czyli w przybliĆŒeniu zmiana wynosi 2,82.
- lfcSE - szacowana wartoĆÄ bĆÄdu dla log2 fold change
- p-value - p wartoĆÄ dla log2 fold change
- padj - skorygowana p wartoĆÄ
Tabela z genami o obniĆŒonej ekspresji
Tabela z genami o podwyĆŒszonej ekspresji
Szlak sygnaĆowy opisuje szereg ĆŒyciowych procesĂłw biochemicznych pochodzÄ cymi zarĂłwno z zewnÄ trz jak i wewnÄtrza komĂłrki.
Przedstawione poniĆŒej ĆcieĆŒki sygnaĆowe pochodzÄ z bazy danych KEGG (ang. Kyoto Encyclopedia of Genes and Genomes). Ilustracje KEGG Pathway zawierajÄ informacje na temat sieci komĂłrkowych interakcji molekularnych i ich wariantĂłw na podstawie publikacji naukowych.
PeĆna nazwa szlaku sygnaĆowego znajduje siÄ w lewym gĂłrym rogu.
Rodzaje KEGG Pathway:
- Metabolizm
- Przetwarzanie Informacji Genetycznej
- Przetwarzanie Informacji ze Ćrodowiska
- Procesy na Poziomie KomĂłrki
- Procesy na Poziomie Organizmu
- Procesy ChorobotwĂłrcze
- Projektowanie LekĂłw
Wykres szlaku sygnaĆowego wykonywany jest rÄcznie w oprogramowanu o nazwie KegSketch. DomyĆlnie kaĆŒda mapa stanowi interaktyny szablon. Referencyjne mapy KEGG Pathway oznaczone sÄ kolorem biaĆym. Zmiany przedstawiane sÄ za pomocÄ palety kolorĂłw, np. zielony i czerwony ozanczajÄ kolejno zmiejszonÄ i zwiÄkszonÄ ekspresjÄ.
InteraktywnÄ i szczegĂłĆowÄ interpretacjÄ ĆcieĆŒki KEGG moĆŒna znaleĆșÄ w bazie KEGG Pathway po podaniu peĆnej nazwy ĆcieĆŒki lub ID.
Baza GO skupia caĆÄ dotychczasowÄ wiedze o genach z podziaĆem na 3 domeny: elementy komĂłrkowe (CC), funkcje molekularne genĂłw (MF) oraz procesy biologiczne, w ktĂłrych uczestniczÄ (BP).
OntologiÄ genĂłw stusuje siÄ do lepszego zrozumienia procesĂłw biologicznych czy teĆŒ profilu funkcjonalnego zestawu genĂłw ulegajÄ cych zrĂłĆŒnicowanej ekspresji w badanych warunkach. Ontologia genĂłw moĆŒe byÄ zwizualizowana w nastÄpujÄ cy sposĂłb:
- Wykres sĆupkowy jest najczÄĆciej stosowanÄ metodÄ wizualizacji wzbogaconych terminĂłw.
- Wykres punktowy rĂłwnieĆŒ przedstawia najbardziej wzbogacone terminy biologiczne.
- Mapa organizuje wzbogacone terminy w sieÄ, ktĂłra ĆÄ czy geny w zestawy. Taka wizualizacja uĆatwia identyfikacjÄ genĂłw np. o podobnym znaczeniu biologicznym.
- SieÄ przedstawia poĆÄ czenia genĂłw oraz pojÄÄ biologicznych. Wykres pozwala na zobrazowanie zĆoĆŒonoĆci biologicznej, w ktĂłrej kaĆŒdy gen moze naleĆŒeÄ do wielu kategorii.
Hierarchiczne drzewo moĆŒe wskazywaÄ, ktĂłre prĂłbki sÄ bardziej do siebie podobne w oparciu o znormalizowane wartoĆci ekspresji genĂłw. Bloki kolorĂłw wskazujÄ na strukturÄ danych i moĆŒna oczekiwaÄ, ĆŒe powtĂłrzenia bÄdÄ klastrowaÄ siÄ razem jako blok dla kaĆŒdej grupy prĂłbek. Ponadto spodziewamy siÄ, ĆŒe prĂłbki bÄdÄ grupowane podobnie do grup obserwowanych na wykresie PCA.
Wiersze i kolumny matrycy sÄ przestawiane (niezaleĆŒnie) zgodnie z wybranÄ metodÄ grupowania, tak aby geny lub grupy genĂłw o podobnych wzorach ekspresyjnych sÄ siadowaĆy ze sobÄ . Obliczony dendrogram (drzewo) wynikajÄ cy z grupowania jest dodany z boku obrazu, aby wskazaÄ zwiÄ zki miÄdzy genami.
Na poniĆŒszym wykresie przedstawiono ekspresjÄ 20 genĂłw, ktĂłre wykazujÄ najmocniejsze zrĂłĆŒnicowanie pomiÄdzy badanymi grupami.
Analiza klastrowa pozwala na porĂłwnanie 10 genĂłw o najwiÄkszej rĂłĆŒnicy w ekspresji pomiÄdzy badanymi grupami.
Copyright © Genomika Polska
All rights reserved
Raport powstaĆ na podstawie: Plotly, DataTables