Search form

VIB-IRC-Molecular Cell Biology / Bioinformatics Core Facility

Contact details
Traineeship proposition
Abstract
Testimony
Admin
Stage-onderwerp 1 2012-2013: Unraveling the identity of genes underlying the functional diversity of dendritic cell subsets
The lung is a fascinating tissue at the level of immune regulation. On the one hand it forms a barrier with the outside world and is in contact with a lot of innocuous environmental antigens. On the other hand, it can be the entrance site for pathogens including viruses and bacteria. Dendritic cells (DCs) are the most potent antigen-presenting cells of the immune system and as such appear to mediate two seemingly incompatible functions in the lungs: inducing tolerance against environmental antigens, while retaining the capacity to induce immune responses to pathogen-derived antigens upon pulmonary infections. We however hypothesize that some DC subsets preferentially induce tolerance, while other DC subsets are more efficient for the induction of effector responses. We have demonstrated that lung dendritic cells are a heterogeneous population that is consisted of 3 distinct cell subsets with specialized biological functions. However, little is known about the particular genes and transcription factors that underlie the functional specialization of these cells. Therefore, we are currently collecting gene-expression profiles from the distinct lung DC subsets in various inflammation settings including allergic asthma and flu infection. This project will consist in analyzing the gene-expression profiles of the distinct DC subsets to identify genes that are specifically expressed by particular DC subsets or upon particular inflammation settings and that could shed some light on the molecular mechanisms utilized by the distinct DC subsets in the different conditions. Hereby we hope to unravel the identity of the genes that underlie the functional diversity of the specific DC subsets.
 
Stage-onderwerp 2 2012-2013: Evolutionaire studie van de armadillo superfamily
Armadillo is een eiwit in fruitvlieg (Drosophila). Het homoloog eiwit in zoogdieren is beta-catenine dat bestaat uit 12 zogenaamde armadillo domeinen of ARM repeats naast amino- en carboxyterminale domeinen. Als deel van het cadherine-catenine complex speelt het een cruciale rol in cel-cel adhesie. Het wordt veelvuldig bestudeerd met jaarlijks tot meer dan 1000 nieuwe gerelateerde publicaties in PubMed. Er zijn echter veel meer armadillo eiwitten (alle met meerdere ARM domeinen), waaronder enkele tientallen in de mens alleen al, die alle behoren tot de armadillo superfamilie. Naast beta-catenine worden bepaalde hiervan regelmatig bestudeerd zoals p120-catenine en plakophilines. Andere worden op dit ogenblik veel minder tot bijna niet bestudeerd.
Het project bestaat uit een bioinformatica (dry lab) en een experimenteel (wet lab) luik. Door identificatie van alle armadillo superfamilie leden in één of meerdere genomen zal bijgedragen worden aan een grootschalige evolutionaire studie van de armadillo superfamilie die momenteel in het gastlab wordt uitgevoerd. Daarnaast zal de student meehelpen met de karakterisering en de identificatie van interactiepartners van een aantal van de minder bestudeerde armadillo eiwitten in hogere maar ook in lagere dieren (mens, muis, zeeanemoon en plakdiertje).
 
Voorstel stage-onderwerp (2010-2011) 1: Identificatie en studie van de evolutie van cadherines in dieren (Prof. Frans van Roy – Paco Hulpiau)
Volgende genomen zullen worden onderzocht:
- de spons Amphimedon queenslandica,
- de Californische zeehaas Aplysia californica
- de lamprei of zeeprik Petromyzon marinus
 
Voor de identificatie zal gebruik gemaakt worden van gecombineerde tBLASTn en HMM (hidden Markov model) methodes die worden uitgevoerd a.d.h.v. perl scripts.
Na bundelen van de resultaten van beide methodes en manuele annotatie van de geïdentificeerde cadherins, kan via vergelijkende analyses met gekende cadherines het type cadherine worden bepaald. Via fylogenetische studie zullen de oorsprong en evolutie van deze cadherines binnen de cadherine superfamilie worden bepaald.
Volgende methodes en toepassingen zullen o.a. worden gebruikt:
- programmeren in (Bio)Perl, UCSC genome browser
- identificatie cadherines: NCBI BLAST (tBLASTn), Pfam, HMMer
- bewaren HMM data: MySQL databank
- annotatie cadherines: CD-search, Phobius, VectorNTI of CLC Bio
- vergelijkende en fylogenetische studie: NCBI BLAST (bl2seq), ClustalX2, MUSCLE, Mr. Bayes, Dendroscope, Jalview
 

 

Beide genen zijn sterk anti-inflammatoire genen en het onderzoek wenst aan te tonen dat TNF, een pro-inflammatori molecule, deze mRNAs versneld doet afbreken als een onderdeel van zijn inflammatoire strategie. Het onderzoek zal inhouden dat een in silico analyse zal worden uitgevoerd van de 3' UTR en andere regio's van het GR en GILZ coderend gen om te onderzoeken welke regulatorische sekwenties er in voorkomen en hoe deze door TNF worden gereguleerd.
 
(Voorstel) stage-onderwerp (2010-2011) 3: CHIP-SEQ data analyse van GR in muis hepatoma cellen (Prof. Claude Libert )
De glucocorticoid receptor (GR) is een ligand-geactiveerde transcriptie factor die op GRE elementen bindt na nucleaire translocatie. TNF, een pro-inflammatoir cytokine, verstoort het GR nucleare transport, en een CHIP-SEQ experiment zal worden uitgevoerd om te onderzoeken welke GRE promotors door TNF worden beïnvloed. 
 
Voorstel stage-onderwerp (2010-2011) 4: Identificatie en studie van de evolutie van catenines in dieren (Dr. Jolanda van Hengel – Paco Hulpiau)
Voor meer informatie, zie bij "eindwerk, presentatie"
 
(Voorstel) stage-onderwerp (2010-2011) 2: Grondige studie naar het mechanisme van TNF-geinduceerde destabilisatie van mRNA van de glucocorticoid receptor (GR) en van glucocorticoid induced leucine zipper (GILZ) (Prof. Claude Libert )
 

Stageonderwerp 2009-2010 en voorstel stage-onderwerp (2010-2011) 5: MirTra: een gebruiksvriendelijke web-tool voor de simultane visualisatie van de transcriptionele en post-transcriptionele regulatie mogelijkheden van eukaryote genen (Dr. Pieter De Bleser)

 
De genexpressie in een cel wordt bepaald door tal van factoren zoals omgeving, ontwikkelingsstadium, regulatorische sequentie elementen enz. De regulatie van DNA transcriptie is een belangrijke eerste stap in de regulatie van genexpressie en gebeurt wanneer transcriptiefactoren binden op specifieke sequentie elementen. Identificatie van de bindingsplaatsen voor deze transcriptiefactoren is daarom een
belangrijke eerste stap in het begrijpen van de regulatie van de expressie van een willekeurig gen. Hoe belangrijk ook, toch vertegenwoordigt dit slechts één niveau waarop regulatie van de genexpressie kan optreden. In 1998 ontdekten Andrew Fire en Craig Mello een klasse van kleine RNAs die niet coderen voor een eiwit. Deze RNAs remmen de activiteit van genen door te binden aan mRNAs met een passende nucleotiden volgorde, waardoor translatie tot eiwit niet kan plaatsvinden. Dit proces heet RNA interferentie (RNAi) en heeft de ontdekkers in 2006 de Nobelprijs opgeleverd. Het blijkt dat er twee soorten remmende RNAs zijn: (1) ze kunnen van buitenaf in een cel worden binnengebracht en heten dan small interfering RNAs (siRNAs) of (2) ze worden afgelezen van microRNA-genen in het genoom van de cel zelf en heten dan microRNAs. De voorspelling van de doelwit mRNAs voor
microRNAs wordt beschouwd als zijnde essentieel in het microRNA onderzoek en een aantal algoritmes werden voor dit doel ontwikkeld. De identificatie van microRNA doelwit mRNAs in dieren is bijzonder moeilijk aangezien deze microRNAs slechts gedeeltelijk complementariteit vertonen met hun doelwit
mRNAs, dit in tegenstelling tot de situatie in het plantenrijk. Momenteel produceren alle beschikbare algoritmen niet-overlappende lijsten van mogelijke doelwit mRNAs, wat een indicatie is dat het hier om tal van vals-positieven betreft. Eén mogelijkheid om deze lijst te reduceren is om, in een consensus model, te zoeken naar microRNA doelwitten die door alle algoritmen werden voorspeld.
 
Het doel van dit stageproject is het ontwikkelen van een website die de verschillende niveaus waarop de regulatie van de genexpressie van een willekeurig gen kan optreden, samenbrengt in een overzichtelijke visualisatie. In essentie betekent dit dat de gebruiker een gennaam opgeeft waarna het programma in de gekozen promoter regio zal gaan zoeken welke transcriptiefactoren mogelijk binden.
Tegelijk zal ook gezocht worden welke microRNAs het mRNA van dit gen mogelijk als doelwit hebben. Deze gecombineerde informatie van transcriptionele en post-transcriptionele regulatie mogelijkheden kan de onderzoekers in het laboratorium helpen betere experimenten te ontwerpen in hun studie naar de regulatie van gen-expressie.
Abstract traineeship advanced bachelor of bioinformatics 2017-2018Comparison, development and implementation of bioinformatic algorithms for scRNA-seq data analysis

Bulk RNA-seq was the preferred method for transcriptome analysis for a long time, but the last few years a competitor has shown up. Single cell RNA-seq (scRNA-seq) uses the same principle as bulk RNA-seq methods, but can do transcriptome analysis on a cellular level. This can be useful for the identification of cell types, specific cell response to disease and many more applications. To date scRNA-seq is especially used in human and mouse research, but recently Arabidopsis thaliana researchers started to get interested in the technique.

To see if the technique can be used on plant cells, a small experiment was set up to analyse the difference between the root of wild type Arabidopsis and TMO5 induced Arabidopsis. The overexpression of TMO5 promotes lateral growth of the root, resulting in a shorter but thicker root. The data was analysed using the same pipeline as human or mouse samples.The quality of the sample is as good or even better than most of the analysed human and mouse samples. Different cell types can be identified and it is also possible to use trajectory inference methods to identify a developmental path. Based on these results, we can conclude that scRNA-seq can be used to get insight in Arabidopsis on a cellular level.

Biologists have a lot of knowledge on a specific subject, but mostly lack the ability to perform bioinformatic analysis. This can be a problem for scRNA-seq data, since a bioinformatician mostly lacks the biological knowledge to interpret the results himself. To address this problem, a Shiny web application named “tSNEtool” was developed. This application uses the results of a scRNA-seq experiment and brings them to the biologist in an interactive way. By using a dimensionality reduction method, t-distributed stochastic neighbour embedding (tSNE) in this case, the high dimensional results can be visualised in a two-dimensional plot. This visualisation method makes it possible to identify different subpopulations among all cells. The expression of a certain gene can also be projected on this plot. Besides the visualisation, the application can also be used to determine differentially expressed genes among different subpopulations. This helps in the identification of the different subpopulations. To make this identification easier, an annotation method is implemented that uses marker genes of a specific cell type to annotate the different subpopulations. tSNEtool can also be used to perform a gene ontology analysis on a specific subpopulation to get a better understanding of the biological function of these cells.

 

Samenvatting eindwerk 1 2012-2013:

Analyse van Xbp1 knock-out microarray data in conventionele dendritische cellen
Wegens confidentialiteit kan de samenvatting niet gepubliceerd worden.
 
Samenvatting eindwerk 2 2012-2013:
Evolutionaire studie en ‘in silico’ identificatie van de armadillo superfamilie
Het cadherine-catenine complex is belangrijk voor de stabilisatie van cel-cel adhesie en normale celfysiologie. De moleculen uit dit complex worden veelvuldig bestudeerd met jaarlijks tot meer dan 1000 nieuwe gerelateerde publicaties over catenines en cadherines in PubMed. Naast de catenines zijn er echter veel meer armadillo (ARM) eiwitten (allen met meerdere ARM domeinen), waaronder enkele tientallen in de mens alleen al, die allen behoren tot de armadillo superfamilie. Beta-catenine wordt het vaakst bestudeerd en ook over p120-catenine en plakofilines zijn er enkele tientallen publicaties per jaar. Bepaalde hiervan worden regelmatig bestudeerd zoals p120-catenine en plakofilines. Andere worden op dit ogenblik echter veel minder tot bijna niet bestudeerd.
In dit project wordt gezocht naar minder bestudeerde en nieuwe armadillo eiwitten in één of meerdere genomen. Door identificatie van deze eiwitten wordt er bijgedragen aan een grootschalige evolutionaire studie van de armadillo superfamilie.
Om kennis te verwerven over de interactiepartners van de ARM eiwitten en de ligging van mRNA’s van de ARM domeinen werden respectievelijk yeast two hybrid en in situ hybridisatie toegepast in het wet lab. In het dry lab werd gebruik gemaakt van HMMer om de ARM repeats op te sporen, te annoteren in de proteïnensequentie in CLC workbench en vervolgens hiervan een nieuw Hidden Markov Model te maken.
In het labo werden de interactiepartners van bepaalde armadillo eiwitten geïdentificeerd. Ook werd duidelijk welk deel van het armadillo eiwit precies bindt met de interactiepartner.
In het dry lab werd een nieuw Hidden Markov Model gebouwd op basis van manueel geannoteerde armadillo domeinen. Dit model is nog niet perfect, maar is wel al in staat in naaste verwanten van dieren (zoals Capsaspora) meer armadillo eiwitten te detecteren dan het huidige courante Pfam model. Momenteel is het nog niet duidelijk van welk gekend armadillo eiwit het een ortholoog is.
Dit werk geeft aanzet tot verder onderzoek om tot een nieuw verbeterd model te komen en uiteindelijk alle aanwezige armadillo eiwitten in alle organismen te vinden.
 
Samenvatting eindwerk 1 2010-2011: In silico identificatie en evolutionaire studie van cadherines in de spons Amphimedon en de californische zeenaaktslak Aplysia
Cadherines staan in voor intercellulaire binding en zijn regulatoren in verschillende processen. Met het oog op de bestrijding van verschillende ziekten is het belangrijk om te weten hoe cel-cel adhesie en interactie verloopt. Deze kennis kan dan gebruikt worden in de bestrijding van die ziekten.
Om doelgerichter te kunnen werken kan een in silico bepaling van de targetgenen veel tijd besparen. Ook een extensieve analyse van de bekomen resultaten kan al een belangrijke duiding zijn in verband met de karateristieken, expressie en mogelijke manipulatie van de genen. Op deze manier kan er onnodig werk worden vermeden en het tijdsaspect van onderzoek ingekort worden.
In dit werk zijn de cadherines in silico bepaald in de Amphimedon queenslandica en de Aplysia californica. De Amphimedon vanwege de primitieve status van het organisme. Het staat bekend als een van de eerste soorten van multicellulair leven. De Aplysia vanwege het immense zenuwstelsel die het dier bezit, wat neurologisch onderzoek ten goede komt.
De genomische sequentie van de twee organismen werden gescand met HMMer getraind met HMM (hidden markov models) van cadherines. Van de relevante hits zijn modellen opgemaakt met behulp van eiwit predictie tools. Deze modellen werden onderling vergeleken om zo tot de meest waarheidsgetrouwe representatie van de cadherines te komen. De bekomen modellen werden dan vergeleken met andere cadherines om hun type te bepalen en om de evolutie te kunnen zien over de soorten heen.
 
De gerapporteerde genen en hun eiwitproducten in dit werk zijn een theoretisch construct en moeten dus zeker in vivo gevalideerd worden. Ook het feit dat de gebruikte assemblies niet 100% overeenkomen met de realiteit maakt de in vivo bepaling nog belangrijker vanwege de correcte expressie en structuur die zo bekomen kan worden.
Het belangrijkste resultaat van dit werk is de vondst van een zeer groot aantal protocadherines in de Aplysia californica vanwege hun werking in het zenuwstelsel en de mogelijke paden die ze openen tot verder onderzoek. Ook de vondsten in de Amphimedon zijn belangrijk, maar op een ander vlak. De gevonden cadherines zijn een uitgangspunt voor evolutionaire studies vanwege hun diversiteit, aanwezigheid of zelfs afwezigheid, al moet die afwezigheid zeker eerst aangetoond worden.
De cadherines vervat in dit werk zijn een zeer goed uitgangspunt voor verder onderzoek, in vivo of in silico, en hebben zeker al hun geheimen nog niet prijsgegeven.
 
Samenvatting eindwerk 2 2010-2011: Een ChIP-seq gedefinieerde genoom-mapping van de glucocorticoïd receptor, onder invloed van TNF en dexamethason
Het onderzoek voor dit eindwerk werd uitgevoerd in het VIB, het Vlaams Instituut voor Bio-informatica, Departement voor Moluculaire Biomediche Research in Zwijnaarde, België. Het onderwerp van de studie was de invloed van TNF en dexamethason op de genen en de glucocorticoïd receptor in BWTG3 cellen door middel van een ChIP-seq analyse.
De glucocorticoïd receptor komt in bijna elke cel in het menselijke lichaam tot expressie en reguleert genen door de ontwikkeling, het metabolisme en de immunorespons te controleren. Om deze invloed te onderzoeken werd er een ChIP-seq experiment opgesteld. De cellen werden behandeld en werden vervolgens opgestuurd naar Fasteris, een Zwitsers biotech bedrijf.
Het experiment bestond uit twee groepen, de ene groep werd behandeld met het antilichaam H300 en de andere groep met het IgG antilichaam. Binnen deze groepen werden er nog eens vier groepen gemaakt. De eerste groep cellen kreeg geen behandeling, de tweede groep werd twee uur behandeld met dexamethason, de derde groep drie uur met TNF en de laatste groep drie uur met TNF en twee uur met dexamethason.
Het was de bedoeling om via de data, die Fasteris had verwerkt, deze invloeden te bepalen. Aangezien er geen protocol bestaat om deze data te verwerken, was het onze taak om een goed protocol met de beste tools te vinden en op te stellen.
Voordat we de data konden verwerken hebben we informatie opgezocht in gelijkaardige ChIP-seq experimenten om meer inzicht te krijgen over hoe wij onze analyse zouden kunnen laten verlopen. We vonden een aantal tools die gebruikt werden om gelijkaardige data te verwerken. Het was onze taak om de meest geschikte te onderscheiden. We hielden er rekening mee of we de data konden verwerken en of we met het resultaat verder konden werken.
 
Samenvatting eindwerk 3 2010-2011: MiRTra: een transriptiefactor - miRNA dubbele feedbackloop predictietool
De expressie van eukaryotische genen wordt onder andere gereguleerd door transcriptiefactoren (TF) en door miRNA’s.
TF’s reguleren het gen op transcriptioneel vlak, waar miRNA’s dat op post-transcriptioneel vlak doen. Deze twee verschillende mechanismen en regulatoren zijn in een netwerk van interacties verweven met elkaar. Over hoe deze regulaties effectief verlopen en zeker hoe de interacties tussen de verschillende mechanismen gebeuren, wordt nog veel onderzoek gedaan. Veel is nog steeds ongekend in deze materie.
Het kan echter nuttig zijn om na te gaan of een gen door de twee mechanismen wordt gereguleerd en of de twee regulatoren ook elkaar gaan reguleren. Deze interactie, waar een gen wordt gereguleerd door een miRNA en een TF en waar de TF het miRNA reguleert en omgekeerd, heet een dubbele feedbackloop.
Het is interessant om deze dubbele feedbackloops op te gaan sporen daar deze een indicatie kunnen zijn dat het gen binnen een bepaalde “pathway” functioneel is waar ook de miRNA en het TF tot expressie komen.
Als men dan gaat controleren welke andere genen door dezelfde dubbele feedbackloop gereguleerd worden, is bij de verkregen genenset de kans groot dat ze in een zelfde biochemisch proces van nut zijn.
In dit werk wordt de ontwikkeling van een tool weergegeven die de regulatie van een gen door miRNA’s en TF’s gaat vaststellen en de eventuele dubbele feedbackloop tussen de beide regulatoren voorspelt.
De regulatie van de genen, dus de TF- en miRNA-bindingsplaatsen, worden voorspeld door predictietools. De verkregen resultaten zijn dus een indicatie van een mogelijk regulatoir netwerk en zijn een ab initio verkenning om dan experimenteel verder uitgediept kan worden.
 
Samenvatting eindwerk 4 2010-2011:
In silico identificatie en evolutionaire studie van cadherines in Schistosoma en Daphnia
Cadherines zijn belangrijke moleculen in zowel de medische wereld als in het gebied van evolutionair onderzoek. In de medische wereld spelen ze een rol in allerhande menselijke ziektes zoals kanker en neurologische defecten. Een betere kennis van hun algemene werking en functie zou het behandelen van deze ziektes significant kunnen vereenvoudigen. In het gebied van evolutionair onderzoek zijn ze belangrijk omdat ze zeer gevarieerd zijn en mee met de species geëvolueerd zijn. Identificatie van cadherines kan dus helpen bij het controleren of verbeteren van de evolutionaire stamboom.
Cadherines zelf hebben verschillende functies die nog niet allemaal ten volle gekend zijn, wel is gekend dat ze instaan voor intercellulaire binding en dat ze verschillende andere processen reguleren. Recent onderzoek doet ook een rol in het zenuwstel verwachten.
In dit werk wordt de aanwezigheid van cadherines in Schistosoma mansoni, Schistosoma japonicum en Daphnia pulex via dry lab methodes nagegaan. De gevonden genen worden dan ook geïdentificeerd. Dit preliminair research laat het toe om doelgericht experimenteel research uit te voeren en zo tijd en kosten te besparen.
De besproken genen in dit werk werden enkel via theoretische methoden bepaald en er is dan ook geen experimenteel bewijs voor de effectieve aanwezigheid en expressie van deze genen in de organismen. De expressie van deze genen is iets dat enkel via experimenteel research kan nagegaan worden.
 
Samenvatting eindwerk 2009-2010: ConTra v2.0: Een webapplicatie voor identificatie van geconserveerde transcriptiefactor bindingsplaatsen doorheen organismen
Transcriptiefactoren (TFs) spelen een belangrijke rol bij het reguleren van de transcriptie van een gen, dit gebeurt door binding van deze TFs aan transcriptiefactor bindingsplaatsen (TFBS). Het identificeren van deze bindingsplaatsen kan nieuwe inzichten bieden in de manier waarop een gen gereguleerd wordt. Ook is geweten dat verschillende ziektes tewijten zijn aan fouten in de genregulatie door TFs, het onderzoeken van TFBS naar mutaties kan hierbij waardevolle inzichten geven in de ziektes.
Om TFBS ‘in silico’ te identificeren, werd in 2008 reeds ConTra ontwikkeld door de Bioinformatica Core Faciliteit van het Departement voor Moleculair Biomedisch Onderzoek (DMBR), actief binnen het VIB  en de faculteit wetenschappen van de Universiteit Gent. Deze webtool identificeert en visualiseert TFBS  in de promoter regio van een gen. Daar reeds bewezen is dat TFBS zich ook in andere delen van de sequentie kunnen bevinden, zoals in intronen en UTRs, was deze tool toe aan vernieuwing.
De vernieuwingen van ConTra bestaan erin dat er nu ook TFBS geïdentificeerd en gevisualiseerd kunnen worden in de UTR’s en de intronen. Dit gebeurt met behulp van aligneringen die van de UCSC site gehaald worden en vervolgens geanalyseerd worden. Een tweede verandering is dat er verschillende referentie organismen kunnen gekozen woren, om zo de gepaste vergelijking met betrekking tot conservatie te kunnen maken.

Address

Technologiepark 927
9052 Zwijnaarde
Belgium

Contacts

Traineeship supervisor
Pieter De Bleser
09/3313693
pieterdb@dmbr.vib-ugent.be
Traineeship supervisor
Dr. Frans van Roy
Traineeship supervisor
Claude Libert
Traineeship supervisor
Liesbet Martens
bioit@irc.vib-ugent.be
Zoekopdracht
Klassiek
Via Map