Search form

GenOhm

Contact details
Traineeship proposition
Abstract
Testimony
Admin
Voorstelling stageplaats:
In het kader van onze Views ontwikkelingen zijn wij op zoek naar een stagiair bio
informatica. Het doel van de stage is het helpen in het beschikbaar maken van gekende biologische databanken, zoals ENSEMBL, als een formaat dat bevraagd   kan worden met ontologie zoekmethodes. De stage kadert in onderzoek naar ontologie gebaseerde zoekmachines voor het bevragen van sequentie-informatie.
De stagiair heeft een  goede kennis van Java en  van databanken (MySQL), en kent de meest voorkomende biodatabanken. Een basiskennis van bio‐ontologieën is
mooi meegenomen. Kennis van frameworks zoals Spring en Hibernate of het gebruik van moderne client/server technologieën (zoals SmartGWT) zijn een plus maar niet noodzakelijk. Deze stage is een unieke kans om te functioneren in een
professionele ontwikkelomgeving, meer te weten te  komen over de hipste technologieën, en jouw bijdrage te leveren aan nieuwe ontwikkelingen in de
bio-informatica.
Samenvatting eindwerk 2013-2014: The expansion of BOINQ with upload and conversion possibilities
In life sciences labs, huge amounts of Next-generation sequencing data are being produced. All this data is not easily available for machine processing, which inhibits optimal searching in its content. BOINQ is a webtool that is connected to a local triple database, Fuseki. With this webtool, users will be able to upload biological annotated data that is stored in different types of files. Some of the more common used filetypes which contain this kind of data are General Feature Format (GFF), Browser Extensible Data (BED), Browser Extensible Data Graph (BedGraph) and Genetrack. The data in these different filetypes are not directly comparable and therefore must first be processed.
To execute this processing there is need for the use of semantic technologies. This means, that all the data will be labeled with additional data. As a result of this labeling, the biological annotated data becomes better comprehensible for a computer because meaning is added to this data. After the uploading of a file, the data gets converted into an N-triple format. This triple format contains a subject, predicate and object. The subject is the feature of which the triple contains information. The predicate shows the relation between the subject and the object. The object Is the value that belongs to the subject of the appropriate predicate.
For the development of this new functionality of BOINQ there was made use of the opensource Java platform Eclipse. For BOINQ to be able to apply this functionality it needs a databaseconnection and a connection to a SPARQL server that will upload the converted data onto the triple database.

Address

Technologiepark 3
Gent
Belgium

Contacts

Traineeship supervisor
Martijn Devisscher
09/2415710
martijn@genohm.com
Zoekopdracht
Klassiek
Via Map