En l'anomenada societat de la informació, les dades representen unes parts estructurals clau en la generació del coneixement. De la mateixa manera, la Bioinformàtica depèn en darrer terme d'una adequada gestió i processament de les dades que s'originen de les anàlisis tant tradicionals com d'alt rendiment._x000D_ Com a objectiu principal d'aquesta tesi, s'han compilat diferents aproximacions pràctiques per a la manipulació de les dades de seqüenciació de proteïnes i les anàlisis resultants que s'hi apliquen. En tot cas, com a pas preliminar, eines i algorismes bioinformàtics preexistents s'han adaptat abans al paradigma de la informació actual, bàsicament centrat en el World Wide Web. Després d'una pertinent adaptació d'aquestes aplicacions (en aquest document: ProtLoc, TransMem, TranScout i Bypass), esdevé possible encarar el processament massiu de dades proteiques que s'han originat dels darrers projectes de seqüenciació de genomes._x000D_ Els resultats d'aquestes anàlisis es fan disponibles per a la comunitat científica d'arreu del món mitjançant bases de dades biològiques basades en el web, de ple accés i d'ús amigable. Com exemples, es presenten dos casos: TrSDB, un compendi de factors de transcripció coneguts i putatius de diferents organismes models, i ArchDB, una base de dades web estructural de llaços de proteïnes._x000D_ Com a pas posterior, a partir del programa Bypass —una eina basada en lògica difusa per a la reanotació i avaluació d'alineaments proteics obtinguts amb cerca per homologia— s'implementa un entorn complet d'anotació i gestió de seqüències. Com a punt fort, el sistema també és suficientment flexible i modular per a permetre l'entrada de diferents tipus de dades (p. ex., Gene Ontology) o comunicar-se amb altres aplicacions ja existents i potencialment futures._x000D_ De forma paral·lela, i aprofitant l'explosió de dades crues de seqüenciació i la curació de les bases de dades, es presenta una caracterització bioinformàtica d'una nova família de metal·locarboxipeptidases. Mitjançant aproximacions computacionals, va ser possible plantejar unes primeres hipòtesis per a l'activitat enzimàtica i la història filogenètica d'aquest grup de proteïnes. Notablement, llur identificació pot representar un enfocament esperançador per a tractar processos biològics com ara la malària o desordres neuronals, on aquestes molècules s'hi troben implicades estretament.
DESIGN AND PRACTICAL USAGE OF WEB BIOLOGICAL DATABASES FOR THE ANNOTATION AND CLASSIFICATION OF PROTEINS.
Hermoso Pulido, A. (Autor). 21 de jul. 2015
Tesi d’estudis: Tesi doctoral
Tesi d’estudis: Tesi doctoral