InterPro stellt im Grunde eine Sammlung von verschiedenen Datenbanken dar, die Informationen über Proteinfamilien, Domänen und ‘functional sites’ enthalten. Die Liste der beteiligten Datenbanken ist lang und duchaus beeindruckend. Normalerweise benötigt man zum Durchsuchen dieser Datenbanken jeweils ein eigenes Werkzeug, denn sie basieren auf zum Teil ganz unterschiedlichen Technologien, z.B. auf Hidden Markov Modellen wie etwa Pfam oder auf komplexen, regulären Ausdrücken wie etwa Prosite. InterPro bietet desshalb eine Art Meta-Suchmethode namens InetrProScan an, die die jeweligen Suchwerkzeuge für den Benutzer transparent einsetzt und auch ein zusammengefasstes Suchergebnis liefert. Sowohl InterPro als auch InterProScan können auch in-house eingesetzt werden und stehen am EBI zum download zur Verfügung.
topInterProScan kann seine Ergebnisse auch in einem wohlgeformeten XML-Format bereitstellen, was das Parsen und damit den Einsatz in eigenen Anwendungen wesentlich vereinfacht. Eigentlich sollten die Ergebnisse auch validierbar sein, leider ist das verwendete XML-Schema momentan nicht unter der angegebenen URL zu finden.
Um beim in-house Einsatz von InterProScan mit dem XML-Format
dennoch eine für den Benutzer gewohnte Darstellung bieten
zu können habe ich ein XSLT stylesheet entwickelt,
das den XML-output in HTML übersetzt und dabei die
gewohnte ‘TableView’ Darstellung bei InterPro
nachempfindet. Es ist sehr leicht über stylesheet
Parameter konfigurierbar und erlaubt den Einsatz von
parametrisierbaren URL-templates. Als Lizenz kommt die LGPL
zum Einsatz. Das stylesheet selbst steht
hier
zum download
bereit und das ebenfalls benötigte CSS kann
hier
abgerufen werden.
In der aktuellen Version stehen fünf stylesheet Parameter zur Verfügung, die es erlauben für alle die Stellen, an denen im HTML-Dokument links eingefügt werden ein link-template zu definieren, das zudem über Variablen parametrisierbar ist. Eine genauere Erklärung kann dem einführenden Kommentar des stylesheets selbst entnommen werden. Als Beispiel habe ich eine InterProScan Analyse mit einem Teil des humanen SUCLG1 Gens vorbereitet: hier ist der XML-output und hier das per XSLT stylesheet erzeugte HTML Dokument.