Wie funktioniert Metagrid?
Metagrid kooperiert derzeit mit über zwanzig Partnern. Diese Projekte stellen im Rahmen ihres jeweiligen Auftrags biographische Daten online zur Verfügung.
Für den Import stehen verschiedene automatisierte Verfahren zur Verfügung. Wenn ein Projekt über eine API verfügt kann diese direkt abgefragt werden. Wenn keine standardisierten Schnittstellen vorhanden sind, können die Daten auch durch HTML-Crawling abgefragt werden. Hierfür muss eine Sitemap zur Verfügung gestellt werden. In Ausnahmefällen ist auch der Import statischer Daten-Dumps möglich.
In einem nächsten Schritt widmet sich Metagrid der eigentlichen Datenverarbeitung und analyisert, normalisiert, speichert und aktualisiert die gesammelten Daten.
Für die eigentliche Verknüpfungen der Daten (Matching) stehen drei – sich ergänzende – Optionen zur Verfügung:
1) Wenn bei den Partnerprojekten bereits manuell erstellte Links zu Projektpartnern vorhanden sind, erkennt Metagrid diese und übernimmt die Verknüpfung automatisch.
2) Für noch nicht verknüpfte Daten hat Metagrid Tools entwickelt, die einen semi-automatischen Abgleich ermöglichen. Anhand spezifischer Eckdaten, z.B. Name oder Lebensdaten, werden mögliche Treffer berechnet und für die manuelle Überprüfung vorgeschlagen. Je nach Vollständigkeit der Daten können hierfür unterschiedliche Parameter ausgewählt werden.
3) Darüberhinaus gibt es auch die Möglichkeit, gänzlich manuell Verknüpfungen zu erstellen.
Die auf diese Weise zusammengefügten Entitäten bezeichnen wir als Konkordanzen, sie sind das Ergebnis der verschiedenen Matching-Optionen.
Alle in Metagrid gespeicherten Konkordanzen können als Service per API vom Metagrid Server bezogen werden. Dadurch können Projekte die in Metagrid gespeicherten Verküpfungen zu Partnerprojekten auf ihrer Website darstellen. Ein jQuery Plugin hilft bei der einfachen Integration des Widgets in die Partnerwebseite.
Antworten auf weitergehende Fragen finden Sie in unseren FAQs.
Comment fonctionne Metagrid?
Metagrid collabore actuellement avec plus de vingt partenaires. Ces projets mettent en ligne des données biographiques dans le cadre de leurs missions respectives.
Différentes procédures automatisées permettent leur importation. Si un projet possède une API, il peut passer directement par celle-ci. En l’absence d’interface standardisée, les données peuvent également être collectées par un robot d’indexation HTML. Cette option nécessite l’existence d’un plan de site. Dans des cas exceptionnels, l’importation de données statiques peut se faire par dump.
Par la suite, Metagrid procède au traitement des données proprement dit, en analysant, standardisant, enregistrant et mettant à jour les données collectées.
Trois options complémentaires permettent enfin le couplage des données (matching):
1) Si les projets partenaires ont déjà créé manuellement des liens vers les autres projets partenaires, Metagrid les reconnaît et gère automatiquement le couplage.
2) Metagrid a développé des outils dédiés à la mise en correspondance semi-automatique des données qui n’ont pas encore été couplées. Ces outils, grâce à des données-clés comme le nom ou les dates de naissance et de mort, relèvent des correspondances possibles qu’ils proposent de vérifier manuellement. Le paramétrage peut varier en fonction de l’exhaustivité des données.
3) Il est en outre possible de créer des liens de manière entièrement manuelle.
Les entités ainsi fusionnées sont appelées correspondances; elles sont donc le résultat des différentes options de couplage.
Toutes les correspondances stockées dans Metagrid peuvent être obtenues sous forme de service via l’API du serveur de Metagrid. Les différents projets peuvent de la sorte afficher sur leur site web les informations des projets partenaires stockées dans Metagrid. Un pluginjQuery facilite l’intégration du widget sur le site internet du partenaire.
Vous trouverez des réponses à d’autres questions dans notre FAQ.