Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen

Aus Geometa Lab OST
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
== To Do ==
 
== Task List RelatedTerm-Erfassung ==
 
tbd.
 
 
== Task List Taginfo API 'relatedterms' ==


* Extrahieren/Preprocessing:
* Extrahieren/Preprocessing:
** pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
** pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
** Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
** Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen

Version vom 6. September 2011, 07:47 Uhr

Task List RelatedTerm-Erfassung

tbd.


Task List Taginfo API 'relatedterms'

  • Extrahieren/Preprocessing:
    • pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
    • Ruby-Code ([1]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen