Diskussion:POI-Service: Unterschied zwischen den Versionen
Stefan (Diskussion | Beiträge) |
Stefan (Diskussion | Beiträge) |
||
| Zeile 6: | Zeile 6: | ||
== Tag-Suchstrategie == | == Tag-Suchstrategie == | ||
Input: Suchbegriff (z.B. "Schloss" mit Sprachcode, z.B. "DE") | |||
Services: | |||
* Taginfo API (inkl. neu: get RelatedTerms) | * Taginfo API (inkl. neu: get RelatedTerms) | ||
* Bing Translation API (sonst Chemnitzer Tools) | * Bing Translation API (sonst Chemnitzer Tools) | ||
* Liste von deutschen und englischen RelatedTerms | * Liste von deutschen und englischen RelatedTerms | ||
Preprocessing | Preprocessing am Beispiel einer Suche nach dem deutschen Term "Schloss" (ein Term ist meist identisch mit Wort, jedoch möglicherweise zusammengesetz bzw. mit Space getrennt): | ||
# RelatedTerms ermitteln: DE-Termliste enthält nun "Schloss, Villa, Ruine" (via neue Taginfo API, Resultat: AnyLanguage-Termliste) | |||
# Übersetzung AnyLanguage=>EN: Im Beispiel ergibt das eine EN-Termliste "castle, villa, ruin" (mit Bing API, Resultat EN-Termliste) | |||
# EN-Termliste mit RelatedTerms erweitern: EN-Termliste hat nun nebst "castle, villa, ruin" palace" zusätzlich "manor, bunker, chateau, citadel" (via neue Taginfo API, Resultat: Neue EN-Termliste) | |||
# Statistik zu EN-Termliste sammeln: Terms je als Keys und als Values abfragen (bestehende Taginfo API). | |||
Ranking: | Ranking (Vorschlag SK): | ||
# | # Kommt urspr. Suchbegriff als Key vor? | ||
# " | ## falls value "YES/NO" ist => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "bench=yes" und "amenity=bench". | ||
## ansonsten => Rückgabe Liste mit allen zugehörigen Values (z.B. z.B. Suche nach "EN:amenity" ergibt "amenity=parking; amenity=restaurant; amenity=bench; ...". | |||
# Kommt urspr. Suchbegriff als Value vor? | |||
## => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "amenity=bench". | |||
## Zusätzliche Gewichtung falls es eine Wiki-Seite zum Suchbegriff gibt. | |||
Dann dasselbe mit der ganzen EN-Wortliste im Sinne von "Meinten Sie..."? | |||
Linguistik-Tools: | |||
* Google Translate API | * Wortübersetzung: | ||
* | ** Bing API (Google Translate API wird kostenpflichtig). Freies Dictionary (en=>de): http://www-user.tu-chemnitz.de/~fri/ding/ | ||
* (zu | ** Google Translate API (ist obsolet). | ||
* Synonyme: [http://lingucomponent.openoffice.org/thesaurus.html OpenOffice]/WordNet (englisch und andere Sprachen) oder [http://www.openthesaurus.de/ OpenThesaurus.de] (Deutsch). | |||
* Ontologie: => zu komplex für OSM-Leute(?) | |||
** z.B. SKOS | |||
== Taginfo-Beispiele == | == Taginfo-Beispiele == | ||
Version vom 28. August 2011, 10:06 Uhr
Allgemeines
...
Tag-Suchstrategie
Input: Suchbegriff (z.B. "Schloss" mit Sprachcode, z.B. "DE")
Services:
- Taginfo API (inkl. neu: get RelatedTerms)
- Bing Translation API (sonst Chemnitzer Tools)
- Liste von deutschen und englischen RelatedTerms
Preprocessing am Beispiel einer Suche nach dem deutschen Term "Schloss" (ein Term ist meist identisch mit Wort, jedoch möglicherweise zusammengesetz bzw. mit Space getrennt):
- RelatedTerms ermitteln: DE-Termliste enthält nun "Schloss, Villa, Ruine" (via neue Taginfo API, Resultat: AnyLanguage-Termliste)
- Übersetzung AnyLanguage=>EN: Im Beispiel ergibt das eine EN-Termliste "castle, villa, ruin" (mit Bing API, Resultat EN-Termliste)
- EN-Termliste mit RelatedTerms erweitern: EN-Termliste hat nun nebst "castle, villa, ruin" palace" zusätzlich "manor, bunker, chateau, citadel" (via neue Taginfo API, Resultat: Neue EN-Termliste)
- Statistik zu EN-Termliste sammeln: Terms je als Keys und als Values abfragen (bestehende Taginfo API).
Ranking (Vorschlag SK):
- Kommt urspr. Suchbegriff als Key vor?
- falls value "YES/NO" ist => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "bench=yes" und "amenity=bench".
- ansonsten => Rückgabe Liste mit allen zugehörigen Values (z.B. z.B. Suche nach "EN:amenity" ergibt "amenity=parking; amenity=restaurant; amenity=bench; ...".
- Kommt urspr. Suchbegriff als Value vor?
- => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "amenity=bench".
- Zusätzliche Gewichtung falls es eine Wiki-Seite zum Suchbegriff gibt.
Dann dasselbe mit der ganzen EN-Wortliste im Sinne von "Meinten Sie..."?
Linguistik-Tools:
- Wortübersetzung:
- Bing API (Google Translate API wird kostenpflichtig). Freies Dictionary (en=>de): http://www-user.tu-chemnitz.de/~fri/ding/
- Google Translate API (ist obsolet).
- Synonyme: OpenOffice/WordNet (englisch und andere Sprachen) oder OpenThesaurus.de (Deutsch).
- Ontologie: => zu komplex für OSM-Leute(?)
- z.B. SKOS
Taginfo-Beispiele
Beispiele für das Taginfo API
keys - Gegeben key, gib alle values mit Rangierung zurück: http://taginfo.openstreetmap.ch/keys/historic#values (API)
search/values - Gegeben value, gib alle Tags ("key=value") mit Rangierung zurück: http://taginfo.openstreetmap.ch/search?q=castle#values (API)
tags/overview - Gegeben Tags ("key=value"), gib Infos zurück (falls welche im Wiki): http://taginfo.openstreetmap.ch/tags/overview?key=historic&value=castle#wiki (API)
keys/overview - Gegeben key, gib nodes/ways/relations-Statistik zurück: http://taginfo.openstreetmap.ch/keys/overview?key=historic API
db/keys - Gegeben key, gib Wiki-Seiten zurück: http://taginfo.openstreetmap.ch/keys?query=historic&filter=in_wiki (API)
Weblinks
Notizen
- Eine Tag=Value-Paar-Statistik kann auch aktuell und direkt aus der OSM-DB berechnet werden. Das dauert lange - nur schon für CH z.Zt. drei Minuten! - die Daten ändern sich aber nicht so schnell grundlegend). Das bietet auch die TagInfo API.