Eine neuere Version dieses Facts existiert bereits.. (anzeigen:)
ProTerm FH Wien - FAQ
Hier möchte ich kurz auf aufgetauchte Fragen eingehen.
Frage: Wieso wird keine Wortstammreduzierung vorgenommen? Antwort: Aus mehrerern Gründen:
Steht im ProTerm Projekt die Performance im Vordergrund. Die
Wortstammreduzierung ist sehr rechenintensiv. Wir haben uns bewusst
dagegen entschieden. Wir bewegen uns in einem Bereich, in dem wir
mehrere tausend bis millionen Dokumente analysieren. Da summieren sich
die "verlorenen" Sekunden rasch auf. Vor allem verliert man diese
Sekunden bei jedem Einlesevorgang. In unserem Fall muss man ein
auftretendes Wort lediglich einmal als "Soppwort" definieren. Wird die
Wortstammreduzierung dennoch vom Kunden verlangt, können wir sie gerne
einbauen, die Technologie an sich dürfen wir verwenden.
Sind unsere Ressourcen beschränkt. Es sind zur Zeit 3 Personen an
der Entwicklung beteiligt, von denen lediglich 2 Codieren. Wir haben
den Fokus auf die im Bundesheer verlangte Technologie gelekt und haben
zufriedenstellende Ergebnisse im Bereich der Genauigkeit und
hervorragende im Bereich der Geschwindigkeit erreicht. Man bedenke,
dass bei unseren Referenzdokumenten die Analysezeit von ca 20 Minuten
(vor 3 Jahren) auf rund 1 Minute (heute) reduziert wurde.
Frage: Was heißt "Wortstammreduzierung" eigentlich? Antwort: Das heißt, dass Begriffe erkannt werden und auf ihren Wortstamm reduziert werden. Beispiel: "ging" wird durch "gehen" ersetzt. "Männer" wird durch "Mann" ersetzt.
Metainfo:
AutorIn: Markus Gruber; Publiziert von: Markus Gruber (MarkusGruber) factID: 275673.2 (...Archiv); Publiziert am 14 Dez. 2006 19:11