English version of this page

Tekstutvinning

Tekstutvinning ("text mining"), også referert til som digital tekstanalyse, går ut på å bruke digitale verktøy til å søke, utvinne og analysere tekstdata.

"Text Mining is the discovery by computer of new, previously unknown information, by automatically extracting information from different written resources... The difference between regular data mining and text mining is that in text mining the patterns are extracted from natural language text rather than from structured databases of facts." - from What is Text Mining? by Marti Hearst

Hvorfor tekstmining? Automatiserte søketeknikker kan gi oversikt over mønstre og tendenser i store tekstmasser. Dette kan gi innsikt som ville være vanskelig og svært tidkrevende å oppnå ved hjelp av kvalitative metoder alene.

  • Typer tekstutvinning
    • Her finner du en presentasjon av forskjellige tekstminingsmetoder som for eksempel å plotte ordfrekvensers variasjon og forekomst over tid og søke etter konkordanser.
  • Verktøy og programpakker for tekstutvinning
    • Her finner du en presentasjon av ledende programmeringsspråk og verktøy til tekstutvinning, med tips for hvordan å komme i gang med dem.