Verktøy og programpakker for tekst-mining

Det finnes mange verktøy, programvarer og plattformer for tekst-mining. Søk for eksempel på «text mining tools» for å se etter oppdaterte oversikter. Denne Wikipedia-artikkelen kan være et sted å begynne. Under ser du eksempler på aktuelle programvarer, programmeringsspråk og applikasjoner du kan bruke.

Voyant Tools

Voyant Tools er et webbasert verktøy for digital analyse av tekst. Det er brukervennlig og har mange funksjonaliteter.

I Voyant Tools kan du laste opp filer du har liggende på maskinen din. Voyant Tools godtar en rekke forskjellige filformater, som docx, pdf, txt osv. Trykk «upload» og velg filene du vil laste opp. I løpet av noen sekunder har applikasjonen registrert filene som et korpus, og du ser umiddelbart informasjon om det og kan gjøre en rekke analyser.

Skjermbilde av Voyant Tools

Mer om Voyant Tools finner du under komme i gang med verktøyene og programpakkene.

Antconc

Med programvaren AntConc kan du relativt enkelt utføre flere typer tekstanalyser.

Skjermbilde av siden hvor man kan laste ned og installere Antconc
AntConcs forside

Mer om AntConc finner du på siden komme i gang med verktøyene og programpakkene.

Jupyter Notebook

Med Jupyter Notebook kan man gjøre en rekke forskjellige analyser av datamateriale, blant annet ulike typer tekst-mining/digital analyse av tekst.

Jupyter Notebook er en åpen kildekode-applikasjon utviklet av firmaet Jupyter Group. Programvare med åpen kildekode innebærer at alle kan få innsyn i hvordan den fungerer, dele og videreutvikle den. (Se f.eks. SNL for mer om åpen kildekode). I Jupyter Notebook kan man skrive og kjøre diverse koder (gjerne skrevet i programmeringsspråket Python, men kan også konfigureres for bruk av andre programmeringsspråk). Med å “kjøre kode” menes å få programmet til å utføre en kommando.

Du kan du lese mer hos Project Jupyter om Jupyter Notebook og andre Jupyter-produkter, samt om bruk innen undervisning, forskning og annen virksomhet rundt om i verden. Jupyter Notebooks kan brukes innen nær sagt alle fagfelt der man har å gjøre med data. Se en oversikt på GitHub.

Jupyter Notebook er ikke i seg selv et verktøy for tekstmining, men en applikasjon der koder for blant annet dette kan skrives og kjøres. Nasjonalbiblioteket har tilgjengeliggjort store mengder av sine digitaliserte samlinger for analyse via Jupyter Notebook. Les mer og se eksempel-notebøker hos Nasjonalbibliotekets DH-Lab.

En introduksjon til Jupyter Notebook med presentasjon av grunnleggende funksjoner finner du under komme i gang med verktøyene og programpakkene.

R og RStudio

R er en programvare og programmeringsspråk, mens Rstudio er det grafiske grensesnittet man arbeider i. Med R og Rstudio har man en rekke verktøy for tekstanalyse, statistiske analyser og grafiske fremstillinger.

Skjermbilde av grensesnittet i R studio.
Grensesnittet i RStudio

Mer om R og Rstudio finner du under komme i gang med verktøyene og programpakkene.

Publisert 27. mai 2021 13:56 - Sist endret 16. juni 2022 09:31