Komme i gang med verktøyene og programpakkene

Her finner du veiledning i hvordan installere og bruke verktøyene og programpakkene vi har valgt ut.

Voyant Tools – en innføring

Voyant Tools er en webapplikasjon, og ingen installasjon er nødvendig.

Det er flere måter å sette sammen tekst for analyse i Voyant Tools. Du kan for eksempel bygge korpus med dokumenter du har liggende på maskinen din (se hvordan i presentasjonen av Voyant Tools under verktøy og programpakker for tekstmining).

Når du har lastet opp et korpus i Voyant Tools, ser du etter noen sekunder en del informasjon om det, som en ordsky som viser de mest frekvente ordene, oversikt over totalt antall ord og tegn, hvor mange dokumenter det består av m.m.

Automatisk er et såkalt «stop word»-filter aktivert. Det gjør at de aller mest frekvente ordene i korpuset, gjerne funksjonsord, er filtrert bort. Dette filteret kan slås av, og det kan velges andre stoppordfiltre, deriblant norskspråklig.

Nederst til høyre i Voyant Tools-applikasjonen finnes et vindu med en oversikt over «keywords» eller konkordanser (se konkordansanalyser under  typer tekstmining). Du kan dra i vinduet for å gjøre det større. Automatisk vises konkordanser for det mest frekvente ordet i korpuset. Men du kan endre slik at du ser konkordanser for det eller de ordene du er interessert i.

Øverst til høyre i menyen i applikasjonen kan du få opp en oversikt over flere «corpus tools», for eksempel «collocates» og «topics» (se kollokasjonsanalyser og temamodellering under typer tekstmining).

Se Voyant Help for mer informasjon.

Ta gjerne kontakt med oss for veiledning.

Antconc – installasjon og innføring

Last ned og installer Antconc.

Med Antconc kan du utføre konkordansanalyser, kollokasjonsanalyser og korpussammenligning (se mer under typer tekstmining).

Se denne grundige innføringen til Antconc hos The Programming historian.

Ta gjerne kontakt med oss for veiledning.

Jupyter Notebook – innstallasjon og innføring

Vi anbefaler å installere Jupyter Notebook fra Anaconda. Anaconda er en plattform for distribusjon av blant annet programvarer for programmeringsspråket Python. Da får man automatisk all den programvaren man trenger og mer til.

Når Anaconda er installert, gå til programmer/Applications og start Anaconda.

Klikk «Launch» på Jupyter Notebook-ikonet.

Du kan også åpne et terminalvindu og skrive ‘jupyter notebook’. I et terminal- eller kommandolinjevindu på en datamaskin kan vi kommunisere direkte med operativsystemet eller programmer på maskinen, utføre kommandoer som å installere, oppdatere eller starte programmer m.m.

En annen mulighet er å gå via Jupyter Lab, enten ved å klikke “Launch” under lab-ikonet eller skrive ‘jupyter lab’ i et terminalvindu.

Anaconda går for å være det enkleste og mest automatiske måten å installere, men det finnes også andre måter å installere Jupyter på, via terminalvindu.

Ønsker du for eksempel å søke etter konkordanser (se konkordansanalyser under typer tekstmining) i Nasjonalbibliotekstets digitale samlinger, gå til NBs DH-Lab og last ned eksempelnoteboken for konkordansanalyser. (Er dette første gangen du bruker ressurser fra Nasjonalbibliotekets DH-Lab, bør du imidlertid først studere inforrmasjonen og gå inn på "oppstart DH-Lab" på nettsidene til NB). Merk deg hvor du lagrer den på maskinen din. Nå kan du åpne Jupyter Notebook (se over). Nettleseren din åpner da en side der du ser mappene og filene på maskinen din i «Jupyter Notebook-layout». Finn her fram til den noteboken du vil jobbe i og åpne den.

En Jupyter Notebook består av to typer celler (eller blokker) kodeceller og markdown-celler.

En kodecelle består av en eller flere instruksjoner eller kommandoer som beskriver en oppgave som skal utføres (for eksempel å telle antall ord i en tekst eller laste inn noe vi skal bruke senere). 

Eksempel på en kodecelle

I en markdown-celle kan vi skrive fritekst, for eksempel forklaringer til kodecellene.

Eksempel på en markdown-celle

For at kommandoene i kodecellene skal utføres, må cellene kjøres. Gå til menyen i noteboken du har åpnet, til «cell» -> «run all» for å kjøre alle cellene i noteboken. Du kan også trykke «run» for kun å kjøre den cellen du har satt markøren i. Det kan ofte være greit å starte med «run all», så du er sikker på at alle de nødvendige kodecellene aktiveres. Endrer du etterpå på noe i en av cellene (for eksempel justerer perioden du søker i), er det tidsbesparende å bare kjøre denne cellen.

Via Jupyter Notebook og Python kan man gjøre en rekke forskjellige typer tekstmining, som kollokasjonsanalyser, automatisk navnegjenkjenning, n-gram-søk, konkordansanalyser, temamodellering, korpussammenligning og sentimentanalyse (les mer om typer tekstmining), i tillegg til svært mye annet.

Ta kontakt med oss for veiledning. Se også Carpentry@UiO for blant annet workshops i Python og Jupyter Lab/Jupyter Notebook.

RStudio: Installasjon og introduksjon

Både R og RStudio må installeres:

I RStudio kan man gjøre en rekke forskjellige typer tekst-mining, som konkordansanalyser, kollokasjonsanalyser, automatisk navnegjenkjenning, temamodellering, korpussammenligning og sentimentanalyse (les mer om typer tekstmining), i tillegg til svært mye annet.

Ta kontakt med oss for veiledning. Se også Carpentry@UiO for blant annet workshops om R og RStudio.

Publisert 27. mai 2021 13:20 - Sist endret 24. mai 2022 09:38