tekstide sõna-sõnaline tõlkimine tänapäeva kirjakeelde (nt murret või vanemat keelekasutust sisaldavate korpuste puhul)
mõõtmis- või loendusandmete teisendamine selleks, et andmestiku alamosad oleksid omavahel võrreldavad
Hea teada
Näiteks sõnesageduste normaliseerimiseks arvutatakse sõnede absoluutsagedus ümber vastavalt korpuse suurusele (nt 1000, 10000 sõne kohta), st leitakse suhteline sagedus.