Rječnički zapis

Svaki rječnički zapis u datoteci HR.Txt se sastoji od četiri stupca:

Kosi oblik
Osnovni oblik
Oznake
Vrsta riječi

Stupci su međusobno odijeljeni tabulatorom. Ako se u stupcu “Oznake” nalazi više oznaka, te su oznake međusobno odijeljene prazninom. Korišteno je kodiranje UTF-8.