Svaki rječnički zapis u datoteci HR.Txt se sastoji od četiri stupca:
- Kosi oblik
- Osnovni oblik
- Oznake
- Vrsta riječi
Stupci su međusobno odijeljeni tabulatorom. Ako se u stupcu “Oznake” nalazi više oznaka, te su oznake međusobno odijeljene prazninom. Korišteno je kodiranje UTF-8.