Crimson Tokenizer

Tokenizator BPE trenowany na korpusie polskich tekstów datasetu SpeakLeash