Support precise tokenizer for LLama 2 models #41

adubovik · 2023-12-11T14:44:07Z

Currrently Llama 2 /tokenize endpoint uses conservative byte-count estimation for a number of tokens.
See how tokenizer is defined in the Llama 2 repo for a reference.
Use the tokenizer from HF.

The text was updated successfully, but these errors were encountered:

adubovik added the enhancement New feature or request label Dec 11, 2023

adubovik self-assigned this Dec 11, 2023

github-project-automation bot added this to AI DIAL Dec 11, 2023

adubovik changed the title ~~Support precise tokenizer for LLama~~ Support precise tokenizer for LLama 2 models May 3, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support precise tokenizer for LLama 2 models #41

Support precise tokenizer for LLama 2 models #41

adubovik commented Dec 11, 2023 •

edited

Loading

Support precise tokenizer for LLama 2 models #41

Support precise tokenizer for LLama 2 models #41

Comments

adubovik commented Dec 11, 2023 • edited Loading

adubovik commented Dec 11, 2023 •

edited

Loading