Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Create a set of open LLMs for the service and make a map of their use #77

Open
Vl-Tershch opened this issue Dec 11, 2024 · 4 comments
Open
Assignees
Labels
LLM Working with LLM Scientific Research The task is part of a scientific study

Comments

@Vl-Tershch
Copy link
Collaborator

Задача: Сформировать набор открытых LLM для сервиса и составить карту их использования.

@Vl-Tershch Vl-Tershch added LLM Working with LLM Scientific Research The task is part of a scientific study labels Dec 11, 2024
@Vl-Tershch Vl-Tershch added this to the Edulytica_2024_2025 milestone Dec 11, 2024
@Vl-Tershch Vl-Tershch self-assigned this Dec 11, 2024
@Vl-Tershch
Copy link
Collaborator Author

@aimspot подсказал, что по мультимодальным можно посмотреть модели blip2, clip, paligemma.

@MrMegnis
Copy link
Contributor

На созвоне обговорили необходимые критерии моделей:
В приоритете - качество, хорошо, если модель обучалась с большим количеством русских данных
Минимальное контекстное окно - 32000
Размер моделей средний - от 10B до 32B
Желаемо наличие мультимодальности

@AnastasyaDedkova
Copy link

AnastasyaDedkova commented Jan 24, 2025

Проанализировала лидерборд русскоязычных моделей, подходящих под критерии. Материалы находятся в документе ФС_БЯМ.


Analyzed the leaderboard of Russian-speaking models that fit the criteria. The materials are in the document FS_LLM.

@MrMegnis
Copy link
Contributor

@aimspot подсказал, что по мультимодальным можно посмотреть модели blip2, clip, paligemma.

Протестировал мультимодальные модели, брал небольшие, до 3b, оказалось, что даже такие на инференсе занимают около 15гб.

  1. https://huggingface.co/google/paligemma2-3b-pt-896

Достаточно легко поднимается, трудностей с инференсом не возникло, однако есть существенные недостатки. Во-первых максимальный размер изображения - 896x896, а во-вторых она (конкретно 3b) отвечает очень просто и по-английски, даже если попросить её говорить на русском.

  1. https://huggingface.co/Salesforce/blip2-opt-2.7b

Поднимается, но почему-то ничего не генерирует. Даже пример разработчиков не работает.

  1. https://huggingface.co/docs/transformers/model_doc/clip

Модель интересная и очень лёгкая, но она хуже работает с русским и является encoder-only моделью (что по сути своей является особенностью, а не недостатком)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
LLM Working with LLM Scientific Research The task is part of a scientific study
Projects
None yet
Development

No branches or pull requests

3 participants