Запись DSML Reading Club #1 уже на канале!

16 мая 2025 г. в 09:10

Открыть в Telegram
News image
Запись DSML Reading Club #1 уже на канале!

Еламан Абдуллин рассказал про Byte Latent Transformer

Современные LLM опираются на токенизацию, что ограничивает их гибкость, снижает эффективность и делает их уязвимыми к редким и неформатным входам. Статья предлагает Byte Latent Transformer (BLT) — новую архитектуру, работающую напрямую с байтами. BLT использует динамические патчи, адаптирующиеся к сложности данных, и впервые достигает сравнимого с токенизированными моделями качества при лучшей эффективности и масштабируемости.

Смотреть видео: youtu.be/JN-adAvbAcs

Comments

Member discussion for this news item or vacancy.

Checking sign-in status...