Falcon Mamba: англоязычная языковая модель на архитектуре Mamba.

⚡Falcon Mamba: англоязычная языковая модель на архитектуре Mamba.
Falcon Mamba - модель от Technology Innovation Institute (TII, Dubai, UAE), основанная на архитектуре Mamba, которая может обрабатывать последовательности произвольной длины без увеличения памяти хранения.
Модель была обучена на ~5500GT данных RefinedWeb, качественных технических данных и экземпляров кода на разных языках программирования из открытых источников.

Falcon Mamba: англоязычная языковая модель на архитектуре Mamba.

Архитектура модели построена на оригинальной Mamba с добавлением дополнительных слоев нормализации RMS. Такая комбинация придает модели возможность обрабатывать последовательности любой длины без необходимости увеличения потребления памяти, вмещаясь, по сути, на одну А10 24 GB.

Falcon Mamba: англоязычная языковая модель на архитектуре Mamba.

Falcon Mamba доступна в экосистеме Hugging Face и совместима с большинством API Hugging Face.

Модель также поддерживает функцию квантование bitsandbytes, для обеспечения возможности запуска модели на небольших GPU и CPU.Коллекция моделей FalconMamba 7B:

🟢falcon-mamba-7b-instruct (https://huggingface.co/tiiuae/falcon-mamba-7b-instruct)

🟠falcon-mamba-7b-4bit (https://huggingface.co/tiiuae/falcon-mamba-7b-4bit)

🟠falcon-mamba-7b-instruct-4bit (https://huggingface.co/tiiuae/falcon-mamba-7b-instruct-4bit)📌Лицензирование : TII Falcon-Mamba License 2.0🟡Страница проекта (https://www.tii.ae/news/uaes-technology-innovation-institute-revolutionizes-ai-language-models-new-architecture)

🟡Коллекция моделей на HF (https://huggingface.co/collections/tiiuae/falconmamba-7b-66b9a580324dd1598b0f6d4a)

🟡Demo (https://huggingface.co/spaces/tiiuae/falcon-mamba-playground)@ai_machinelearning_big_data#AI

Начать дискуссию