реклама
разместить

Преобразование предложений в вектора с помощью Sentence Transformers в Python

Sentence Transformers - библиотека в Python, которая позволяет преобразовывать в вектора целые предложения/абзацы с целью их дальнейшей обработки (например кластеризации).

Установка происходит стандартными методами:

pip install -U sentence-transformers

или на конде:

conda install -c conda-forge sentence-transformers

Пример использования библиотеки:

  • Импортируем необходимый модуль
  • Загружаем нужную версию
  • Задаем предложения, которые нужно преобразовать в вектора
  • Непосредственно преобразовываем
from sentence_transformers import SentenceTransformer model = SentenceTransformer("all-MiniLM-L6-v2") sentences = ["The weather is lovely today.","It's so sunny outside!","He drove to the stadium.",] sentence_embeddings = model.encode(sentences) print(sentence_embeddings)

Больше полезной информации вы можете найти в моем Телеграм канале Бизнес, IT и статистика

реклама
разместить
Начать дискуссию
300 нейросетей для текстов, которые заменят тебе тридцать отделов копирайтеров — эпичная подборка, которую пока никто не видел
300 нейросетей для текстов, которые заменят тебе тридцать отделов копирайтеров — эпичная подборка, которую пока никто не видел
2020
33
реклама
разместить
130 нейросетей для перевода текста, видео и документов, с которыми ты забудешь о Google Translate — эпичная подборка
130 нейросетей для перевода текста, видео и документов, с которыми ты забудешь о Google Translate — эпичная подборка
1515
«Мы ребята не зазнайки…», или 9 честных ответов на вопросы о работе пресейл-менеджера

С какими болями приходят в агентство клиенты? Как долго готовится коммерческое предложение? Как строятся прогнозы по SEO? Правда ли, что с маленьким бюджетом можно не рассчитывать на индивидуальный подход? Отвечает руководитель отдела пресейла Kokoc.com Марина Архипова.

«Мы ребята не зазнайки…», или 9 честных ответов на вопросы о работе пресейл-менеджера
66
Создание трансформера с нуля: Понимание каждого слоя

1. Входный эмбеддинг

Сlaude и GPT-4o, очень хорошо работают с этим промтом: он заставляет «рассуждать», прежде чем дать окончательный ответ.
Сlaude и GPT-4o, очень хорошо работают с этим промтом: он заставляет «рассуждать», прежде чем дать окончательный ответ.

Cкопируйте promt снизу или возьмите его от [сюда]:

Объединяем функционал мини-приложения, чат-бота и Telegraph для создания привлекательной и удобной базы знаний [ пример из практики ]
Объединяем функционал мини-приложения, чат-бота и Telegraph для создания привлекательной и удобной базы знаний [ пример из практики ]
11
Почему мы знаем, что нужно делать, но не делаем этого: разгадка парадокса жизни

Я сидел на диване, задумавшись. Мои глаза скользили по дому, который как будто говорил мне: «Ты же знаешь, что с этим нужно сделать». Но я сидел...

«Т-Технологии» выложила исходный код больших языковых моделей на 32 млрд и 7 млрд параметров

Компания утверждает, что это «лучшие в мире открытые модели на русском языке».

«Т-Технологии» выложила исходный код больших языковых моделей на 32 млрд и 7 млрд параметров
3232
1111
22
22
[]