miteigi nemoto — Блог на vc.ru

{"header":{"subsiteData":{"id":224943,"uri":"","name":"miteigi nemoto","karma":281,"subscribers":{"count":23,"url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/details\/subscribers"},"isVerified":false,"isPlus":false,"isPlusHidden":false,"isMe":false,"isUser":true,"hasBadge":false,"hasVideoAvatar":false,"badge":{"size":"large","type":null,"uuid":null,"url":null}},"regardCpuPosition":0,"regardGpuState":false,"hasAccess":false,"stats":[{"icon":"ui_egg","label":"\u041d\u0430 \u043f\u0440\u043e\u0435\u043a\u0442\u0435 \u0441 22 \u043d\u043e\u044f 2018"}],"cover":"","coverVideoUrl":"","coverPositionY":0,"avatar":"b8b7eec4-9bf1-f8fe-7920-4289bf7e472a","avatarSize":[200,200],"description":"\u0414\u0435\u043b\u044e\u0441\u044c \u043b\u0438\u0447\u043d\u044b\u043c \u043e\u043f\u044b\u0442\u043e\u043c \u044d\u043a\u0441\u043f\u043b\u0443\u0430\u0442\u0430\u0446\u0438\u0438 \u0436\u0435\u043b\u0435\u0437\u0430, GPU, \u0432\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u044f \u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0418\u0418.","tabs":[{"url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries","label":"\u0421\u0442\u0430\u0442\u044c\u0438","analytics":"Articles","minCount":0,"isActive":true},{"url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/comments","label":"\u041a\u043e\u043c\u043c\u0435\u043d\u0442\u0430\u0440\u0438\u0438","analytics":"Comments","minCount":0,"isActive":false},{"url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/details","label":"\u041f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435","minCount":0,"analytics":"Details","isActive":false,"counter":0}],"isAvatarChangeAvailable":false,"isCoverChangeAvailable":false,"isDescriptionChangeAvailable":false,"detailsUrl":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/details","achievements":[]},"hasCustomCss":false,"hasCustomHtml":false,"actions":{"subscribe":{"id":224943,"isSubscribed":false,"isNotificationsEnabled":false}},"etcControls":null}

{
            "config": {"baseUrl":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries","active":"new","items":[],"filters":[{"label":"\u041f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u043e\u0435","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/popular","isActive":false,"children":[{"label":"\u041f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u043e\u0435","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries","isActive":false},{"label":"\u0417\u0430 \u0434\u0435\u043d\u044c","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/top\/day","isActive":false},{"label":"\u0417\u0430 \u043d\u0435\u0434\u0435\u043b\u044e","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/top\/week","isActive":false},{"label":"\u0417\u0430 \u043c\u0435\u0441\u044f\u0446","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/top\/month","isActive":false},{"label":"\u0417\u0430 \u0433\u043e\u0434","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/top\/year","isActive":false},{"label":"\u0417\u0430 \u0432\u0441\u0435 \u0432\u0440\u0435\u043c\u044f","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/top\/all","isActive":false}]},{"label":"\u0421\u0432\u0435\u0436\u0435\u0435","url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/entries\/new","isActive":true}],"tags":[]}        }

miteigi nemoto

24 апр

Что лучше для качества обучения bnb_4bit_use_double_quant=False или bnb_4bit_use_double_quant=True

bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 )

15 показов

9 открытий

Машинное обучение

miteigi nemoto

20 апр

Вопрос на засыпку GPT: кто сыграл в роли Кэтрин Данлеви, в фильме "Восхождение Юпитер"

Еще в прошлом году случайно заметил, что GPTшки не знают ответ на этот вопрос или галлюцинируют. Спустя почти год решил проверить, какие модели исправились, включая новейшие Llama 3, WizardLM 2, Command R+ и Mixtral. Оказалось, что ситуация изменилась слабо.

378 показов

116 открытий

miteigi nemoto

12 апр

Мое первое знакомство с ollama

Надоело использовать зоопарк из HF кода для тестирования моделек, как и мне? :-) Пришло время упростить этот процесс с помощью популярного инструмента ollama, полезного для разработчиков и исследователей. Здесь в статье будет упор про терминальное использование на linux, но есть множество разных вариантов GUI - изучайте.

316 показов

330 открытий

miteigi nemoto

10 апр

Поиск ответа в документе на 26 тыс. слов через LLM Cloude / Mixtral / Command

Перефразирую классика - "Все умные LLM похожи друг на друга, каждая тупая LLM глупа по-своему." или "Все маленькие контексты схоже счастливы, каждый большой контекст несчастлив по-своему." 🙈

miteigi nemoto

586 показов

68 открытий

Машинное обучение

miteigi nemoto

29 мар

Сравнение суммаризации в Mixtral-8x7B-Instruct при FP16, 8-bit, 4-bit + бонус примеры из Cloude 3

Насколько квантизация влияет на конечный результат генерации? Вопрос непраздный. Если верить публичным бенчмаркам, то квантизация 4-бит вроде не сильно влияет, особенно для больших моделей от 13B и выше. Но кто разберет эти десятые доли разницы. Лучше всего смотреть на конкретных задачах, для которых выбирается LLM. Я выбрал для теста -…

Красным отмечен ошибочный пункт.

242 показа

166 открытий

Машинное обучение

miteigi nemoto

11 фев

Решения для идентификации языка

Подборка современных решений определения языка по тексту, с уклоном на Python / CLI. Одна из проблем: чем короче фрагмент текста, тем сложнее точно определить язык. Поэтому добавлен комментарий по отношению к коротким сообщениям, когда известно.

Сравнение идентификаторов языка по точности определения.

332 показа

122 открытия

Машинное обучение

miteigi nemoto

19.10.2023

Справочник по выбору GPU для работы с большими языковыми моделями Llama

Dalle-3

3.2K показов

8.7K открытий

Машинное обучение

miteigi nemoto

17.10.2023

Используем LLaMA 2 для обогащения поискового индекса и систем Q&A

490 показов

484 открытия

miteigi nemoto

7.10.2023

Запускаем LLaMa 2 70B GPTQ на двух GPU 24 Gb (для новичков)

Из-за огромного размера GPT-моделей даже для вывода требуется несколько производительных GPU. Для ускорения созданы разные методы квантизации (простыми словами - сжатия), которые существенно снижают требования к видеопамяти.

Сгенерировано DALL·E 3

268 показов

4.4K открытий

miteigi nemoto

19.08.2023

Установка Kingston Fury Beast Black AMD DDR5-6000 128Gb на материнку Asus Z690-P prime

490 показов

815 открытий

miteigi nemoto

16.08.2023

Суммаризация текста с помощью LLaMA-2 13B для новичков

LLM модель типа LLaMA-2, вышедшая в июле 2023 года, умеет многое с помощью правильно составленного текстового запроса (промта) без дополнительного программирования. Одна из очень полезных возможностей это суммаризация текста, c помощью которой можно сделать краткую выдержку по большому тексту даже на русском языке.

"Brain linked with chipset", стиль: artstation, Kandinsky 2.2

422 показа

6.2K открытий

miteigi nemoto

5.05.2023

Проблема нехватки видеопамяти в аудиоклассификаторе

Заметил неоднократно, что при train аудиклассификатора с большим датасетом видеопамять быстро заканчивается на этапе eval. Причем если train сжирает 10Гб, то на eval память жрется прыгая, и на какой-то из эпох или даже на первой выходит CUDA Out of memory.

511 показов

94 открытия

{"id":224943,"url":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto","name":"miteigi nemoto","loginedUserId":0,"isMe":false,"description":"\u0414\u0435\u043b\u044e\u0441\u044c \u043b\u0438\u0447\u043d\u044b\u043c \u043e\u043f\u044b\u0442\u043e\u043c \u044d\u043a\u0441\u043f\u043b\u0443\u0430\u0442\u0430\u0446\u0438\u0438 \u0436\u0435\u043b\u0435\u0437\u0430, GPU, \u0432\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u044f \u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0418\u0418.","subscribers":{"items":[{"image":"https:\/\/leonardo.osnova.io\/afcaf657-ad04-5353-b02d-a6b455d0dc80\/","url":"https:\/\/vc.ru\/u\/196506-andrey-kartsev","label":null,"id":196506,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/815e8595-4693-0852-f26d-70fac32c3d8d\/","url":"https:\/\/vc.ru\/u\/602233-maksim-cuprik","label":null,"id":602233,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/460e692e-6e7a-58a6-a0f0-af54cc58bba6\/","url":"https:\/\/vc.ru\/u\/1088352-maks-vyaznikov","label":null,"id":1088352,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/d0cf77f6-3783-5792-9f83-ca428f23d9b4\/","url":"https:\/\/vc.ru\/u\/2764023-artem-pogadaev","label":null,"id":2764023,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/13558db6-4c45-4923-85c3-559210cebd59\/","url":"https:\/\/vc.ru\/u\/3155541-pavel-zloi","label":null,"id":3155541,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/6629ba06-f8b0-5bd8-adc5-9f77f65abe28\/","url":"https:\/\/vc.ru\/u\/1088515-maxim-shumekov","label":null,"id":1088515,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/111456c2-3de4-512e-86e5-927c3202b0be\/","url":"https:\/\/vc.ru\/u\/2592280-stepan-kavelich","label":null,"id":2592280,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/372efcae-474a-5f12-a635-c2b2bc677209\/","url":"https:\/\/vc.ru\/u\/700458-backdoor","label":null,"id":700458,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/9817194e-522b-56d1-bc29-8fb7d0733cdb\/","url":"https:\/\/vc.ru\/u\/2844434-alexander-kozlov","label":null,"id":2844434,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/10a61fe7-fb26-5879-a92a-b0d424a9316a\/","url":"https:\/\/vc.ru\/u\/3156641-evgeniy","label":null,"id":3156641,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/13558db6-4c45-4923-85c3-559210cebd59\/","url":"https:\/\/vc.ru\/u\/2698130-alex","label":null,"id":2698130,"isSubscribed":false},{"image":"https:\/\/leonardo.osnova.io\/b9a92d02-1dff-538e-b40b-1b967125d1cf\/","url":"https:\/\/vc.ru\/u\/2694142-alex-brit","label":null,"id":2694142,"isSubscribed":false}],"lastId":0,"lastSortingValue":0},"subscriptions":{"items":[{"label":"MarketGuru.io","image":"https:\/\/leonardo.osnova.io\/075e1ed6-c9ad-5a2a-aab9-eb19db5a2ca2\/","url":"https:\/\/vc.ru\/u\/672661-marketguru-io","id":672661,"isSubscribed":false},{"label":"\u0422\u0440\u0438\u0431\u0443\u043d\u0430","image":"https:\/\/leonardo.osnova.io\/04607ca7-338b-561e-9403-3f06a70ef789\/","url":"https:\/\/vc.ru\/tribuna","id":199116,"isSubscribed":false},{"label":"\u041c\u0435\u0434\u0438\u0430","image":"https:\/\/leonardo.osnova.io\/98f51098-7f91-580c-9cbc-e492869a0d20\/","url":"https:\/\/vc.ru\/media","id":199130,"isSubscribed":false},{"label":"\u041e\u0444\u0438\u0441","image":"https:\/\/leonardo.osnova.io\/d714e9d5-61eb-53dd-9fd0-5b6d216bc0fa\/","url":"https:\/\/vc.ru\/office","id":200564,"isSubscribed":false},{"label":"\u041a\u0430\u0440\u044c\u0435\u0440\u0430","image":"https:\/\/leonardo.osnova.io\/7e34636c-3189-5ba0-a2b3-c1c9ee18b5ba\/","url":"https:\/\/vc.ru\/hr","id":199121,"isSubscribed":false}],"page":2,"count":32},"rules":"","contacts":[],"counters":{"subscribers":23,"subscriptions":32},"dummy":{"subscribers":"\u0423 \u0431\u043b\u043e\u0433\u0430 \u0435\u0449\u0451 \u043d\u0435\u0442 \u043f\u043e\u0434\u043f\u0438\u0441\u0447\u0438\u043a\u043e\u0432"},"detailsTabBaseUri":"https:\/\/vc.ru\/u\/224943-miteigi-nemoto\/details"}