Обычно, когда мы хотим что-то автоматизировать, у нас есть некие входные данные и ожидаемый результат. Например, у нас есть расстояние поездки в такси и оценка пробок, а нам нужно автоматически вычислять время поездки. Классическое решение: сформулировать алгоритм для вычисления результата.
Это самое обучение как данные где-то хранится? Т.е. чтобы не обучать заново каждый раз?
Как много хранится данных для такого котодетектора? И сколько приблизительно памяти будет нужно для мощной сети?
Что в создании нейросети требует серьёзных спецов и ресурсов? То есть, почему каждый васян не может запилить чатгпт?
Свою ChatGPT сделать не получится по многим причинам:
1. Нужен огромный объем данных для обучения чтобы из любого набора слов получить осмысленный результат.
2. Реализовать нейросетку можно очень по-разному (архитектура) и от этого будет зависеть скорость обучения и качество результата. Без глубокого понимания высшей математики и машинного обучения можно сделать только очень примитивную архитектуру, которая будет неэффективно обучаться и выдавать так себе результаты.
3. Обучение нейросети - это как майнинг биткоинов: трудозатратные для железа математические операции. Чтобы обучить такую сеть как ChatGPT нужны супер-компьютеры :)
Да, значения каждой связи (веса) сохраняются после обучения. Для котодетектора не скажу, нет такой сети под рукой. Но для вот таких https://www.youtube.com/watch?v=Hg3nmYD3DjQ футболистов мозги весят 2Мб и имеют 460.000 весов. Обучить такую нейронку на мощном компьютере вполне качественно можно часов за 10.
Как минимум должны быть данные для обучения, много, размеченные. То есть уйма фоток котиков и собачек, для которых указано, где котик, где собачка. Разметку таких данных многие отдают на аутсорс. Можете сходить на толоку и посмотреть для интереса, как люди за копейки выполняют монотонные задания, отличая, грубо говоря, котиков от собачек, определяя номера машин по фото и так далее. Один человек не сможет такую обучающую выборку для обучения сети сделать. Это только один аспект, но важный.
Это самое обучение как данные где-то хранится? Т.е. чтобы не обучать заново каждый раз?Конечно, тот же ChatGPT так и работает: каждому пользователю предоставляется одна и та же уже обученная модель в одинаковом начальном состоянии (хм, звучит как реклама эскорт-агентства...). Далее, общаясь со своей копией, пользователь "донастраивает" модель под свой разговор, но общая основа остается неизменной.