Freegram Founder
Частично со многими вещами согласен. Также соглашусь, что мы некоторые вещи оцениваем субъективно и можем ошибаться. По поводу роста скажу, что он нелинейный. До августа он был экспоненциальным. Каждый месяц количество зарегистрированных пользователей росло в 1.5-2 раза. Я не спорю, что нельзя рассчитывать, что так будет продолжаться, но виральность как раз работает так, что чем больше людей, тем больше людей они зовут.
Я не сказал, что наша соцсеть опережала на голову всех конкурентов, так что не придирайтесь :)
К примеру, если фиесты нет и не будет под андроид, и она примерно такая же, как и фриграм, то я считаю, что мы их опережаем на голову. Тем более, что ее делали 3 года, а не 1)
По моей информации, только 1 из аналогов нас опережал по дневной аудитории, но точно я этого не знаю.
попробуйте рассчитать, тогда поймете, в чем проблема
Хотя если вы начали применять свои алгоритмы в реальной жизни, то наверное уже поняли
а какой доход нейросети на тестовой выборке?
кстати, в статье же написано:
"Даты оценки: с 11 ноября 2012 года по 11 ноября 2021 года."
А вы утверждаете, что тест 1 год. В статье нет результатов за этот год, которого нет в трейне, зато есть результаты за период, который в трейне. Получается, что все-таки это лик, и приведенные х600 результаты некорректны.
9 лет обучающая, 1 год тестовая это правильно. Тогда никаких вопросов нет.
Вы ошибаетесь, это имеет очень больше значение
Во-первых, у вас странное представление о переобучении. Есть переобучение на трейне, а есть утечка теста в трейн, это совершенно разные и несвязанные вещи
Попробуйте обучить любую сеть на тесте, вы получите одинаковые графики лосса на трейне и на тесте (потому что датасеты совпадают), по вашей логике это значит, что переобучения нет. Его и правда нет, но есть лик, значит результатам доверять нельзя
В задачах временных рядов абсолютно всегда нужно делать сплит по времени!!! Нельзя смотреть будущее, на котором вы тестируетесь.
Вот простой пример:
в 2020 году было падение весной, потом бурной рост всего рынка. У меня в обучении не было акции Apple, но зато были все остальные за этот период и модель выучила, что весной лучше все продать, подождать месяц и потом закупиться. Кстати, чтобы это выучить, вам хватит и 1 КБ, поэтому аргументы с размером не очень убедительны
Вы приводите примеры dropout и регуляризаций, это опять же про переобучение. Я рекомендую погуглить "data leakage vs overfitting". Dropout не имеет отношения к проблеме, которую я описываю
Вопрос другой. Вы приводите результат тестирования за последние 9 лет, верно ли, что в обучающей выборке нет ни одного семпла любого (даже другого) инструмента за эти 9 лет?
Добрый день, я надеюсь, вы в обучении не использовали данные за последние 9 лет, в том числе и по другим инструментам? Иначе у вас просто тест утек в трейн, и результат бесполезен
Да, пользователям не важно, сколько строилось, но им очень важна скорость развития, все аналоги очень сильно уступают инсте (я сейчас даже не про активность). И люди сидели в этих аналогах "авансом", что скоро доделают, скоро раскрутят, и будет хорошо. Это не про фиесту, они с мартовского хайпа добавили пару фичей, когда другие успели полностью воспроизвести все их приложение. У фиесты 3 суток лежали сервера. После этого я перестал за ними следить, это несерьезно.