38000

Считаю векторные базы слов. Это когда каждое слово представляет собой список из 38 000 значений, каждое из которых обозначает силу его связи с каким-то другим словом.

Если представить любые два слова как x и y, то все остальные слова, как либо с ними связанные, будут распределены на этой плоскости, как звезды в небе. таким образом, все вектора это как бы система с 38 000 измерений.

И каждое слово имеет в ней собственные координаты. И возможно сосчитать удаленность любого слова от любого другого.Так устроены векторные базы.

Но уверена, точно так же устроены связи между словами нашем бессознательном. В этом небе существуют созвездия, которые описывают более сложные понятия. В этих созвездиях словно бы мгновенно усиливается связь некоторых слов.

Сосчитала менее 5% нужного количества слов, но уже видно, что это все работает верно.

По-хорошему, слов должно быть намного, намного больше. Но даже и эти 38000 займут у меня месяц локального рендера.

11
Начать дискуссию