Aidar Musin

+138
с 2021

🙂 https://taplink.cc/aydar_i_m

15 подписчиков
29 подписок

Telegram звезды же не скам. Или Павел Дуров все таки опять заскамил?

Там 100 рублей за каждое устройство. А тут 189 рублей неограниченное кол-во устройств и 200ГБ трафика в месяц)
https://t.me/vpn_helloworld_bot?start=ref_102224442_v

3
1

да, это норм путь если хочется заморачиваться. Но протоколы постоянно блочат и такие дешевые впс нестабильны.

Тут хотябы будет с кого спрашивать)

может, поэтому вы можете использовать локальную модель. В тоже время, лавочка уже прикрыта для РФ, но все кому нужно обходят :)

Да, к тому же очень сильно завиcит от доменной области. Подготовка документов и их разбивка очень сильно влияет. Можете рассмотреть вариант чтобы разбитый корпус еще дополнительно прогонять через LLM чтобы делать суммаризиацию или какое-то другое извлечение информации. А еще всякие подходы к промптингу типа CoT пред ответом.

1

В целом правильно понимаете. Однако алгоритм извлечения информации из корпуса документов может быть сложнее чем простой TFIDF в elastic search

1

да, если что это ответ не на сообщение про зондирование от Невероятного Блондина)
Это другая ветка

Я предполагал что у неё будут большие проблемы с генерацией Json. Однако, у неё это получается

Тоже показалось что их фильтр слишком строго настроен.

2

Причины действительно могут быть разными. Наша гипотеза в том, что незавимо от причин банкротсва, за определенный период(например за пол года) внешние данные будут содержать некие сигналы, которые позволяют это выявить.

Данные по участию компаний в закупках применяются, да

Согласушь с тем, что мы не можем учитывать различные внешние факторы.

Но мы исходили из предположения, что, какими бы не были внешние факторы и причины начала банкроства, компании, которые собираются банкротится, начинают подавать некие сигналы в рамках данных которые у нас есть.

Да, пока прогноз только по крупным компаниям. Но дальше будем и другие сегменты брать

Человек бы не смог в таком количестве генерировать ;)

Да, задача в направлении NLP называется text summarization. Если дообучить эту же модель специальным образом, то может что-то получиться

Не поведётся на что? Имеете ввиду поймёт что это написано компьютером?

Честно говоря, некоторые генерируемые заголовки выглядят настолько реалистично, что начинаешь проверять не правда ли это...

7