У нас было 4 нейросети, 2 опенсорсных датасета, 8 000 неразмеченных изображений, 5 333 аугментаций, 392 класса и 4 аккаунта на Roboflow. Не то, чтобы все это было категорически необходимо на проекте, но если уж начал анализировать телевизионное вещание, то к делу надо подходить серьезно. Единственное, что меня беспокоило — это Tesseract.
потом хочу видео посмотреть с рассказом как это реально будет работать и будет ли вообще
Отличная идея, сделаем на YouTube) Ну или на VK видео :D