Для распознавания нам нужен VNImageRequestHandler с картинкой и VNRecognizeTextRequest с опциями recognitionLevel, customWords, recognitionLanguages, а также обработчик завершения, который даст результат в текстовом виде. По завершении собираем лучшие варианты текстов и выводим на экран:
Как вариант бюджетный - фотографировать текст сразу в гугл перерводчике, За качество не отвечаю) А если уж хорошо надо, то лучше человека специально обученного нанять за денежку.
Пока самое главное ограничение — нет поддержки русского языка.