Мы заметили несоответствующие столбцы в нашем недавнем конвейере данных из определённого источника. Нам нужен был только код office из этой колонки (это две или три буквы, за которыми следует двоеточие и двузначное число). Ранее мы использовали простую операцию замены, чтобы сопоставить столбец с желаемыми значениями. Но поскольку новые данные оказались несовместимыми с этим способом, нам пришлось изменить стратегию. Поскольку мы можем гарантировать согласованность шаблона, мы использовали регулярное выражение для их очистки. Таким образом, нам никогда не придётся беспокоиться об изменении значений в столбцах.