Что такое Teradata? Её отличия от аналогов

Что такое Teradata? Её отличия от аналогов

В данной статье приведено описание системы управления базами данных (СУБД) Teradata через призму сравнения с аналогичными, известными и более распространенными решениями:

  • MS SQL – Ориентированно на исполнение запросов на одном физическом сервере;
  • Oracle – Ориентированно на исполнение запросов на одном физическом сервере;
  • Hadoop – Ориентировано на распределённом хранении данных.

Представим ситуацию, когда потребителю нужна высокопроизводительная, отказоустойчивая, масштабируемая СУБД.

Как бы ни были хороши и привычны MS SQL и Oracle, но мы ограниченны одним сервером. В какой-то момент мы столкнёмся с проблемой ограничения по производительности.

Hadoop действительно лишена недостатка, в ограничении использования одного сервера. Позволяет, использовать разнородное оборудование, размещенное в больших сетях, а стоимость хранения данных невелика. Его слабость заключается в использовании TCP/IP v4/v6 протоколов между критичными узлами Hadoop, что снижает производительность обмена информацией в сети.

СУБД Teradata для связи физических серверов (Нод) использует специализированную физическую сеть BYNET, которая, при передаче данных, обладает низкими накладными расходами, обеспечивает недоступную для конкурентов производительность и время доступа. Если учесть, что скорость сети является самым узким местом в распределенных СУБД, то и наличие BYNET является серьёзным преимуществом. Связанно это с тем, что не все запросы хорошо распараллеливаются и грубые методы «fullscan» нагружают именно связку между Нодами.

SMP узел – это физический сервер на котором инициировано несколько экземпляров PE (Parsing Engine) и AMP (Access Module Processor) представлен на рисунке:

Что такое Teradata? Её отличия от аналогов

Хранилище данных Teradata представляет собой связку из Жестких дисков и SSD накопителей, что даёт наилучшие показатели времени доступа к данным из хранилищ, использующих Жесткие диски.

При организации СУБД Teradata под каждый определенный объем дискового пространства назначается виртуальный процессор «AMP» (Access Module Processor) и «PE» (Parsing Engine). Их работа практически не зависит от других виртуальных процессоров.

Если сравнивать с точки зрения систем хранения данных, то в Oracle, MS SQL, Hadoop - жесткие диски подключают через высокопроизводительные дисковые контроллеры сторонних производителей, а в Teradata используются специализированные хранилища, которые в свою очередь лучше интегрированы в систему.

Указанная концепция хранения позволяет использовать такое понятие, как «температура данных». Данная технология является серьёзным конкурентным преимуществом так как в Teradata данные распределяются в зависимости от их востребованности на более быстрых секторах (цилиндрах) жесткого диска или наоборот.

В связи с тем, что подключение к хранилищу происходит на более низком уровне, чем у конкурентов, АМП выполняет агрегацию, создаёт блокировки, осуществляет вставку, чтение и удаление значительно эффективней. То есть между потребителем и самими данными меньше узлов и издержек.

Благодаря унифицированной структуре размещения блоков данных на хранилищах Teradata, подключая новые Ноды к существующему кластеру, мы получаем увеличение производительности, отказоустойчивости, доступного дискового пространства. Аналогично при отключении узлов кластера мы получаем снижение всех указанных характеристик.

Подключение новых Нод, происходит проще чем на Hadoop. Перенос данных осуществляется быстрее, как и балансировка нагрузки.

Главным недостатком СУБД Teradata относительно конкурентов, является высокая стоимость, как системы в целом, так и стоимость хранения данных.

Второй недостаток — скудный инструментарий по работе с СУБД.

Третьим недостатком является тот факт, что Teradata получила меньшее распространение чем Hadoop. Из этого исходят и проблемы, с внедрением и сопровождением данной СУБД.

Подведем итог визуализацией сильных и слабых сторон СУБД Teradata по отношению к конкурентам:

Что такое Teradata? Её отличия от аналогов

Node. Это отдельное вычислительное устройство (компьютер), являющийся частью группы таковых устройств (кластера) которые совместно используются для решения вычислительных задач.

33
12 комментариев

Комментарий недоступен

1
Автор

Arthur Niazyan, спасибо за вопрос, статью мы писали для тех, кто совсем не знаком с СУБД (и не является продвинутым IT-специалистом). Сделали акцент на преимуществах и недостатках. Сейчас в работе чаще используем Hadoop и MS SQL. 
Teradata - реже, но и в ней запускаем SQL запросы, зависит от поставленной задачи.

2

Вот кейс, в нём Teradata

1
Китайская BYD представила платформу для запуска дронов DJI с крыши автомобиля

Она доступна в Китае по цене около $2200.

Источник: Handout / SCMP
55
11
реклама
разместить
На двух станциях метро в Санкт-Петербурге запустили оплату проезда «лицом»

Чтобы воспользоваться этим методом, нужно зарегистрироваться в системе и привязать биометрию к банковской карте.

Источник: Комитет по транспорту Санкт-Петербурга / «Фонтанка»
77
22
11

«Спишь?». Именно это сообщение прислали IKEA Канада своим подписчикам. Таким образом они решили сделать промо для своих матрасов. Они разослали сообщения в промежутке между 22:00 и 5:00. И тем канадцам, которые откликнулись, IKEA сделала подарок в виде бесплатного матраса.

Госдума поддержала в первом чтении законопроект о штрафах до 500 тысяч рублей за продажу энергетиков детям

С 1 марта 2025 года продавать энергетики несовершеннолетним запрещено по всей России.

77
33
Apple представила iPad Air с чипом M3 и базовый iPad с чипом A16

А также обновлённую клавиатуру Magic Keyboard с трекпадом для iPad Air.

Источник здесь и далее — Apple 
1313
99
11
11
GPT-4.5 — модель с «эмоциональным интеллектом» и «человечными» ответами: отзывы и критика

Собрали комментарии разработчиков, примеры использования и тесты.

44
11
Как сделать аутсорсинг эффективным: секреты мотивации для удаленных работников

Когда дело доходит до аутсорсинга, многие компании сталкиваются с одной и той же проблемой: как же заставить удаленных сотрудников работать так же ответственно и увлечённо, как своих? Вроде бы всё просто – дали задачу, исполнили и заплатили. Однако на практике часто получается иначе. Работники на удаленке зачастую не чувствуют той ответственности,…

Правительство не продлило мораторий на выездные налоговые проверки ИТ-компаний

Его действие завершилось 3 марта 2025 года.

Фото РБК
1212
99
11
Тупняк конечно феерический. Какой нахрен мараторий? Есть подозрение что чтото в компании не чисто - проверяй, нет подозрений, не мешай работать.
[]