Видео доклад с конференции Highload 2008.

Название: Нереляционные системы хранения данных (HCS: хранение и обработка сверхбольших объемов иерархических данных)
Год: 2008
Докладчик: Павел Уваров
Компания: Рамблер
Язык доклада: Русский
Описание: Цель доклада – познакомить слушателей с концепцией потоковых баз данных, их достоинствами, недостатками и областью применимости.
Когда данных становится так много, что уместить их в обычную реляционную БД, такую как MySQL, становится проблематичным, приходится думать, как удобно организовать их хранение и обработку без лишних накладных расходов. Использование специально заточенных форматов негибко и трудоемко, поэтому нужно искать золотую середину между гибкостью универсальной БД и оптимальностью специальных форматов.
Так как данных очень много, то и обрабатывать их приходится большими пачками, поэтому мы неизбежно приходим к тому, чтобы ограничиться последовательной обработкой. Так возникает термин «потоковая база данных», т. е. БД, основанная на последовательной (пото- ковой) обработке.
Рассматривается пример реализации этой БД в Рамблере под названием HCS (Hierarchically Compressed Stream).
Помимо последовательного доступа, БД имеет возможность ограниченного случайного доступа, что делает ее привлекательным средством для построения поисковых индексов.

Внимание! В целях экономии дискового пространства на данной странице представлена ссылка на видеофайл находящийся на внешнем источнике. Если Вы не можете просмотреть видео – скорее всего ссылка умерла. Но это не повод отчаиваться, у меня есть локально сохраненная копия данного видео. Если вы обнаружите, что ссылка умерла – оставьте комментарий к данной записи с описанием проблемы и я обязательно выложу сохраненную копию, если ссылка действительно мертвая.



Дополнительные записи: