Рейтинговые книги
Читем онлайн Журнал PC Magazine/RE №12/2009 - PC Magazine/RE

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 15 16 17 18 19 20 21 22 23 ... 34

Именно на этом поле и играет Microsoft. Сама по себе идея «бить по площадям», предлагая в унифицированном и стандартном решении технологии и возможности, которые у конкурентов стоят дорого или вообще считаются отдельными программными продуктами (тоже недешевыми) – традиционный ее modus operandi. Именно благодаря ему решения Microsoft и проникают повсюду. Исподволь, ненавязчиво, не требуя коренной ломки сложившихся деловых практик… Автоматизация снизу. По сценарию: вот Excel, там сделана таблица платежек или счетов-фактур, или чего угодно. Сотрудник склада умеет работать с этой таблицей (переучивать его некогда, да и незачем). Конец квартала и надо посчитать, что там у нас получилось? Не вопрос, делаем сводную таблицу. Накопилась масса данных за несколько лет – переносим их в СУБД, подключаем Excel, с которым умеет работать кладовщик, и он работает как раньше. Появляются неструктурированные данные? Это для других разработчиков СУБД они «файловый мусор», а мы их аккуратно загрузим через интерфейсы промежуточного слоя. Нужна отчетность? Не вопрос, строим в Excel сводную таблицу из данных, которые хранятся в БД… А потом вдруг оказывается, что в компании есть вся инфраструктура: SQL Server, Exchange, Windows с Office… И вопрос «надо ли внедрять корпоративный портал» сам собой естественно трансформируется в обсуждение, «какую версию SharePoint приобрести и кому из партнеров Microsoft заказать проект»… Утрирую, конечно, но не слишком сильно.

И SQL Server 2008 R2 четко следует в русле этой тенденции. Даже общее знакомство с системой показывает, что каждая новая функция явно проектировалась с прицелом на улучшение не только самого продукта, но и платформы в целом.

Версии SQL Server: кто есть кто?

С выпуском SQL Server 2008 R2 изменяется состав продукта в целом и функциональность отдельных версий. В частности, появились варианты Datacenter и Parallel Data Warehouse. Первый позволяет задействовать более восьми физических (до 256 логических) процессоров, предоставляет возможность развертывания мультисерверных конфигураций с числом экземпляров более 25, содержит подсистему StreamInsight, а также специальные средства для работы в виртуальном окружении.

SQL Server 2008 R2 Parallel Data Warehouse позволяет создавать хранилища с параллельным доступом к данным на узлах, специализированные функции для работы с хранилищами данных (оптимизации типа Star Join, возможность захвата данных и др.), стандартизованный инструментарий управления и др. В версии SQL Server 2008 R2 Enterprise мультисерверное администрирование ограничено 25 экземплярами, имеются средства работы с PowerPivot for SharePoint и MDS. В редакции SQL Server 2008 R2 Standard появились функции сжатия резервных копий (раньше они были доступны только пользователям версий уровня Enterprise). Предлагаются варианты оплаты по схеме «за процессор» и «за сервер» с набором лицензий доступа для клиентов (Client Access License, CAL).

Нововведения

Горная ассоциация в предыдущем разделе возникла не случайно. Разработка, известная ныне как Microsoft SQL Server 2008 R2, носила кодовое название горного массива Килиманджаро, высочайшей точки Африки (5895 м над уровнем моря). Выпуск этого продукта запланирован на первое полугодие 2010 г. На сегодня доступны его предварительные версии (Community Technology Preview CTP), последняя из которых (на момент написания статьи) имеет порядковый номер три и датируется ноябрем этого года. Продукт представляет собой результат долгой эволюции (см. врезку «Краткий курс истории SQL Server»), за время развития (с 1995 г.) он превратился в комплексную платформу хранения, обработки и анализа данных на всех этапах их жизненного пути, от создания до архивации. Система рассчитана на работу вместе с другими решениями Microsoft, предоставляет средства для создания корпоративных решений, разработки специализированных комплексов по обработке больших объемов данных, построению комплексной бизнес-аналитики и т. д.

Фундамент для большинства возможностей, появившихся в R2, был заложен еще в версии SQL Server 2008, но в то же время появились и новые функции. Улучшению и доработке подверглись самые разные аспекты, но главные цели, которые преследовала Microsoft, разрабатывая новую версию своей СУБД: повышение эксплуатационной эффективности, надежности и производительности, а также реализация идеи «общедоступной бизнес-аналитики», сохранились.

Устанавливаем SQL Server 2008 R2Процедура инсталляции SQL Server 2008 R2 хорошо продумана и не вызывает затрудненийВ конфигурации по умолчанию сделан акцент на безопасность; прочие функции администратор может включить отдельноFast Track Data Warehouse: хранилище из кубиков

Инициатива, в рамках которой была создана эталонная платформа для развертывания SQL Server 2008 в режиме хранилища данных заранее заданной емкости. Идея состоит в том, чтобы решить чисто интеграционную проблему: до сих пор создание корпоративных хранилищ требовало привлечения консультантов или системных интеграторов, трудоемких тестов, а порой даже разработки нестандартных решений. В рамках Fast Track Data Warehouse предприятия могут приобретать заранее сконфигурированные и протестированные системы, которые можно сразу вводить в эксплуатацию на серверной площадке.

Программа Fast Track Data Warehouse рассчитана на изготовителей аппаратных средств (сегодня известно об участии в ней Dell, HP и Bull), а также системных интеграторов (им предлагаются специальные шаблоны, упрощающие развертывание SQL Server). В частности, HP предлагала конфигурации на базе серверов HP ProLiant DL385 G6, DL585 G6 и DL785 G6, Dell – системы Dell Power Edge R710 и R900, рассчитанные на несколько меньшие объемы хранения, чем у изделий HP, IBM – серверы System x3650 M2, x3850 M2, x3950 M2 (несколько вариантов), которые различаются емкостью (от базовой 4–8 Тбайт до крупной – 16–32 Тбайт). С выпуском SQL Server 2008 R2 конфигурации, доступные в рамках программы Fast Track, также будут обновлены, но детали пока неизвестны.

По оценке Microsoft, использование такого рода «заготовок», протестированных и настроенных, позволяет снизить стоимость структурированного хранилища до 13 тыс. долл. за 1 Тбайт (при емкости до 32 Тбайт). На сайте Microsoft имеется электронная таблица, позволяющая быстро оценить затраты и необходимые ресурсы в соответствии со спецификой загрузки сервера БД (число пользователей, конкурентных запросов, желательного времени отклика системы, числа процессоров, характеристики дисковой подсистемы и др.).

Данные… много и быстро!

До недавнего времени SQL Server был ограничен 64 логическими процессорами, в SQL Server 2008 R2 лимит увеличен до 256. Причина проста: стандартная восьмипроцессорная платформа сегодня вполне может обернуться 256 логическими ЦП. Кроме того, специалисты Microsoft отмечают, что инсталляции SQL Server с базами данных 5–10 Тбайт сейчас уже не редкость. Если еще не типовой проект, то уж вполне отработанная технология. Система, рассчитанная на терабайтные БД, без особенных сложностей будет справляться и со стандартными десятками или сотнями гигабайт. При необходимости дальнейшего увеличения мощности предлагается переходить на аппаратные конфигурации с массивно-параллельной обработкой – проект Madison (на базе разработок ранее приобретенной Microsoft компании DATAllegro).

Обновленная подсистема массивно-параллельного хранилища SQL Server 2008 R2 предоставляет средства для хранения громадных информационных массивов и быстрого к ним доступа. Объемы данных растут по экспоненте, хранить их на едином сервере уже порой невозможно, а значит, необходимо распределенное интеллектуальное хранилище. Это, собственно, и есть проект Madison, специализированный программно-аппаратный комплекс, рассчитанный на массивно-параллельную архитектуру, обеспечивающий хранение данных на физических узлах (с собственными ЦП, памятью и дисками) и возможность параллельного доступа к ним. При этом реализация весьма эффективна. Технология Madison – это составная часть SQL Server 2008 R2. Клиентские соединения в такой системе проходят через управляющий узел, который обрабатывает запрос и готовит план выполнения с учетом распределения данных по узлам хранилища. Отдельные экземпляры SQL Server, используемые в роли вычислительных узлов, генерируют финальные планы выполнения, отрабатывая свои части запроса. Все это совместимо с ODBC, OLE-DB, ADO.Net и др. (на самом деле, непосредственно к хранилищу пользователи доступа не имеют, работая с так называемыми витринами данных, но этот процесс организован прозрачно для них). На практике это означает, что типичным объемом БД для R2 скоро может стать не терабайтный, а даже петабайтный масштаб.

StreamInsight: анализ на потоке

Проблема, с которой сталкиваются аналитики, – необходимость обрабатывать динамические потоки информации. Обычно анализ выполнялся на статичных данных, которые заведомо не менялись в заданный период. Типичный пример – банковские решения или учетные системы. По завершении операционного или рабочего дня система останавливается, данные проходят финальную обработку, сливаются в хранилища и архивы, после чего могут быть использованы для аналитической обработки. Очевидно, что при такой схеме время реакции на изменения будет ограничено снизу периодом, за который у аналитиков появляется очередной слепок данных. Столь же ясно, что для задач, требующих управления в реальном времени, такой подход малоприменим. В качестве решения проблемы была разработана технология StreamInsight.

1 ... 15 16 17 18 19 20 21 22 23 ... 34
На этой странице вы можете бесплатно читать книгу Журнал PC Magazine/RE №12/2009 - PC Magazine/RE бесплатно.
Похожие на Журнал PC Magazine/RE №12/2009 - PC Magazine/RE книги

Оставить комментарий