Сохранить и не преумножить
СХД, СРК СХД, СРК

Сегодня ни для кого не секрет, что объем хранимой информации во всем мире ежегодно увеличивается, причем рост данных происходит экспоненциально. Например, согласно исследованиям аналитического агентства Enterprise Strategy Group, объемы хранимой в мире почтовой переписки ежегодно удваиваются, и в 2012 году суммарный объем превысит 13 ПБ данных.

Главная>СХД, СРК>Сохранить и не преумножить
СХД, СРК Тема номера

Сохранить и не преумножить

Дата публикации:
14.05.2012
Посетителей:
68
Просмотров:
54
Время просмотра:
2.3

Авторы

Автор
Александр Котенко В прошлом - старший инженер-проектировщик систем хранения данных гр. систем хранения данных компании «Инфосистемы Джет»
Архивы создают, значит, это кому-нибудь нужно
 
Сегодня ни для кого не секрет, что объем хранимой информации во всем мире ежегодно увеличивается, причем рост данных происходит экспоненциально. Например, согласно исследованиям аналитического агентства Enterprise Strategy Group, объемы хранимой в мире почтовой переписки ежегодно удваиваются, и в 2012 году суммарный объем превысит 13 ПБ данных. 

 

 

Подобная тенденция характерна не только для почты, но и для всех типов файлов. Многие компании по всему миру в полной мере ощущают на себе увеличение объемов хранимой информации. Самое простое решение этой проблемы – действовать в лоб, то есть просто увеличивать емкость хранилищ. Многими этот способ действительно рассматривается как панацея от всех бед, благо стоимость терабайта падает с каждым годом. Но не все так радужно, как кажется на первый взгляд. С ростом объемов хранения возникает целый ряд новых проблем, которые переводят эту задачу на качественно новый уровень.

Во - первых , это проблема « полезности » информации : данные растут , а ценность их в то же время падает . Чтобы объяснить ее смысл, можно провести аналогию с добычей золота. Содержание этого драгоценного металла в земной коре крайне невысоко по сравнению с такими металлами, как, например, железо или медь. В основном атомы золота рассеяны среди горных пород, и лишь изредка можно найти его в виде самородков или россыпи. Раньше способы добычи золота были сравнительно простыми: они были нацелены на поиск породы с высоким его содержанием. Но со временем подобные источники этого драгметалла были исчерпаны. Теперь для того, чтобы добыть грамм золота, нужно переработать тонны руды. То же самое происходит и с данными: благодаря удешевлению стоимости терабайта пользователи могут сохранять гораздо больше информации, но доля действительно востребованных данных в этом объеме оказывается все меньше и меньше. Чтобы эффективно хранить большие объемы данных, их нужно классифицировать и уметь выделять из общей массы важную информацию.

 

Рис. 1. Увеличение объемов хранимой почтовой переписки в 2008–2012годах (в ПБ)

 

Во - вторых , с ростом данных возрастает сложность методов их обработки и обеспечения сохранности . Большинству компаний необходимо осуществлять поиск по их данным, причем он должен выполняться за приемлемое время, иначе информация просто будет лежать мертвым грузом. Кроме того, в большинстве случаев эти данные нужно защищать, например, с помощью создания резервных копий или катастрофоустойчивого хранилища (Disaster Recovery). Вдобавок появляются дополнительные проблемы. Традиционные методы резервного копирования не справляются, сроки создания копий выходят за все допустимые лимиты, недопустимо возрастает нагрузка на сеть, серверам резервного копирования требуется все больше вычислительных ресурсов, чтобы переработать возросшие объемы данных, и т.д. Когда речь заходит о построении DR-системы для защиты данных, большинство ИТ-руководителей сразу начинают хвататься за голову: ведь здесь не обойтись просто закупкой новых дисков, нужна вторая аналогичная система, а это значит, что стоимость возрастет как минимум в два раза! Не все готовы пойти на такие жертвы, чтобы защитить данные, ценность которых порой сомнительна. С другой стороны, удалять их тоже нельзя, поскольку они «могут еще пригодиться». Из этой ситуации следует одно очевидное требование: для того чтобы эффективно хранить большие объемы данных, нужно изменить стандартные подходы к их обработке и защите.

 

Как же решить эти задачи? Одним из наиболее простых и недорогих способов является архивирование. Современные системы архивирования предоставляют широкий набор средств для оптимизации хранения цифрового контента. В первую очередь они позволяют классифицировать данные по уровню их востребованности. Благодаря этому все содержимое можно разделить на важные и второстепенные данные. Сортировка может осуществляться на основе многих критериев, например, по времени последнего обращения к файлам или по типам данных. После того как вся информация классифицирована, для нее выбираются соответствующие способы хранения: наиболее значимые и востребованные данные размещаются на высоконадежных и высокопроизводительных устройствах (например, Hi-End массивы с SAS/SSD-дисками), а остальные – на менее дорогостоящих (Mid-Range и Low-End дисковые массивы с SATA-дисками или магнитные ленты). Кроме того, современные системы архивирования и устройства хранения поддерживают дедупликацию и компрессию. Это позволяет экономить на приобретении дополнительных носителей, что особенно заметно в случае больших объемов данных.

 

Помимо этого, архивирование позволяет достичь экономии за счет снижения требований к продуктивным системам, ведь зачастую почтовые или файловые серверы функционируют на достаточно дорогом оборудовании. Разгрузка продуктивных систем с помощью архивирования дает возможность избежать масштабной модернизации ИТ-парка за счет сокращения количества размещенных на серверах и системах хранения объектов. Благодаря переносу части данных в архив, в том числе, значительно упрощается задача обеспечения защиты продуктивных ИТ-систем – не растут объемы данных, а следовательно, не увеличивается время создания резервных копий, а в случае DR можно использовать менее дорогостоящее оборудование для резервирования систем. И последнее, но не менее важное: современные системы архивирования способны предоставить гибкий поиск по архиву, поскольку поддерживают индексирование всех данных. Инструменты поиска могут использоваться службой безопасности для выявления подозрительного контента по всем архивам.

    

Symantec Enterprise Vault – серьезный выбор

В настоящий момент на ИТ-рынке существует ряд продуктов для архивирования данных, позволяющих оптимально размещать информацию и обеспечивающих эффективный доступ пользователей к ней. По нашим оценкам, одним из лидеров среди подобных решений является Symantec Enterprise Vault (EV). Это обусловлено многими факторами, в том числе «выдержанностью» продукта, способствующей стабильности программного кода существующих версий.

 

Рис. 2. Модули Enterprise Vault

 

На наш взгляд, Enterprise Vault является надежным решением для архивирования различных типов данных, подходит как для средних, так и для крупных компаний. Продукт Symantec представляет собой ПО, предназначенное для эффективного управления жизненным циклом информации и электронного раскрытия информации. Изначально EV разрабатывался как средство архивирования электронной почты на базе Exchange, но за время его существования функциональность значительно расширилась.

 

Symantec Enterprise Vault в настоящее время – одно из наиболее зрелых решений для архивирования. Продукт начал разрабатываться более 10 лет назад специалистами компании DEC. Затем права на него были выкуплены основателями компании KVS, которая позднее была приобретена корпорацией VERITAS. После поглощения VERITAS Symantec в 2005 году Enterprise Vault стал одним из флагманских продуктов вендора и в настоящее время занимает существенную часть рынка архивирования данных. Согласно отчетам «Gartner Magic Quadrant for Enterprise Information Archiving» за 2008–2012 годы решение Symantec занимает лидирующие позиции в магическом квадранте.

 

Решение поддерживает архивирование практически всех версий Exchange (в том числе 2010), клиентская часть совместима со многими операционными системами и почтовыми клиентами. Благодаря продуманной архитектуре, большому числу настраиваемых параметров и тесной интеграции с приложениями и оборудованием сторонних производителей Enterprise Vault подходит для решения широкого круга задач.

 

Архивирование Exchange

Enterprise Vault использует программный интерфейс MAPI для архивирования почтовых сообщений MS Exchange. В отличие от некоторых аналогичных продуктов при открытии пользователем архивного сообщения EV не восстанавливает его на сервер Exchange. Чтение архивных сообщений осуществляется непосредственно с сервера Enterprise Vault по протоколам HTTP или HTTPS.

 

Рис. 3. Внешний вид архивных сообщений в MS Outlook

 

При архивировании почтовых ящиков используются политики, имеющие гибкие настройки. В хранилище попадают только те сообщения, которые удовлетворяют критериям, указанным в политиках. В Enterprise Vault 10.0 можно настроить архивирование писем, используя в качестве критериев дату получения, размер сообщения, наличие вложения, уровень заполнения почтового ящика (например, 70% от установленного лимита; при превышении значения наиболее старые письма автоматически перенесутся в архив). Процедура осуществляется прозрачно для пользователей: у сообщения, попавшего в архив, просто изменится пиктограмма. Применяя соответствующие надстройки в Outlook, пользователи могут самостоятельно добавлять письма или восстанавливать их из хранилищ.

 

Продукт поддерживает интеграцию с Outlook Web Access (OWA), благодаря чему пользователи имеют доступ к архиву из любой точки мира, где есть подключение к интернету.

 

Устранение дубликатов и сжатие

Сообщения и файлы, попавшие в архив, подвергаются дедупликации (Singe Instance) и сжатию. В результате они попадают в хранилище в единственном экземпляре, даже если были у разных пользователей. Дедупликация работает между разными типами архивов – файловым, почтовым, SharePoint и т.д. За счет этих технологий достигается эффективное использование дискового пространства, выделяемого под хранилище.

 

Рис. 4. Внешний вид архивных сообщений в OWA

 

Миграция файлов PST и NSF

Enterprise Vault позволяет осуществлять миграцию личных папок пользователей в централизованное хранилище, благодаря чему уменьшается риск потери данных и появляется возможность мониторинга ранее не контролируемой информации. Для миграции PST-файлов рекомендуется использовать метод Client-Driven, т.к. в большинстве случаев ее нужно проводить без прерывания доступа почтового клиента к файлу личных папок. На данный момент среди продуктов архивирования почты только Enterprise Vault обеспечивает перенос личных папок пользователей без прерывания работы Outlook.

 

В российских компаниях не редкой стала ситуация, когда объем данных почтовой системы или системы документооборота переваливает за 10 ТБ, и приложения становятся неповоротливыми и сложно управляемыми. Часто проблемы связаны с большим количеством файлов PST/NSF, которые были накоплены в течение многих лет. Причина их возникновения почти всегда связана с наличием жестких квот на размер почтового ящика. Администрирование этих разрозненных файлов, в свою очередь, является довольно трудоемким процессом, кроме того, почтовая переписка, хранимая в них, недоступна для централизованного мониторинга. Встречаются также проблемы, связанные с переходом на новую версию почтового сервера, – миграция десятков терабайт данных может затянуться на многие недели. Как показывает наш опыт, все эти проблемы решаются с помощью Enterprise Vault. Так, в одном из наших проектов требовалось провести миграцию файлов PST для ~5000 пользователей. Понятно, что этот процесс занимает не один день, более того, если при миграции каждого пользователя прекращать работу почтового клиента, работа сотрудников будет серьезно нарушена. Поэтому заказчиком было поставлено обязательное требование к миграции файлов личных папок – не прерывать работу почтового клиента. Таким условиям на тот момент удовлетворял только Symantec Enterprise Vault. В результате внедрения EV всего за несколько месяцев была проведена миграция PST-файлов для всех пользователей. Этот процесс был полностью автоматизирован и незаметен для сотрудников компании. Теперь вся почтовая переписка, накопленная за многие годы, находится в центральном хранилище, а пользователи получили практически безграничные объемы почтовых ящиков.

 

Благодаря Client-Driven миграция полностью автоматизирована и не требует вмешательства администратора. По ее окончании исходные файлы личных папок могут быть удалены с рабочей станции или помечены атрибутом «Hidden», после чего Outlook перестанет их использовать. Сообщения, которые содержались в файле личных папок, переместятся в автоматически созданный раздел в структуре каталогов Outlook. Доступ к сообщениям из личных папок, перенесенных в архив, осуществляется из почтового клиента путем двойного щелчка мышью по пиктограмме архивного сообщения

 

Индексация и поиск

Индексация архива, осуществляемая встроенными средствами, позволяет как пользователям, так и администраторам системы выполнять поиск по хранилищу. Enterprise Vault 10.0 имеет 64-битную архитектуру, за счет чего достигается высокая скорость индексирования данных. Начиная с 10-й версии продукта, большинство задач, связанных с администрированием индексов, осуществляется с помощью простых помощников, запускаемых из консоли администратора. Встроенные средства предоставляют возможность поиска по ключевым словам, фильтрации результатов и просмотра найденных сообщений.

 

Журналирование почты

Средства Microsoft Exchange позволяют создать почтовый ящик (журнал), в котором сохраняются копии всех писем, прошедшие через определенный Data Store. Процесс, обеспечивающий создание копий всех входящих и исходящих сообщений, именуется журналированием. При его настройке осуществляется привязка к одному или ко всем хранилищам Exchange. Это означает, что для каждой почтовой базы Exchange может быть создан отдельный журнал.

 

Журналирование чаще всего применяется в целях мониторинга корпоративной почты, а также хранения полной базы почтовой переписки для последующего ее использования в юридических целях. Отметим, что журналирование требует заметного увеличения емкости почтовых хранилищ сервера Exchange. ПО Enterprise Vault позволяет заметно сократить объемы хранимых данных за счет их сжатия и дедупликации, а также снизить нагрузку на почтовый сервер путем удаления с него оригиналов сообщений и замены их ссылками.

 

Поиск по журнальному архиву может осуществляться как встроенными средствами EV, так и с помощью специализированных приложениий Symantec Discovery Accelerator (DA) или Compliance Accelerator (CA).

 

По сути, акселераторы представляют собой надстройку к Enterprise Vault и используют готовый архив для осуществления поиска. Критериями для них могут быть даты, ключевые слова, использование булевых полей, типы вложений и т.д. Результаты на этапе анализа поддаются быстрой сортировке с помощью расширенного поиска в ветках сообщений и разнообразных функций фильтрации. Кроме того, можно устранять дублирование данных в процессе их просмотра и экспорта, таким образом повышая эффективность работы администраторов. Все задания поиска можно запланировать, а специальные папки поиска использовать для упорядочивания элементов, связанных с заданиями.

 

В большинстве случаев в качестве источника поиска выступает архив почтового журнала, содержащий всю базу сообщений, тем не менее, его можно осуществлять и по архивам отдельных пользователей. DA также позволяет искать данные по хранилищам файлов, SharePoint, и общим папкам. CA предназначен только для поиска по почтовым архивам. Сравнивая оба акселератора, можно отметить, что функционал DA и CA очень похож. Тем не менее, есть и отличия: в DA администратор сам должен запускать поиск, а затем передавать подозрительные письма для исследования группе, отвечающей за безопасность. В CA этот процесс автоматизирован: сообщения, попавшие в архив, сразу же проверяются на предмет соответствия требованиям безопасности, подозрительные попадают в отдельную категорию, требующую изучения специалистами.

 

По сравнению с функциями, предоставляемыми стандартными средствами поиска Enterprise Vault, отличительными особенностями акселераторов являются:

 

  • наличие базы данных, в которой сохраняется вся история поисковых запросов;
  • разделение ролей пользователей и наличие готовых ролей с определенным перечнем функций;
  • возможность изучения как отдельных сообщений, так и всей цепи пересылки информации между несколькими пользователями.

 

В приложениях можно создать несколько баз данных с целью разделения и обеспечения безопасности информации для определенных групп сотрудников (юридического управления, отдела кадров и т.д.) или согласно определенным требованиям (например, к конфиденциальности данных).

 

На счету нашей компании – внедрения Enterprise Vault в крупных российских банках, в том числе проект по архивации Exchange и миграции PST-файлов для ~5000 пользователей. В 2011 году компания «Инфосистемы Джет» первая в России получила специализацию Symantec Archiving and eDiscovery, которая включает в себя работу с продуктом Enterprise Vault.

 

Миграция файлов

 

Миграция предназначена для разгрузки продуктивных файловых серверов или NAS-систем. В качестве источников для Enterprise Vault могут выступать не только серверы Windows, но и сетевые хранилища с поддержкой CIFS: Symantec FileStore, NetApp FAS, EMC Celerra. Кроме того, EV интегрируется со специализированными контентными платформами, такими как Hitachi Content Platform, EMC Centera, Fujitsu ETERNUS и т.д.

 

После осуществления миграции на файловом сервере происходит замена файлов на ярлыки или гиперссылки, имеющие размер всего 4 кб. Соответственно для архивных файлов, изменяется и внешний вид пиктограммы.

 

Восстановление файлов средствами EV является прозрачным для пользователей: при попытке открытия они практически мгновенно восстанавливается на сервер. При этом в EV присутствуют механизмы, препятствующие массовому восстановлению файлов в случае выполнения процедур антивирусного сканирования или резервного копирования.

 

Рис. 5. Внешний вид архивных ярлыков на файловом сервере

 

Для архивирования используются соответствующие политики: благодаря им в хранилище попадают только те файлы, которые удовлетворяют их критериям. В качестве критериев могут быть выбраны:

 

  • тип файла;
  • время создания;
  • время последнего доступа или изменения;
  • размер;
  • атрибуты файла.

 

Модуль файлового архивирования включает в себя функцию блокирования нежелательного контента, за которую отвечает File Blocking Service. Последний обеспечивает запрет на запись тех типов файлов, которые указаны в соответствующей политике. Пользователи не могут нарушить работу сервиса простой сменой расширения файла или путем упаковки его в архив – Enterprise Vault верифицирует содержимое файла на уровне сигнатуры.

Кроме того, имеется возможность настройки автоматического удаления файлов по истечении заданного срока. Удаление определяется категориями Retention, которые могут устанавливаться индивидуально на каждую отдельную папку файлового хранилища.

 

Хранение архива на магнитных лентах

Система архивирования Enterprise Vault может быть интегрирована с ПО резервного копирования Veritas NetBackup или Symantec BackupExec, которые позволяют осуществлять автоматическую миграцию архива с дискового массива на магнитные ленты. Перенос на ленты обеспечивает долговременное хранение контента с минимальными затратами. Он происходит автоматически в соответствии с выбранными критериями, например, по истечении заданного времени или при достижении определенного уровня заполнения тома на дисковом хранилище.

 

Рис. 7. Просмотр архивных сообщений в iPad с помощью ARCViewer

Востребованными в последнее время оказались совместные решения Symantec и CommonDesk по доступу к архиву с мобильных устройств для BlackBerry и iOS – ведь большинство руководителей сейчас пользуется смартфонами и планшетами. 

Решение ARCviewer позволяет установить приложение на смартфон и пользоваться архивом удаленно. При этом доступны такие функции, как просмотр архивных сообщений EV, их поиск, добавление и восстановление из архива и даже пересылка. В настоящее время ведется разработка аналогичного продукта для платформы Android.

 

Интеграция с DLP

Начиная с 10-й версии Enterprise Vault, появилась интеграция решения с Data Classification Services в Symantec Data Loss Prevention (DLP). В результате стали доступны более гибкие механизмы классификации входящих почтовых сообщений. Входящую почту можно автоматически отсортировать по различным признакам (например, по наличию ключевого слова, почтового домена в адресах, конкретному отправителю и т.п.) и разместить по соответствующим архивам с разными сроками хранения. Для использования сервера Data Classification Services в инфраструктуре EV не требуется отдельная лицензия, необходимо только наличие компонентов DLP.

 

Рис. 6. Схема интеграции EV с DLP

 

Резюмируя

Если вам не чужды проблемы, озвученные в этой статье, и вы задумываетесь о рациональном использовании ресурсов внутри вашей компании – добро пожаловать в мир Enterprise Vault, где мы готовы стать вашим проводником и помощником.

Читайте также

Явные резервы

Уведомления об обновлении тем – в вашей почте

Простая методика принятия решения по инцидентам, выявленным DLP

DLP-системы или их упрощенные аналоги (системы контроля работы сотрудников) используются во многих организациях, обеспокоенных угрозой утечки информации или инцидентами экономической безопасности

Контроль контролирующих, или Расширение возможностей DLP-систем

Если ваши сервисы работают без сбоев, можете смело их продавать. Эту несложную аксиому понимают владельцы любого бизнеса, вне зависимости от его масштаба или сферы деятельности.

DLP - не роскошь, а средство комфортного предупреждения утечек

Как нам кажется, DLP-систему в части ее назначения и функционирования вполне можно сравнить с автомобилем.

Нюансы внедрения DLP: наш опыт

Для начала нужно определиться с основными предпосылками появления DLP-системы в компании. Внедрение DLP-решения, как правило, - реакция на конкретный инцидент утечки конфиденциальной/критичной информации, который выявил уязвимость в существующей системе информационной безопасности.

TOП 3 самых популярных задач для DLP

Как показывает наша практика, можно выделить определенный набор задач информационной безопасности, решение которых позволяет организации защитить наиболее критичные данные

«Комбайн», стоящий на «Конечной Точке»

«Конечные точки» – так называют главную головную боль любого безопасника и айтишника – компьютеры сотрудников организации.

Заглянуть в цифровую черную дыру

При упоминании Big Data у окружающих появляется мысль о том, что речь идет о передовых технологиях, о новых невероятных возможностях для хранения, обработки и анализа данных, но так ли это на самом деле

Спасибо!
Вы подписались на обновления наших статей
Предложить
авторский материал





    Спасибо!
    Вы подписались на обновления наших статей
    Подписаться
    на тему







      Спасибо!
      Вы подписались на обновления наших статей
      Оформить
      подписку на журнал







        Спасибо!
        Вы подписались на обновления наших статей
        Оформить
        подписку на новости







          Спасибо!
          Вы подписались на обновления наших статей
          Задать вопрос
          редактору








            Оставить заявку

            Мы всегда рады ответить на любые Ваши вопросы

            * Обязательные поля для заполнения

            Спасибо!

            Благодарим за обращение. Ваша заявка принята

            Наш специалист свяжется с Вами в течение рабочего дня