Резервирование и бэкап — зачем и как.

06 мая 2008

Бэкап, резервирование и восстановление данныхВсе данные, хранящиеся на жестких дисках, флешках, и прочих носителях, всегда находятся под некоторой угрозой. Диск может сломаться, флешка исчезнуть, а владелец файлов (чаще всего) может их случайно удалить или испортить. Поэтому предлагаю немного поразмыслить о резервировании критически важных данных.

Начнём с сайта. Среднестатистический сайт — это набор файлов на диске и база данных, как правило — MySQL.

С базой данных особых проблем не вижу:

  • для WordPress есть плагин WordPress Database Backup WordPress Database Backup, который сохраняет базу по расписанию и отправляет её на e-mail
  • для других систем можно воспользоваться скриптом Sypex Dumper Sypex Dumper, или настроить дамп и отправку по почте самостоятельно (несколько строк кода).

С сохранением файлов сайта чуть сложнее. Можно просто периодически сохранять их вручную, но можно и автоматизировать.

Сначала заархивируем все файлы сайта в один архив с помощью библиотеки PclZip PclZip:

<?php require_once('pclzip.lib.php');
$date = date('Y-m-d');
$archive = new PclZip("$date.zip");
$v_list = $archive->add('../');
if ($v_list == 0) { die("Error : ".$archive->errorInfo(true)); }

В этом примере $v_list — это относительный путь к архивируемому каталогу или список каталогов и фалов через запятую. Выбирайте сами, что именно нужно резервировать.

После этого можно сделать дамп MySQL базы и добавить его в этот архив, а потом, например, отправить полученный архив по почте с помощью класса PhpMailer PhpMailer и удалить его чтобы не занимал место. Запускать этот процесс можно с помощью планировщика у хостинг-провайдера (у Majordomo бесплатный) или (если это WordPress) с помощью WP-Cron WP-Cron.

Законченного решения я не выложил, но конструктор укомплектован — собирайте кому что нужно, все части надёжны и проверены.

Следующий эпизод — локальный компьютер. Тут стоит сразу определиться — что именно резервировать. Для больших и редко используемых файлов (фото, видео, архивы) я поставил себе под стол старенький компьютер под Ubuntu, настроил NFS и забыл о нём — приходя домой я получаю доступ к этим файлам, а в крайнем случае — можно и удалённо залезть.

А для регулярного бэкапа текущих проектов вполне подойдёт Gmail. Бесплатный почтовый ящик вмещает до 10Gb данных, а самый интересный фокус в том, что его можно подключить как обычный диск — как в Linux GmailFS, так и под Windows GMail Drive. А сохранять туда нужные файлы тоже можно кроном, или его Windows-аналогом — nnCron + nnBackup nnCron.

А заодно посмотрим, что об этом думают другие участники конкурса на лучший способ бэкапа личных данных.

Жилинский Владимир.






 


[…] Да, придраться есть к чему, но можно не вредничать и сказать спасибо — за фиксы в безопасности, за апдейт без глюков (я даже плагины поленилась деактивировать перед тем как). И бэкап не стала делать, а это совсем уж нагло с моей стороны. Сделаю постфактум, после апдейта А вот ещё про бэкапы wp-блоггерам будет полезно: объявлен конкурс на лучший способ бэкапа блога, предлагайте ваши решения! Владимир Жилинский уже поделился своими идеями в посте “Резервирование и бэкап — зачем и как“. […]

 

samlowry     .

Написано 6 мая 2008 года в 18:20


Спасибо за пост! Жаль, что мало внимания уделено основной теме конкурса — бекапу локальных данных. В серверном бекапе всё более-менее стабильно из-за двух вещей:
— сервер работает 24 часа в сутки (никто не перегружает, свет не выключается, батарейки не садятся)
— сервер присоединён к интернету толстым хоботом.

В локальном же как-то надо заботиться о регулярности бекапа.

Кстати, насчёт Гмайла, как FS — кликнул по ссылке, и не увидал сходу там про винду, может, ты не ту ссылку указал?

 

Жилинcкий Владимир     .

Написано 6 мая 2008 года в 18:31


Не за что, у меня как раз информации подкопилось на эту тему. Можно даже попробовать сделать некий продукт, кстати, для комплексного бэкапа сайтов.

На счёт Гмейла — спасибо, правда не та ссылка, поправил :-)

В плане локального бэкапа я ещё продолжаю изыскания, но собственный бэкап-сервер или хотябы сетевой диск-массив тут рвут всех, по-моему. К тому же с их помощью можно торренты качать ;-)

 

samlowry     .

Написано 6 мая 2008 года в 18:38


Я тоже ещё не отрихтовал свою политику бекапа. Но только сервер, и даже с рейдом, проблему не решают. Ты сам картинку хорошую вставил — вот когда такое случится, тогда хоть 1 винт, хоть рейд с 10 винтами — пофигу будет.

В-общем, чем больше носителей, чем сильнее они различаются по принципу действия, и чем больше они разнесены — тем лучше…

 

Жилинcкий Владимир     .

Написано 6 мая 2008 года в 18:45


У меня ещё часы на руке с 64Mb шифрованной флешкой — пароли, сертификат кипера, ключики всякие.
А вообще, уже появляются услуги удалённого бэкапа.

 

samlowry     .

Написано 6 мая 2008 года в 18:51


Они вообще-то давно появились, но доверия не внушают. Ну, стойка стоит, ну, рейд…

Я подобным образом долго искал хостеров для емайла. Т. е. только для емайла. Находил пару, но каких-то гарантий по надёжности они не давали. В итоге спам Гмайл.

Вот когда будет что-то от монстров, типа Гугла, тогда можно будет смело юзать. Хотя, от Амазона сервис есть, но там не очень описано — как работает их распределённая система, + именно под бекап там не заточено — надо напильником доделывать.

 

На кого стоит ссылаться - Virtual-lab     .

Написано 6 мая 2008 года в 19:48


[…] ссылайтесь на посты известных и даже скандальных блоггеров, чтобы […]

 

miller     .

Написано 6 мая 2008 года в 19:48


по поводу архивирования на сервере — имхо это лучше делать на на пхп
есть же утилиты по юних для создания архивов, пошустрее будет

и на gmail закачивать большие файлы — канал надо хороший иметь
не проще ли на внешний хард скидывать?

 

aboutubuntu     .

Написано 6 мая 2008 года в 20:30


Странно, что для WP имеется несколько готовых плагинов для бэкапа базы и ни одного — для бэкапа файлов.

 

Жилинcкий Владимир     .

Написано 6 мая 2008 года в 22:59


Virtual-lab: ура, йа — известный блогер ^____^

miller: не всякий лось перекусит рельсу, и не на всяком хостинге дадут шелл-скрипт запустить, а вот PHP-скрипты на ура работают.

aboutubuntu: может сделать? Весь код, в принципе, уже выложен в статье :-)

 

Жилинcкий Владимир     .

Написано 6 мая 2008 года в 23:49


Кстати, забыл похвастаться. Разработчик nnCron и nnBackup — Николай Немцев, — мой хороший друг и бывший пойнт в фидонете. А моя IP-нода работала в качестве сервера не на обычных скриптах, а чисто на FORT-like-инструкциях nnCron. Работала как часы.

 

Андрей Ф     .

Написано 7 мая 2008 года в 00:17


хых) как обычной диск подключить)) однако)))

 

Алексей     .

Написано 7 мая 2008 года в 08:47


Пост, конечно больше для новичков.

Все эти операции можно сделать несколькими строчками в кронтаб.

Смитрите описание команд mysql — полученный дамп бызы можно сжать например gz (это все в первой строке), а затем отправить на посту.

Для бекапа файлов схема такая же, ищете файлы (командой поиска), затем их сжимаете и отправляете на почту.

Причем, файлы можно бекапить только измененные! Т.е. Вы не будете получать огроменный архом каждый раз.

Какие команды применять, можно узнать на любом форуме по linux

 

Жилинcкий Владимир     .

Написано 7 мая 2008 года в 08:54


Про MySQL согласен, поэтому я даже опустил этот момент — язык позволяет почти всё.

Про файлы — спорно. Ещё раз говорю: на большинстве хостниг-площадок нет возможности выполнения шелл-скриптов, а на локальных компьютерах как правило вообще винда.

man svn ещё тема, кстати, но тема отдельная.

 

Жуковск     .

Написано 7 мая 2008 года в 14:19


Мне посему-то гмаил кажется ненадежным.. Не знаю, наверное это чисто психологический комплекс — сложно отдать информацию в чужие руки)) А есть какаянить статистика по его даунтайму?

 

Жилинcкий Владимир     .

Написано 7 мая 2008 года в 14:40


В чём и дело, что они держат аптайм близкий к 100%, это же Google…

 

easy_john     .

Написано 7 мая 2008 года в 15:50


«всегда находятся под некоторой угрозой. Диск может сломаться, флешка исчезнуть»

не под некоторой, а под вполне конкретной. еще в 90-х годах, в книге «секреты жестких дисков» всемирно известный Джон Гудмен, в статье о надежности хранения в первую очередь обращал внимание на то, что самым главным фактором сохранения данных является их резервное копирование. неправильно говорить «если диск умрет», правильно «когда диск умрет», по скольку ни один из дисков не является средством для долговременного хранения данных.

 

Жилинcкий Владимир     .

Написано 7 мая 2008 года в 15:55


О, хакеры стягиваются ;-)
Фестиваль ещё только в августе, а команда уже оживилась.

Да, надёжного хранения данных быть не может, поэтому нужно бороться с теорией вероятности, увеличивая количество резервов.

 

Гвидон Маляров     .

Написано 7 мая 2008 года в 16:51


использование gmail как хранилище для бэкапа — интересная идея, надо будет попробовать обязательно:)

 

Rulik     .

Написано 7 мая 2008 года в 23:32


На гмаиле вроде меньше чем 10Гб дают.

 

samlowry     .

Написано 8 мая 2008 года в 04:09


Жуковск: Гмайл ходит под GoogleFS — распределённой файловой системой, в которой каждый блок инфы в один момент времени хранится как минимум на трёх компах их кластерной системы.

easy_john: это, наверное, в 90х годах жёсткий диск не являлся, надёжнее были стриммеры… Поди сейчас-то получше?

 

samlowry     .

Написано 8 мая 2008 года в 16:13


>Про файлы — спорно. Ещё раз говорю: на большинстве хостниг-площадок нет возможности выполнения шелл-скриптов, а на локальных компьютерах как правило вообще винда.

Ну запуск скриптов через крон, как раз, большинство поддерживает.

 

alex     .

Написано 11 мая 2008 года в 14:01


Отдичная идея про Gmail Спасибо )

 

Жанна     .

Написано 13 мая 2008 года в 22:29


>использование gmail как хранилище для бэкапа — интересная идея, надо будет попробовать обязательно:)

Это интересный способ, попробую обязательно.

 

DenTal     .

Написано 14 мая 2008 года в 08:29


Странно, я так понял что на gmail.com стоит ограничение в 20мб на бэкапы.

По крайней мере когда монтируешь Gmail Drive. 20мб — это не дело. Или я что то не так делаю?

 

Жилинcкий Владимир     .

Написано 14 мая 2008 года в 08:43


Хм… Может ограничение на размер письма? …

 

Кабардинка     .

Написано 14 мая 2008 года в 12:31


Спасибо за совет с Gmail. Пошла пробовать :)

 

DenTal     .

Написано 14 мая 2008 года в 18:57


Ну да, ограничение на размер письма. Но какой смысл использовать gmail как storage для бэкапов, если он всего 20 мб на раз даёт?

 

Жилинcкий Владимир     .

Написано 14 мая 2008 года в 18:58


Как вариант для надёжного хранения небольших объёмов данных.

 

Фарматика     .

Написано 15 мая 2008 года в 16:36


Задумался о «логическом» хранении информации — важную инфу дублируем на 2-3 носителя, разносим их по разным местам (сильно разным)) и регулярно проверяем на работоспособность. Как только один из них дает сбой — заменяем его новым свеженьким, инфу перезаливаем с оставшихся. Трудоемко конечно, и для больших объемов нужен специальный человек который бы этим занимался) Но для личног опользования вполне подходит…

 

DenTal     .

Написано 23 мая 2008 года в 08:04


Владимир, Вы проверяли свой код для библиотеки pclzip.lib.php

Там ковычки не правильные, имя папок в архиве получается кривое.

 

Жилинcкий Владимир     .

Написано 23 мая 2008 года в 11:32


Да, это вордпресс так кавычки показывает почему-то. Поэтому стараюсь крупные куски кода прикладывать файлами, а в посты вставлять только очевидные, которые никто не додумается копировать =)

 


[…] Жилинский дал ссылки на утилиты, позволяющие подключить Gmail-аккаунт как часть […]

Оставить комментарий:

You must be logged in to post a comment.

© 2007-2010 Блог интернет-разработчика, автор — Zhilinsky.ru.
При использовании информации ссылка на источник обязательна.