Os aplicativos nas empresas podem gerar grandes quantidades de informações e a cópia e guarda de uma quantidade significativa dessas informações no formato de arquivos é chamado backup. A tendência atual é um crescimento contínuo das necessidades de armazenamento dos dados.
Normalmente o backup (também conhecido como cópia de segurança ou reserva) é uma tarefa administrativa de responsabilidade do administrador do sistema. Simplificadamente trata-se de uma cópia da informação contida em um banco de dados local ou remoto, sendo, na prática, uma réplica dos dados originais atuais, guardados em um outro local seguro. As cópias de segurança são fundamentais em qualquer sistema. No caso de uma pane mais séria no sistema, somente estas podem devolver os arquivos do usuário de volta.
Temos dois tipos principais de dados que necessitam de uma política de backups periódicos: os dados do usuário, como informações de textos, planilhas, e-mails, imagens, cadastros e qualquer outro item colocado pelo usuário e os registros do sistema, com os dados criados ou alterados pelo sistema (informações sobre instalação de programas ou alteração destes) ou, ainda, armazenados por ele (log de segurança, registro de eventos). Por esse motivo é importante saber o que é um backup e como proceder a sua recuperação (recovery).
A tarefa de criação de backups é muito importante. Os backups são cópias de segurança que permitem à organização empresa ou usuário estar seguro de que, se uma falha grave ocorrer nos computadores assim como nos servidores, esta não implicará a perda total da informação contida no sistema que, ao contrário do que acontece com o hardware, não é substituível. Uma boa arquitetura de backup e recuperação deve incluir um plano de prevenção de desastres, procedimentos e ferramentas que ajudem na recuperação de um desastre ou falha de energia, além de procedimentos e padrões para realizar a recuperação.
Podemos distinguir dois tipos de backup, os backups físicos e os backups lógicos. Os backups físicos são os locais onde estão guardadas todas as informações do banco de dados. Geralmente essas unidades são chamadas de "fitas de backup", apresentando uma grande capacidade de armazenamento físico, podendo ser reposto a qualquer momento. Já o backup lógico é apenas o "salvamento" dos dados do banco de dados, porém não será armazenado em forma física e sim virtual.
O Recovery (recuperação), é a recuperação dos arquivos do sistema. Ao fazer um backup dispomos de uma cópia dos dados em outro local, seja ele físico ou virtual. Através do Recovery os dados são recuperados e repostos no sistema no formato anterior ao problema ou do erro fatal ocorrido no banco de dados.
Nenhuma estratégia de backup atende a todos os sistemas. Uma estratégia que é adequada para um sistema poderá ser imprópria para outro sistema. O administrador deve determinar com precisão a estratégia que melhor se adequar a cada situação.
Armazenamento de Dados
O backup de dados pode ter sua segurança comprometida se os dispositivos de armazenamento estiverem no mesmo local físico. O ideal é que as mídias e demais dispositivos estejam localizados em local que obedeça às condições de segurança de acesso e de armazenamento e que permita, em caso emergencial, que esses recursos possam ser utilizados para restauração em um outro dispositivo obtido emergencialmente no mercado ou disponibilizado por um provedor contratado de contingência.
Existem no mercado técnicas diferentes de apoio nos processos de backup e recuperação. Entre elas podemos destacar:
ASPs (Auxiliary Storage Pool) - Os discos podem ser separados em conjuntos específicos denominados ASPs o que permite isolar objetos do cliente. Quando houver falha nos discos de uma ASP, os outros ASPs não são afetados, reduzindo, assim, a possibilidade de perda dos dados;
Clustering - Um cluster pode ser definido como uma configuração ou um grupo de servidores independentes que aparecem na rede como uma simples máquina. Ele é desenhado de tal forma que uma falha em um dos componentes seja transparente aos usuários;
Mirrored (espelhamento) - É a técnica onde os discos são espelhados, ou seja, é feita uma cópia exata de cada um em servidores diferentes. Em caso de falhas ou perda de um disco, o outro assume inteiramente o papel até a substituição do disco com problemas. O segundo servidor pode estar localizado a qualquer distância do primeiro (outra sala, outra cidade, outro estado ou mesmo outro país). Apresenta como vantagem não gastar tempo para a cópia, pois ocorre em tempo real, mas necessita de backup em caso de falha nos dados do servidor principal, além da necessidade de se ter dois servidores.
Device Parity Protection - O device parity tem a tecnologia similar ao do RAID-5 (redundant array of independent disks) e permite a manutenção concorrente quando houver falha em um dos discos;
Dual System – Semelhante ao espelhamento, temos dois sistemas onde um deles (primário) atualiza constantemente o outro (secundário), permitindo assim a existência de uma base de dados duplicada e atualizada. Quando o sistema primário falha, o sistema secundário assume o seu papel;
Contingência - Em caso de necessidade, todo o sistema pode ser transferido para uma instalação contratada junto a um provedor de serviços de contingência (data center). Essa mudança envolve o chaveamento dos links de comunicação entre o site de contingência e todas as filiais do cliente;
Tipos de Backups
Cópia simples - o backup é chamado de simples quando não envolve compressão de dados ou um registro de identificação do arquivo para um backup subseqüente;
Normal - consiste em armazenar tudo que foi solicitado, podendo ainda ser feita a compressão dos dados ou não. Este método também é chamado de backup completo ou global, quando são gravados todas as informações e programas existentes no computador. A desvantagem desse método é que se gasta muito tempo e espaço em mídia;
Diário – a cópia dos arquivos é feita checando-se a data, ou seja, armazenam-se todos os arquivos que foram criados ou alterados na mesma data em que se faz o backup. É gasto menos tempo e espaço em mídia, mas são armazenados apenas os arquivos criados ou alterados no dia;
Diferencial - só pode ser realizado após um backup normal, pois, como o próprio nome diz, gravam-se as diferenças entre os dados gravados no último backup normal e a data de gravação do backup diferencial. Exemplos: um backup normal ocorreu na segunda-feira; um backup diferencial realizado na terça-feira só constará os dados alterados ou criados na terça; se na quarta-feira for gravado outro backup diferencial, ele novamente vai gravar os arquivos alterados ou criados, desde que se gravou o backup normal, isto é, os arquivos de terça e de quarta. Apresenta como vantagem menos tempo e espaço em mídia, mas necessita do backup normal inicial;
Incremental - também necessita do backup normal e visa ao incremento da informação após a criação do backup normal. Ao contrário do diferencial, se for feito um backup incremental após outro incremental, o segundo backup não irá conter os dados do primeiro. Caso seja preciso restaurar o backup, será necessário restaurar o backup normal e todos os incrementais na ordem em que foram gravados, isto é, uma vez feito o backup normal, o incremental só irá gravar os dados alterados ou criados após o backup anterior, seja ele normal ou incremental. Apresenta como vantagem menor gasto de tempo e espaço em mídia, mas necessita do backup normal inicial e de todos os backups incrementais feitos após o normal;
Mídias para backup
Fitas
A fita é o mais tradicional meio de cópia de dados. Pode ser armazenada na própria empresa ou fora dela. Também pode ser descarregada em uma máquina de contingência da empresa ou em máquina contratada de algum prestador de serviços de contingência.
Dentre os modelos de fitas de backup, pode-se destacar a fita DAT (Digital Audio Tape). Considerada uma mídia eficiente para backup, a fita DAT teve seu aprimoramento com o passar do tempo. Os primeiros modelos atingiam no máximo 5Gb de armazenamento nominal. Hoje são encontradas fitas de 60m, 90m e 120m. O tamanho de cada fita está relacionado à sua capacidade, ou seja, quanto maior o comprimento da fita, mais dados ela poderá armazenar. A leitura e gravação dos dados serão feitos de acordo com a capacidade da fita.
Para definir as diferentes capacidades magnéticas das fitas DAT, foram criados padrões de gravação denominados DDS (Digital Data Storage). Estas unidades de DDS são diferenciadas por números seqüenciais (DDS1, DDS2, DDS3 e DDS4). Por exemplo, essas capacidades podem variar desde 2Gb (DDS1) até 20Gb (DDS4) em fitas DAT de 90m.
Uma característica das fitas DAT, tanto nos modelos antigos quanto nos novos, é que possui uma compressão de hardware nativa opcional que dobra sua capacidade nominal de armazenamento. As unidades de backup tipo DAT/DDS são recomendadas para servidores de rede ou estações com necessidade de armazenar grandes volumes de dados com informação "off-line";
A opção de contar apenas com a fita para o backup e restauração de um sistema apresenta vários desafios significativos em termos de níveis de serviço. O backup e a recuperação tradicionais baseados em fita não conseguem atender aos objetivos de tempo de recuperação críticos de hoje, pois não oferecem nenhuma garantia de que é possível fazer um backup completo dos dados ou recuperá-los totalmente, exigindo também períodos de backup longos que afetam diretamente a disponibilidade dos aplicativos em rede.
Discos
São os Zip Disks, Jazz Disks, os disquetes e os HD’s. Os discos levam vantagem sobre as fitas com relação à velocidade de acesso; são rápidos na busca da informação e têm boa taxa de transferência de dados, mas perdem em espaço.
Mídias Ópticas
São todas as mídias que armazenam os dados por reflexão ou marcação. Entram nessa categoria as fitas perfuradas, que usam leitura óptica como mídia de marcação e os DVD’s (Digital Versátile Disc).e CD’s, como mídias de reflexão.
As mídias que usam reflexão (CD-R, CD-RW e DVD-R), são classificadas em duas categorias diferentes: regraváveis e de gravação única. As principais vantagens da mídia óptica são durabilidade e imunidade a campos magnéticos. A desvantagem está no pouco espaço de armazenagem (os gravadores de hoje ainda não gravam mais de uma camada do DVD, o que o limita a cerca de 4.3 GB).
Convém ressaltar ainda que, atualmente, não são usadas mídias de marcação para procedimentos de backup.
Mídias Magneto-ópticas
Ainda pouco utilizadas, podem ser discos ou fitas. Os discos possuem uma capacidade um pouco superior aos discos convencionais e taxas de transferência semelhantes. Pode-se usar qualquer tipo de mídia para fazer backup. CD-R, DVD-R e Fitas WORM são ideais para gravar dados que se têm para manter por longos períodos de tempo.
Conclusões
Tão importante quanto fazer o backup é saber onde ele será armazenado. O ideal é que o backup esteja suficientemente distante dos servidores para não ser atingido no caso de uma calamidade (incêndio, desabamento, atentado terrorista, guerra, entre outras). Já o ideal para o recovery é que este esteja o mais acessível e próximo possível de onde desejamos efetuá-lo. Logo, a disponibilidade de um sistema em rede está diretamente associada ao projeto de backup e recuperação adotado pela empresa como política de contingenciamento. Uma solução confiável de backup e recuperação necessita de um planejamento detalhado e de um processo de criação eficaz.