Trooper
|
Foi-se meu feriado :(
18-04-08, 20:18
#1
Sou DBA Oracle e SQL Server,
na empresa que trabalho 90% dos sistemas estao totalmente ou em parte dentro dum storage DELL-EMC, tido como top de mercado e 'a prova de falhas'. Como funciona um storage: temos N gavetas que assim: ------------------------- disco1 + d2 + d3 + ... +dn ------------------------- Cada gaveta é um raid group, com disco de contingência, raid5, etc etc.. tudo padrao para essas coisas. Todos os sistemas críticos estao nesse storage. A merda que deu nele? A gaveta 1, que é onde ficam os discos do Sistema Operacional do Storage EMC², deu pau. Sao 4 discos, 2 + 2(contingência). TRÊS DESSES QUATRO DISCOS FORAM PRO SACO O que quer dizer isso? Nesses discos ficam as informaçoes de paridade de dados espalhados pelos raid groups e luns, ficam as informaçoes de espelhamento e mapeamento. Ou seja: nao adianta de nada os discos de dados estarem intactos, todo o storage foi pro saco do mesmo jeito. Imagina a cena, bonequinho do suporte da DELL olha o problema e diz: "vamos ter q abrir um chamado na EMC pois o negócio e MUITO sério, o chamado a ser aberto será de suporte nível 4(núcleo de engenharia), possivelmente o primeiro desse tipo a ser aberto daqui do Brasil." Enfim, no momento estamos esperando a EMC dos EUA nos dar retorno, e torcer pra eles resolverem. Caso contrário o feriado da infra toda foi pro saco uaheaueuahe teremos que restaurar trocentos backups de banco, de arquivo, de servidor d email etc etc Teve um caso semelhante com a Mandic(eu acho) que era o unico no mundo que sei que teve um problema semelhante e a empresa ficou inoperante durante 1 semana, mas o Storage deles era Hitachi. PUTA QUE PARIU. PUTA QUE PARIU /desabafo mode off |
||||
Trooper
|
18-04-08, 20:26
#2
agora, depois de resolvido o problema, acho que vocês poderiam mudar de raid não?
ps: MUITA BOA sorte |
Trooper
|
18-04-08, 20:51
#3
ta vendo??? agora vai poder botar no CV
|
tony
|
18-04-08, 20:52
#4
num entendi nem metade do problema. mas boa sorte ai.
|
Trooper
|
18-04-08, 20:58
#5
onde tu trabalha?
boa sorte ai! |
Trooper
|
18-04-08, 21:14
#6
ehuAE sephi...
infra foi feito pra tomar no cu mesmo AEOHIEAHOIEAH |
Trooper
|
18-04-08, 21:27
#7
Quote:
|
|
Banned
|
18-04-08, 21:35
#8
eu comecei a não intender no DBA oracle
|
manboipig
|
18-04-08, 21:36
#9
Google:
Declaração de Bagagem Acompanhada (DBA) Os formulários da DBA para viajantes não residentes no Brasil estão disponíveis em espanhol e inglês e são fornecidos gratuitamente... |
Trooper
|
18-04-08, 21:42
#10
cara tem alguem aqui nesse forum, alem de mim, que nao trabalha nessas área de informatica e boia 100% nesses topic??
uhahuahuauhauhhuauha |
Trooper
|
18-04-08, 22:03
#11
tiger, eh nois
toca ae mano 0/ |
Banned
|
18-04-08, 22:06
#12
eu recebo uma revista dessa oracle ai todo mes de gratis tudu em ingles nao sei porra nenhuma
mas parece ser uma revista legal |
Banned
|
18-04-08, 22:10
#13
Quote:
|
|
Trooper
|
18-04-08, 22:18
#14
Quote:
Quote:
Quote:
|
|||
Back to the U.S.A.
|
18-04-08, 22:25
#15
a unica coisa que eu sei eh que raid 5 teoricamente protege a falha de qualquer 1 HD... mas 3 ir pro saco ao mesmo tempo eh meio que 1 chance em 10^19863981639831 nao?
|
Trooper
|
18-04-08, 22:54
#16
Aposto q foi a tiazinha da limpeza
99,999999% de chance de uma tiazinha ter feito merda |
Trooper
|
18-04-08, 22:57
#17
Quote:
pqp, chutam a maquina, desligam quando vão limpar com a vassoura atras dos gabinetes auehauhaiuea |
|
Trooper
|
18-04-08, 22:59
#18
velho puta que pariu, como 3 HDs vão pro saco ao mesmo tempo? acredito que as explicações mais prováveis são: - excesso de temperatura - variação brusca na corrente ou tensão de alimentação (acho menos provável) - lote de HDs com defeito (mais provável, já que devem ter sido utilizados HDs de um mesmo lote). |
Banned
|
18-04-08, 23:10
#19
vegetous
ficou na mesma aeuaheiauehiaeuhaiueae |
Trooper
|
18-04-08, 23:18
#20
bom, o raid não importa pra entender o problema, o importante é saber que ele perdeu o índice que permitia ao sistema localizar as informações espalhadas nos HDs.
é o mesmo que você apagar a tabela de partição de um HD normal. os dados estão intactos, mas o sistema não os encontra mais. t+ |
Master Chief
|
18-04-08, 23:20
#21
eu vou trabalhar sab/dom/seg
mas meu motivo eh diferente la no trampo o bd eh sybase....porem as vertical shuttle sao oracle... acho moh massa essas maquinas |
Trooper
|
18-04-08, 23:24
#22
boa serjao, trabalhando hora extra pra comprar o meu ds! haha seph q é EMC? e=mc²? ajsej
|
Banned
|
18-04-08, 23:30
#23
Quote:
creio eu alguma fórmula de fisica senão to inganado |
|
tony
|
18-04-08, 23:34
#24
é uma formulazinha atoa, da relatividade.
|
inativo
|
18-04-08, 23:53
#25
besteira ter 4 hds com a mesma coisa na mesma máquina
o normal é ter 2 hds em 2 ou mais máquinas separadas.. ou mesmo 1 hd, mas em várias máquinas independentes e preferencialmente em locais físicos diferentes o dpto de fx do citi tem 5 datacenters iguais, um em cada continente, todos auto-suficientes e independentes nine-eleven deixou os caras um pouco paranoicos.. redundancia de datacenter inteiro é tenso |
Trooper
|
19-04-08, 00:18
#26
Esse é o tipo de caso que aparece em revista especializada.
Sabe qd tem "casos de sucesso" nelas? Esse seria um caso de falha. aparentemente a EMC vai salvar os dados depois de 2hrs os caras passaram o status de q tao fazendo rebuild dos discos a parada eh uma caixa-preta, nao tenho a menor ideia de como funciona, nem a DELL. Moh saco depender dos outros e ficar na merda por isso. teremos reunioes sobre procedimentos de contingência a madrugada toda, e nego vai se revezar de plantao aki acompanhando o trabalho da EMC... já tinha desmarcado saída com uma mulher daki da empresa por causa disso... agora to indo pra casa dormir, pra estar de stand-by amanhã caso precisem de mim. aff... nao trabalhem em TI |
Trooper
|
19-04-08, 00:23
#27
índa bem q eu n fui nerd o suficiente pra fazer faculdade de computacao
so da dor de cabeça |
Trooper
|
19-04-08, 01:34
#28
pqp, conseguir foder 3 discos, AO MESMO TEMPO,de um RAID-5 do sistema operacional de um Storage externo eh algo assim de SENSACIONAL... casos fora do desvio padrao sao assustadores jeajeuheauheauhee...
btw, q caralhos vcs fizeram com o storage? jogaram futvoley com ele dentro da sala do servidor !?!?!? ou usaram ele como mesinha de truco? |
Trooper
|
19-04-08, 02:52
#29
Sua sorte é que o suporte da Dell é bom , quando eu trabalhava com infra , tive um problema com o raid nos servidores DELL também, demorou o final de semana inteiro mas conseguimos recuperar tudo.
O problema começou porque o gerente foi mecher em alguma coisa la, no final de semana eu só via ele batento a cabeça na parede e falando "PorquÊ? PorqueÊ?" . Iamos todos pra rua concerteza uhauha. |
Trooper
|
19-04-08, 03:07
#30
voce nao é o unico
apareceram varias coisas pra revisar aqui sabado domingo e segunda foram MTO pro saco |
inativo
|
19-04-08, 04:04
#32
não é tão dificil de acontecer isso com um ponto único pra falha :/
|
Trooper
|
19-04-08, 09:02
#34
os caras falam grego na cara dura e acham que a gente acredita, tá bão! =].
|
Trooper
|
19-04-08, 09:16
#35
Veelhooooooooooooooooooo
E eu pensava que eu era Zicado, sério mesmo Tenho anos de informatica e nunca ouvi falar de coisa parecida também, na boa, como o TDF disse ae, se benze pq alguém te jogou uma zica forte Eu aposto na tiazinha da limpeza hein ^^ |
Trooper
|
19-04-08, 10:40
#36
...ou funcionário insatisfeito
|
e tenho dito
|
19-04-08, 10:52
#37
passa o easyrecovery...
que puta merda isso ein |
Trooper
|
19-04-08, 12:00
#38
Quote:
Seph, esses storage da EMC, o software tem q comprar separado? pq vcs nao optaram pela IBM. Tá, eu sei q é beeeemm mais caro .. anyway.. heheh.. tinha nenhum spare n? |
|
Trooper
|
19-04-08, 14:02
#39
Quote:
oaieoieaa |
|
Trooper
|
19-04-08, 14:30
#40
nao entendi nada, só entendi que o problema é cabreiro
entaoooo, boa sorte o/ |
spkr
|
19-04-08, 16:51
#41
Compra outro EMC pra fazer o backup desse EMC
SAEIUHSAEOIU |
Trooper
|
19-04-08, 20:12
#42
zipa tudo e poe no Gmail
|
Trooper
|
19-04-08, 21:20
#43
Quote:
BOA SPUUN AUHWE |
|
Banned
|
19-04-08, 21:38
#44
|
Trooper
|
19-04-08, 22:06
#45
Quote:
|
|
Forever Young
|
19-04-08, 23:00
#46
Quote:
http://produto.mercadolivre.com.br/M...16gb-cache-_JM EMC Symmetrix Enterprise Storage System 10.25 TB, 16GB Cache olha o preço da bichinha.... |
|
Trooper
|
20-04-08, 04:07
#47
maxcú just got own3d
euahe eu tb vi essa reportagem |
Trooper
|
20-04-08, 07:33
#48
É mesmo maxcu... eles são fodas!! JOEOPpeEOHJoej
|
Banned
|
20-04-08, 08:33
#49
Caras
vcs estao vendo um teste onde eles danificaram apenas a controladora de um hd ide, probably. o trabalho que essa empresa fez pra recuperar arquivos perdidos no trampo foi fodastico, embora demorado mesmo. |
Trooper
|
20-04-08, 11:55
#50
Danificaram a controladora e depois de 2 semana identificaram com orçamento em quase 2 mil reais... FODÕES KR@!!!!!!
|
Trooper
|
20-04-08, 13:11
#51
nossa o problema deve ser muito serio mesmo, nao entendi nada :9
|
Trooper
|
20-04-08, 13:38
#52
ah, fácil, usa o partition magic
|
🌀 Trooper
|
20-04-08, 17:34
#53
Problemas no storage é a pior coisa que pode ocorrer. Na empresa de seguros que trabalhei corrompeu o banco e o mesmo nem subia direito. Não sei o que houve, mas não se conseguia usar interfaces de SQL para poder recuperar o banco, só teve que fazer via SQL*Plus...
|
Trooper
|
20-04-08, 18:07
#54
Quote:
se alguém um dia perguntar pq não parti pra essa área, eu vou dizer que foi o eloqüente conselho de um brother e inaptidão. mas a maiora parte foi o conselho |
|
Trooper
|
20-04-08, 18:13
#55
aioheoiahe
resolveram-se lá pessoal da minha área(banco de dados) se revezou em turno de 8hrs pra ficar em casa de plantão caso fosse chamado pessoal da EMC foi reconstruindo os raid groups um por um entao foi uma parada conta-gotas, cada hora o BD de um sistema tava liberado e tinham q testar. dei a sorte de nao ser requisitado em nenhum momento mas saí no sabado sem poder beber, de olho no celular...aff acabou agora, 48hrs depois, o trabalho do pessoal da EMC. a 'sorte' eh q amanha é feriado, entao todo o processamento de cobranças e coisas do tipo será feito amanha. |
Trooper
|
20-04-08, 18:17
#56
pô que massa velho.
eu tava me perguntando se vc tava em casa. heaiuehiahe que bão! \o/ |
Trooper
|
29-10-13, 14:50
#57
Up!
Aconteceu uma merda com meu fds! Bem diferente do seu, alias MTO diferente... Aí lembrei desse topic. Não sei porque o JÊNIO do animal que gerencia nosso db... Setou o backup pra sobrescrever cada vez que fizesse... Ao invés de guardar po um tempo... e ele é feito a cada 6 horas. Resultado, deu merda a 0:30, e as 08:00 quando chegamos pra trabalhar, o backup era o corrompido |
Caldas
|
29-10-13, 14:56
#58
uhehueuheuhuhebrbrbr
|
The Alpha Male
|
29-10-13, 15:19
#59
normal
só sentem falta de backup ou testar infra quando a mesma da pau |
Trooper
|
29-10-13, 15:29
#60
aheuhauea
fazer backup do db corrompido da hora |
Trooper
|
29-10-13, 15:29
#61
bem brasileiro esse tipo de comportamento huehuebrbr
|
R2D2
|
29-10-13, 15:47
#62
nem me fala, migrar dois servidores esse feriado!
|
Quagmire
|
29-10-13, 15:53
#63
Já teve cliente meu que achava que RAID-1 era "backup"
whee |
Trooper
|
29-10-13, 15:59
#64
ehauihe se fode ai, timber
|
Trooper
|
29-10-13, 16:00
#65
meu deus
eu ja tinha esquecido disso ae q fds DE MERDA aquele |
Master Chief
|
29-10-13, 16:21
#66
massa reler este topico
a uns 2 anos atras tivemos um problema parecido com esse storage aqui, conectado a um xserve http://www.sonnettech.com/product/le...nd800raid.html o primeiro disco morreu, e ao reconstruir ele morreram mais 2...ai foi tudo pro espaço o pior de tudo foi o suporte desses caras, compramos esse storage pq é homologado pela apple e talz....soooooooooooooooooooo q mal existe suporte no brasil.....ai eh fod@ mas deu tudo certo e espero nunca mais trabalhar com essa marca haueh :P to mal acostumado com o suporte da dell s2 |
Trooper
|
29-10-13, 17:20
#67
Quote:
|
|
Trooper
|
29-10-13, 17:25
#68
@holo, sim! Porém serviu para liberarem minha vpn... o que não queriam por eu ser terceiro
@vegetous, nessas horas eu me lembro que não sou tão jr quanto eu achava que fosse! |
The real (1)
|
29-10-13, 20:03
#69
alguem explica pra leigos?
|
|
|