Alertas críticas

2 views
Skip to first unread message

Nuria Martin

unread,
Mar 13, 2017, 5:21:34 AM3/13/17
to foro...@googlegroups.com
Hola chicos,

Necesito de vuestra experiencia.

A ver, voy a empezar a hacer guardias junto con otra gente que no tiene ni idea de bbdd. Si, esto tiene mas peligro....

A lo que voy, necesito procedimentar los casos críticos, primero para mi y después para el resto, por lo que necesito saber qué puede haber crítico en las bbdd. Cosas que he visto serían:

- Que se caiga la bbdd.
- Que se caiga el servidor.
- Que falle la conexión (culpa del listener)
- Que se llene el tablespace.
- Que se supere el número máximo de conexiones a la bbdd.

Y no se me ocurre mucho mas, a alguno que os haya pasado algo "crítico"?

De todo esto tendré que documentar paso a paso lo que se debería hacer en cada caso. JAP, ya sé que es una locura, pero es lo que ha pactado mi empresa, así yo solo obedezco órdenes.

Decidme algo, please...


Guillermo Serra Yahoo

unread,
Mar 14, 2017, 5:30:46 PM3/14/17
to foro...@googlegroups.com

Hola Nuria.

Entiendo que la bbdd es un filesystem no? No hay rac, no hay standby ¿

 

Porque depende mucho del entorno de los casos que te pueden pasar.

 

Que se corrompa un ctl y/o un dbf.

Que se quede sin espacio el archivado, o uno de los discos físicos del servidor.

Que un proceso vuelva loca la memoria del servidor y este deje de responder.

Problemas de lentitud de la bbdd (esto puede ocurrir por miles de factores).

 

En qué sistema operativo esta? Unix/Linux?, Windows?, que tipo de configuración tiene la bbdd?

Es que ayudarte así sin saber nada de que entorno hablamos es parafrasear tanto……

 

Suerte y cuéntanos algo mas.

--
Has recibido este mensaje porque estás suscrito al grupo "FORO_DBA" de Grupos de Google.
Para cancelar la suscripción a este grupo y dejar de recibir sus mensajes, envía un correo electrónico a foro_dba+u...@googlegroups.com.
Para acceder a más opciones, visita https://groups.google.com/d/optout.

Nuria Martin

unread,
Mar 15, 2017, 2:56:28 AM3/15/17
to foro...@googlegroups.com
Hola Guille!!

No podía contar mucho mas porque son un montón de bases de datos. Estoy trabajando para la Junta de CYL, por lo que hay bases de datos de la consejería de fomento, de medio ambiente, de sanidad, de agricultura... Así que barajamos desde la versión 8 hasta casi la 12. Aunque la mayoría están en 11.2.0.4. Además tenemos un RAC, por lo que ahí están las bbdd mas importantes. Eso sí, todas están en Linux.

En cuanto a llamadas de guardia debe haber bastante pocas, al parecer lo tienen todo bastante bien montado, pero si se llenase un tablespace, por ejemplo, imagino que me tocaría ampliarlo para que sigan trabajando.

Cierto es que no hay muchas llamadas de guardia porque la gente que lo usa normalmente son los funcionarios, y ya sabéis que horarios tienen.

No había pensado en el espacio de archivado, pero no creo que llamen por eso, eso se arreglaría al día siguiente por la mañana (si es que es día laboral). Pero quiero barajar todas las opciones, sobretodo para cuando no sea yo la que esté de guardia.

Gracias!!!


Para cancelar la suscripción a este grupo y dejar de recibir sus mensajes, envía un correo electrónico a foro_dba+unsubscribe@googlegroups.com.


Para acceder a más opciones, visita https://groups.google.com/d/optout.

--
Has recibido este mensaje porque estás suscrito al grupo "FORO_DBA" de Grupos de Google.
Para cancelar la suscripción a este grupo y dejar de recibir sus mensajes, envía un correo electrónico a foro_dba+unsubscribe@googlegroups.com.

Alvaro I.

unread,
Mar 15, 2017, 4:38:16 AM3/15/17
to foro...@googlegroups.com
Buenos días Nuria,

Te cuento un poco en mi caso. Las guardias las reciben la gente de linux y si la alerta es de una maquina que tenga una bbdd nos llaman. Por lo que pienso que el documento deberia implicar a la gente de linux o de las maquinas. Tenemos dos niveles, warning y critical en nuestro caso para monitorizar usamos nagios. Te pongo las cosas que nosotros monitorizamos para la guardia:

  - Espacios en disco de las particiones que afectan a la bbdd.
  - Uso de cpu
  - Carga de la maquina.
  - Uso de memoria
  - Uso de swap (en el caso de linux)
  - Especificos de oracle:
     - Bloqueos de sesion
     - Bloques corruptos
     - Tablespaces
     - I/O datafiles
     - Objetos invalidos
     - Porcentaje de sesiones usadas
     - Redo I/O
     - Usuarios conectados
     - Tiempo de cambio entre redo
     - Redolog buffer
     - Errores bkp RMAN

Si necesitas te podria enviar un plan de contingencias para que te hagas una idea.

😉


Nuria Martin

unread,
Mar 15, 2017, 5:07:11 AM3/15/17
to foro...@googlegroups.com
Hola Álvaro!

Muchas gracias por el super listado! En nuestro caso lo piensan monitorizar desde un centro que tenemos de monitorización, donde llevan muchísimos temas. En teoría, si ellos no saben solucionarlo, es cuando nos llaman a nosotros, por lo que la parte de Linux que dices, es cierto que deberían ser ellos los que lo solucionasen.... bueno saberlo para comentarlo con la empresa. Lo demás sería mas cosa mía.

Me quedo con ese listado, y si me mandas ese plan.. mejor que mejor... 

Alvaro I.

unread,
Mar 15, 2017, 8:17:42 AM3/15/17
to foro...@googlegroups.com
Buenas de nuevo,

Te envio un ejemplo de plan de contingencias de la parte de la bbdd, que pertenece a un conjunto de documentos en el que se describe cada capa del servicio y que hacer en cada caso, en que orden hay que arrancarlos, particularidades etc.., en nuestro caso consta de las siguientes partes :

                  - Comunicaciones y redes
                  - Maquinas:
                  - Servicios web, tomcat, etc
                  - Bbdd
                  - Otros servicios

Como veras es muy basico puesto que la gente que hace las guardias no tiene experiencia con oracle y para un primer chequeo vale, si es una alerta especifica de oracle nos llaman directamente.
Una vez intentamos hacer un documento con el tema de los tablespaces para ellos que es lo que mas guerra suele dar, pero es muy complicado para una persona que no vive el dia a dia de la bbdd y aun mas no teniendo mucha idea de oracle. En fin.

Nosotros todo esto lo tenemos subido a una wiki a la que solo tiene acceso sistemas y cada uno va documentando su parte, en la parte de oracle por ejemplo tenemos apuntado todo sobre las bbdd,  version, ip, nombre de la maquina, puerto y nombre del listener, si es virtual o no, so, horas de los bkps, si tiene flashback, si tiene dataguard, si tiene streams...etc, en fin toda la informacion que nos pueda ser util a la hora de resolver una incidencia. Lo de la wiki es muy util y lo recomiendo!! ;-.)



---------- Mensaje reenviado ----------
De: Nuria Martin <air...@gmail.com>
Fecha: 15 de marzo de 2017, 10:07
Asunto: Re: Alertas críticas
Para: "foro...@googlegroups.com" <foro...@googlegroups.com>
Plan de contingencias bbdd.pdf

Alvaro I.

unread,
Mar 15, 2017, 8:38:44 AM3/15/17
to foro...@googlegroups.com
...por cierto, se me ha pasado decirte, que para estos operadodes de guardia, crees usuarios limitados, estudiar que necesitan hacer y darle solo los permisos necesarios. Te lo digo para que no usen el SYS o el SYSTEM, por los desastres que puedan causar y por las auditorias.
Reply all
Reply to author
Forward
0 new messages