Cuáles son las causas por las cuales un sitio web puede estar fuera de línea

Una de las características más atractivas de tener un sitio web, es ofrecer la conectividad al mismo desde cualquier parte del mundo a cualquier hora, ¿pero, podemos cumplir con eso ?..

Que un sitio web este online depende de varias cosas a tomar en cuenta:

Parece que son muchos eventos y piezas que deben estar bien coordinadas para que podamos ver un sitio web e interactuar con él.

Para este artículo vamos a considerar solo si un sitio esta online o no, dependiendo de si un usuario puede acceder a él desde la red de su proveedor, pues muchas veces podríamos considerar que un sitio web esta fuera de línea y sucede que la red de nuestro proveedor de servicios de internet no tiene acceso al mismo, esto puede suceder a problemas en la resolución de dns de manera local ( país).

Ahora volvamos a las causas técnicas por las cuales un sitio web no está online, para ello tenemos:

Sobre el mantenimiento programado o planificado, este normalmente lo realizan administradores del sistema a nivel de datacenter, los que en verdad «tocan» el hardware donde se encuentran físicamente nuestros archivos, ellos son los que tocan la «nube» de datos, son personal altamente preparado que realiza las operaciones exactas en el tiempo estimado o como le llamamos «ETA».

Los mantenimientos programados suceden por actualización del hardware, de componentes, del firmware, drivers, sistemas operativos y software de aplicación. Cuando solo es esto último se realiza las actualizaciones de software y se reinicia el sistema el sistema operativo, con todas las configuraciones correctas el servidor puede estar online en pocos minutos, si es por actualización de dns incluida, puede tardar un poco más dependiendo del tráfico de la red, si es por actualización de un componente de hardware puede tarar algo más dependiendo del tipo de componente.

Pero que sucede cuando los componentes del hardware fallan? Es verdad, nada es eterno, los medios físicos son finitos, se saturan, se degradan, vence su tiempo promedio de uso, pero también puede ocurrir que un programa intenta escribir (y lo logra) parte de un archivo importante de sistema en un sector dañado de la partición del disco duro en uso o es que acaso estamos diariamente pendientes de si el disco del servidor donde está nuestra información crítica tiene una cantidad de sectores defectuosos admisible?.

 

Luego tenemos los erros del usuario, internos y externos, no todo es la parte del hardware ni servidor web, muchas veces por una coma o un punto y coma todo un archivo de código queda inservible y se arroja muchos errores que ye estamos acostumbrados a ver, los que usan wordpress podemos ver a veces el error de conexión a la base de datos, esto sucede porque falla la conexión a la base de datos, normalmente Mysql, la misma corriendo en otro servidor se colapsa, y solo podemos acceder al sistema de archivos del sitio, cuando esto sucede es lo que yo llamaría una caída del sitio a medias, y esto tiene solución redireccionando los usuarios mientras se presenta el error hacia alguna parte de nuestro sitio donde puedan interactuar los usuarios hasta restablecerse la base de datos. También puede suceder que usuarios maliciosos dejen el sitio web inservible.

Finalmente pueden ocurrir desastres como terremotos , tormentas , inundaciones o cualquier evento fortuito que arrase con el datacenter entero, esto pareciera que sería poco factible de suceder pero recuerdo de datacenters que tuvieron que arrancar sus plantas diesel de energía alterna debido a nevadas.

Ing. Roberto Aleman

www.ventics.com

What to do if your site crashes

  1. Confirm that your site has gone down. Verify that your site is actually down. Make sure the problem isn’t your browser or internet connection. To be doubly sure, phone a friend and have them test your site.
  2. Try to determine the cause. If you can, try to pinpoint why the downtime is occurring. Programming error? DNS problem? Expired domain? Hardware related?
  3. Contact your hosting company or IT support. Get on the horn with your hosting company and see if they can assist you with your outage. Contact your IT support team or that super-nerdy neighbor of yours.
  4. Notify users of the outage. Don’t leave your users in the dark. Put out a message on your social media accounts to let users know what’s going on and when you plan to have things up and running. If the outage is planned, send out an email beforehand letting users know the date and duration of the outage.
  5. Regularly check in with your IT team. Regular communication with your IT team is crucial. Cooperate with them if they need any help finding information about your website or server. Get an estimate from them as to how long it will take for the problem to be resolved.
  6. Stay calm. Chill out! It’s not the end of the world. Downtime affects the best of us. Staying calm will go a long way in making sure that you and your team can resolve the problem as quickly as possible.

Things to do before your site crashes

  1. Buy DNS backup service. A lot of downtime (and headaches) can be attributed to problems related to your DNS. DNS backup services constantly grab your DNS data and act as a backup if your primary DNS goes down.
  2. Buy a monitoring service. You can purchase a service that pings your website every few minutes and notifies you (via text message, email, etc.) if it goes down.
  3. Always backup your database. In addition to making regular backups of your website and databases, make sure you create an additional backup before tweaking the database itself.
  4. Make sure your domain name registration is up to date. So many downtime fiascos could be solved by simply remembering to renew your domain name. Go ahead and set your domain name to auto renew. Or purchase your name for the next ten years and set the domain registrar lock.
  5. Use Google Webmaster Tools (GWT). Using GWT is a no-brainer. It provides you with detailed reports about your pages’ visibility on Google and will notify you of any errors that are encountered while crawling it.
  6. Use appropriate server downtime error codes. Be sure to use appropriate redirect server codes. Consult the internet or your IT team for proper use of server codes. Example: it’s generally better to tell crawlers that the downtime is temporary by returning a 503 HTTP result code (Service Unavailable) instead of returning an HTTP result code 404 (Not Found)

source:http://blog.kissmetrics.com/the-downtime-survival-guide/