Category Archives for "VMware"

vRealize Operations Manager: Primeros pasos

Capura de vrealize vRealize Operations Manager

Serie de posts sobre vRealize Operations Manager

vRealize Operations Manager es la solución de VMware que nació para darle a nuestro entorno vSphere una visibilidad profunda y eficiente, de una manera fácil y sobretodo flexible. Cada vez se está consolidando más como la herramienta de monitorización para estos entornos: el hecho que sea del mismo VMware ayuda, pero sobre todo es la facilidad de recolectar métricas y presentar los datos, adaptándose muchísimo a los procesos u operativas de cada departamento de IT.

“Out-of-the-box” ya nos da muchísima información tanto a nivel de análisis como a nivel de generación de alertas o notificaciones, pero es sin duda cuando se genera una necesidad de datos sobre el entorno en nuestro departamento cuando podemos sacarle el máximo partido, generando el reporte, dashboard o alerta que precisamos de manera personalizada.

Es por ello que voy a dedicar los siguientes post a ver con profundidad vRealize Operations Manager, desde su instalación a cómo configurarlo de manera que nos ayude precisamente a dar respuesta a nuestras demandas.

¿En qué consiste vRealize Operations Manager?

vRealize Operations Manager es una solución de monitorización y Capacity Planning que, como tal, se enfoca en tres grandes funciones: recolectar datos, analizarlos y presentarlos.

En todos estos puntos, vROps destaca de entre los demás de la siguiente manera:

  • En cuanto a recolección, es rápido y muy fácil de configurar para que acceda a las métricas/datos de los sistemas origen. Es importante resaltar que, aunque sea de VMware, no es un producto orientado únicamente a monitorizar nuestro vCenter, ni siquiera orientado a monitorizar sólo productos de VMware. Por defecto lo que nos viene es vROps con el conector para vCenter, ése siempre estará ahí, pero existen un montón de “Management Packs” del propio VMware para integrar vRealize Operations Manager y monitorizar otras de sus soluciones más allá de vCenter o incluso de terceros para monitorizar dispostivos (switches, cabinas, …) o aplicaciones (SAP HANA, Oracle, Antivirus, …). Aquí podréis ver qué plug-ins, ampliaciones y Management Packs existen. Hay fabricantes como Blue Medora que se dedican a desarrollar este tipo de conectores.
  • En cuanto a análisis, estaremos de acuerdo en que previamente a la caída o malfuncionamiento de un sistema, este experimentará en la mayoría de los casos un comportamiento distinto al “normal”, anómalo. Las soluciones de monitorización tradicionales basan sus sistemas de alertas en tratar la evolución de una métrica según evolucione en el tiempo y dar su comportamiento como “correcto” mientras esté contenida en un umbral preestablecido. vROps va mucho más allá. Aprende el comportamiento normal según patrones que ya ha analizado para ese objeto y su motor analítico es tan potente que permite no solo levantar alertas por que tal métrica ha alcanzado el umbral que le hemos establecido, sino que además nos dirá si ese objeto está teniendo el comportamiento esperado para ese momento. De esta manera podemos preveer un potencial problema en cada elemento monitorizado. Además, es sencillo poder crear escenarios “What-If” que nos permiten simular qué niveles de servicio tendría nuestro actual entorno si le añadiéramos más capacidad, más VMs/demanda, le quitaramos un host…,
    Finalmente, tenemos la capacidad de aplicar políticas según queramos ser más agresivos o más conservadores en cuanto a todo lo que el análisis y tratamiento de las métricas se refiere, ya sea en umbrales de alertas, Capacity Planning, …
  • En presentación de datos, además de traer reportes, widgets y Dashboards por defecto, nos aporta una gran flexibilidad para poder crear nuestros propios paneles y reportes a medida, según más nos convenga.

Una vez tiene analizadas las métricas de los objetos a monitorizar, genera unas métricas propias llamadas “Badges” que consisten en un resumen del estado de cada objeto en los siguientes términos: Salud, donde nos indicará si el objeto está actualmente experimentando algún problema o error. Riesgo, que aporta la información de capacidad y tiempo restante de nuestra infraestructura según la proyección del uso y crecimiento actual de la misma, así como problemas de salud sostenidos en el tiempo. Por último eficiencia, detallando qué oportunidades de ahorro o reclamación de recursos tenemos según el uso que estemos haciendo de la infraestructura.

De este modo que podemos tener una gran variedad de entornos monitorizados bajo una sola herramienta.  Esto nos da la gran ventaja de poder relacionar los diferentes objetos de nuestra infraestructura en todas las capas. Aún mas, ofréce toda la potencia de un motor analítico muy desarrollado y customizable. Finalmente, la libertad de customizar la presentación de datos para adaptar la herramienta a las operativas de nuestro departamento.

Arquitectura de vRealize Operations Manager

A nivel de arquitectura/implementación, vROps tiene dos tipos de despliegue según los niveles de disponibilidad que se quiera de la aplicación o la cantidad de datos que se gestionen: un modo “all-in-one” en el que un solo nodo se encarga de recolectar los datos, analizarlos y mostrarlos o un modelo distribuido en el que se pueden desplegar los siguientes nodos:

  • Master Node: siempre habrá uno nodo con este rol en nuestro “cluster” de vROps, ya sea “all-in-one” o distribuido. Este nodo se encarga de gestionar todos los demás y lleva todos los roles.
  • Data Node: Lleva los conectores para poder recolectar datos de las diferentes fuentes
  • Replica Node: Réplica del master para dar HA al cluster de vROps
  • Remote Collector Node: Estos solo recolectan información de los objetos de inventario, no almacenan los datos ni los tratan, sirven para reducir el consumo de ancho de banda para monitorizar entornos externos.

Conclusión

vROps es la solución para dar la visibilidad que todo entorno necesita. VROps permite así ser mucho más eficientes en la resolución de incidencias, poder prevenir las mismas y tener el control de cuánta infraestructura nos queda.

VMware está ofreciendo un programa de optimización de infraestructuras mediante vROps con el que se entrega un informe detallado de los problemas reales y potenciales de cada entorno basado en vSphere, así como las oportunidades de ahorro en recursos que tenemos. No dude en contactar con nosotros rellenando este formulario con la opción “Monitorización de sistemas” para llevar a cabo uno de estos estudios y tener una imagen real del estado de salud y la proyección de su entorno.

La entrada vRealize Operations Manager: Primeros pasos aparece primero en Un cio como tu ….


Source: jmgriscom

El valor de Devops para un negocio

Print

Cuando hablamos de Devops, tenemos tendencia a centrarnos en las tecnología, herramientas y procesos utilizados. Básicamente es porque quién hablamos de ello somos gente que formamos parte de los equipos de desarrollo o de operaciones. Pero que valor aporta Devops para un negocio?

En el post anterior “Devops ROI” vimos los conceptos generales que permiten justificar la inversión en tecnología, el ahorro en costes de horas de trabajo y el ahorro en caídas del sistema. Pero Devops aporta otras ventajas o valor difícil de cuantificar en términos monetarios. Hoy en día, donde todos o la mayoría de los negocios son negocios basados en tecnología, este valor puede ser el hecho diferencial entre una empresa u otra.

La implantación de Devops nos permite impactar directamente en mejorar como distribuimos un producto al cliente, cambiar el producto rápidamente para satisfacer las necesidades del cliente o como recuperamos después de un fallo que afecta al cliente.

Un producto en si mismo no es nada hasta que un cliente lo utiliza. Es por ello que es importante reducir el tiempo de lanzamiento de un producto, y aquí es donde la automatización actúa como un multiplicador, permitiendo la colaboración de todos los equipos involucrados en la creación de un producto.

De la misma forma que un producto no sirve de nada si no lo utiliza un cliente, las mejores funcionalidades son aquella que utiliza el cliente. De nada sirve tener un producto con un montón de funcionalidades que no se utilizan. Es por ello que todos los esfuerzos deben focalizarse sobre las funcionalidades que utilizan los clientes, pero como sabemos que funcionalidades va a utilizar el cliente si aún no la hemos lanzado? Devops permite cambiar el enfoque en que priorizamos las funcionalidades de un producto. Pasamos de un enfoque basado en lo que el propietario o la gente de marketing quiere que tenga el producto a un enfoque basado en lo que el cliente quiere que tenga el producto. Para ello, la frecuencia de desarrollo y el uso de test A/B sobre grupos de clientes nos permiten conocer que funcionalidades y mejoras que quieren los clientes.

Por otro lado, todo y que a todos nos gustaría que un producto nunca fallara, tenemos que asumir que en el mundo real el fallo forma parte del ciclo de vida de un producto, falla la tecnología y fallamos nosotros. Todo y que con la automatización de los procesos de testing y deploy se reduce el número de fallos, debemos entrenarnos en la gestión del fallo para reducir el tiempo de recuperación ante fallo o MTTR (Mean Time To Repair). La reducción del tiempo de recuperación ante un fallo mejora la satisfacción del cliente.

En resumen, aplicar Devops permite reducir el tiempo de lanzamiento de un producto, distribuir al cliente aquello que desea el cliente, y mejorar la satisfacción del cliente.


Source: jmgriscom

Nueva Web en Orbal

web-orbal

Una web llena de recursos para vosotros

web-orbal

Siempre he dicho que una imagen vale más que cien palabras, y por eso creo que lo mejor es que se vea lo que estamos haciendo.

Estamos haciendo un punto de encuentro donde un Responsable Informático pueda encontrar la mayor cantidad de recursos sobre ello, videos, white papers, e-books

Y mientras vamos populando este apartado, podéis ver nuestro nuevo site, desde donde podréis ver lo que hacemos, nuestras novedades, etc.

captura-de-pantalla-2016-09-25-a-las-18-39-52

Os esperamos pronto por www.orbal.es

Take care,

JM

 


Source: jmgriscom

Configurando OVAs i OVFs con OVFTOOL

packageovaovf

La portabilidad es sin duda una de los principales beneficios de definir nuestras máquinas como virtuales. Al ser éstas un compendio de ficheros de configuración, son fácilmente exportables e importables en otros entornos manteniendo su consistencia. Sin embargo, la proliferación de hipervisores y versiones de los mismos hace que no siempre sea “tan” fácil.

Para tal efecto nació el formato OVF (Open Virtualization Format). Su objetivo era sencillo: una manera standard de poder definir una VM para que pudiera ser importada en un hipervisor distinto del que fue “originada”. Consiste en una carpeta que incluye un fichero XML con extensión .ovf (podemos verlo como el equivalente a el .vmx que describe la configuración de nuestra VM en origen) juntamente con los .vmdk, los discos de nuestra VM y normalmente un fichero .mf que contiene un hash SHA1 de los ficheros del ovf. Poco después, salió el .ova, que no es más que la compresión de la carpeta que conforma el OVF.

Hasta aquí todo suena bien, pero la realidad nos lo suele complicar bastante más: ¿qué sucede por ejemplo si tenemos una VM en un entorno VMware Fusion 8 de desarrollo y queremos importarla en un ESXi 6.0? Lo más normal es que hubiéramos creado la VM en versión de Hardware 12 en origen cuando, en destino, esta versión no está soportada.

Para todas las tareas relacionadas con la gestión y configuración de un fichero .ova o un paquete .ovf, nació ovftool, una herramienta de VMware.

¿Cómo solventamos el problema expuesto antes?

Normalmente, al intentar importar el .ovf de nuestra VM exportada de Fusion en vSphere 6.0, recibiremos el siguiente error:

The OVF package requires unsupported hardware
Details: Line 25: Unsupported hardware family ‘vmx-10’.

Primero de todo, vamos a descargar ovftool desde aquí. A continuación, vamos a obtener el fichero .vmx a partir del .ovf. Ejecutamos el siguiente comando:

ovftool <ruta donde se encuentra el fichero .ovf> <ruta donde queremos guardar el fichero .vmx>

Una vez tenemos el .vmx, lo abrimos con un editor de texto y cambiamos la línea virtualHW.version a la versión de hardware que soporte nuestro hipervisor en destino.

Imaginemos ahora que no partimos de un fichero .ovf y partimos de un .ova. Para pasar del formato comprimido a .ovf nos valemos también de ovftool mediante el siguiente comando:

ovftool.exe --lax <ruta donde se encuentra el fichero .ova> <ruta donde queremos guardar el fichero .ovf>

Para más información, recomiendo ver su manual acerca de lo que nos puede aportar ovftool.


Source: jmgriscom

Organiza tus jobs de Veeam mediante políticas

organiza-tus-jobs-mediante-veeam

El hecho de que la virtualización es una tecnología ya bastante madura en cada vez más entornos supone muchos retos. Vamos añadiendo cargas (seguramente cada vez más críticas y sensibles) a los hipervisores, nuevas máquinas, ratios de consolidación más agresivos y demás realidades que parece que induzcan la idea de que mantener el control de nuestra infraestructura tenga que ser más una cuestión de “hacer malabares”. Estos fenómenos son los que o ya afrontamos o afrontaremos en algún momento y es por ello que por ahí van las tendencias de los fabricantes cada vez apostando más por la automatización y la monitorización.

Estas realidades aplican por supuesto también a las soluciones que dependen directamente de nuestra infraestructura vSphere, como por ejemplo Veeam Backup&Replication. Antes de nada, en el caso de Veeam, lo primordial es mantener una definición de los requerimientos de cada VM en cuanto a su nivel de disponibilidad, luego veremos cómo aplicarlos y sobretodo mantenerlos de manera ágil.

Al final, lo que queremos es una manera ordenada y dinámica de proteger nuestras VMs según las condiciones específicas de cada una de ellas.

Para definir estas políticas deberemos analizar qué requerimientos tienen nuestras VMs o nuestros perfiles de VMs: tenemos que declarar los parámetros en los que basaremos nuestras políticas de Backup/Replicación.

Paso 1 – definir parámetros y valores

Un ejemplo sencillo de estos parámetros podría ser el siguiente:

  • RPO

    • ¿Cada cuanto tiempo debemos ejecutar una copia de la VM? Lo podemos medir en minutos, horas, días …
  • Ventana
    • ¿Qué intervalo tenemos para ejecutar la copia? Pierde relevancia si usamos Storage Snapshots. Expresado en franja horaria.
  • Retención
    • ¿Qué histórico de copias debemos almacenar para esa VM? Lo especificaremos en valores “absolutos”. Es decir, si quiero mantener una semana de copias y mi RPO es de 24h, tendrá un valor de 7.
  • RTO
    • Tiempo en poner la máquina en producción a partir de la declaración del desastre. En sí no es un parámetro que apliquemos al job como el RPO, pero podemos agilizarlo usando Reverse Incremental o más aún con replicas.
  • Encriptación
    • ¿Debemos encriptar los datos de esa VM?
  • OS
    • Mantener VMs de OS/Datos/Apps parecidos nos ayudará a tener mejores ratios de deduplicación.
  • ¿Backup secundario?
    • Hay que almacenar una copia de la VM en algún otro lugar.

Paso 2 – agrupar

Con  este análisis como primer paso, tendremos una descripción en términos de protección de datos de nuestras VMs, “metadatos” para cada una. Ahora nos hará falta agruparlas según valores parecidos. Fácilmente, acabaremos (siga esto entendiéndose como ejemplo) con un grupo que será “Producción – Linux” con unos valores iguales para cada parámetro en todas las VMs. Con estos grupos, tendremos una posible propuesta de organización/distribución de nuestros Jobs de Backup/Replicación.

Paso 3 – “dinamizarlo”

Sin embargo, no olvidemos que el principal ánimo de este post es hacer el trabajo (sobretodo el de mantenimiento) más sencillo. De momento, tenemos una manera ordenada de proteger a nuestras VMs según los requisitos específicos de cada una, pero no hemos hablado de cómo hacer todo este proceso dinámico o semi-automatizado.

Cuando hablamos de Jobs dinámicos en Veeam Backup & Replication, nos referimos a Jobs que como origen tienen un objeto que no es/son una VM en sí. En la definición del job, como “Source”, podemos añadir una a una cada VM que cumpla los requisitos definidos por el Job. Si tu entorno es pequeño, y sobretodo, con pocas modificaciones, es algo planteable, pero si el entorno va evolucionando (que es lo más normal), habrá que empezar a plantear otras maneras, puesto que no vamos a ir añadiendo VMs a los Jobs, sería bastante ineficiente.

En el fondo, para tener un job dinámico bastaría con crear uno solo para toda tu infraestructura que, como “Source”, incluyera todo el vCenter. De esta manera, toda máquina nueva sería incluida directamente en la copia sin necesidad de dar “un paso más” añadiéndola. Sin embargo, catalogar todas las VMs bajo la misma definición no es lo que buscamos tampoco.

Es aquí donde toman relevancia objetos de vCenter que quizás no habías tenido en cuenta antes, como son las etiquetas (o “tags”) y las carpetas. En este whitepaper, Luca Dell’Oca nos sugiere que, una vez definidos los grupos de VMs que hemos visto en el paso 2, cada grupo se mapee a un tag de vCenter y luego, creando un Job para cada grupo, añadir cada etiqueta como “source” del job. Así pues, para nuestro grupo de ejemplo “Producción – Linux”, tendremos que crear su etiqueta en vCenter, etiquetar cada VM que pertenezca a este grupo con ella, y luego crear un Job de Veeam que como Source tenga dicho tag. Además de ser un genial White Paper (recomiendo descargarlo y leerlo detenidamente sobre todo por cómo se detallan los pasos), me parece un método perfecto para entornos heterogéneos, diversificados, (muy) grandes y con muchos usuarios y permisos en vCenter. Sin embargo, quizás vea más acorde a un entorno “standard” de los que tenemos hoy en día por nuestras tierras usar las carpetas de vCenter . La razón es sencilla: al crear una VM, ya sea mediante el wizard tradicional del cliente de vSphere o incluso mediante herramientas de terceros como Chef, nos dejará (de hecho nos “obligará”) especificar en qué carpeta la ubicamos.

Esto hace que no tengamos que dar ese “paso más” de luego ir y etiquetar la VM. Luca habla de maneras muy válidas mediante scripting por ejemplo de automatizar el proceso de etiquetar, pero quizás es demasiado complejo si ya nos sirven las carpetas.

La idea es que no queden máquinas virtuales fuera de copia. Si usamos carpetas, nos aseguramos que siempre nos pregunte en qué carpeta ponemos la VM, pero cabe la posibilidad de que la VM caiga en la carpeta “Discovered Virtual Machines” o en la matriz del Datacenter. Para mitigar este problema, podemos por ejemplo ejectuar un pequeño script que cada dia revise que no queden VMs en carpetas que no estén incluidas en ningún job.


Source: jmgriscom

Retorno de la inversión (ROI) en Devops

design-process-thumb

El calculo de cualquier retorno de inversión se basa en el ahorro esperado. Cuando analizamos el retorno de inversión de implantar prácticas como DevOps, es difícil cuantificar este ahorro en términos monetarios. Hay dos aspectos que nos pueden ayudar a entender los ahorros que obtenemos al implantar DevOps: ahorro de costos en horas de trabajo y ahorro de costos de caídas del sistema.

Por lo que hace al ahorro de coste en las horas de trabajo, podemos clasificar el trabajo de cualquier departamento de TI o desarrollo en dos tipos, trabajos planificados y trabajos no planificados, donde los trabajos planificados son aquellos que están destinados a aportar valor a nuestros clientes, en cambio, los trabajos no planificados son aquellos que se realizan a causa de errores o incidencias que hay de resolver de inmediato. Implantar prácticas de Devops permite reducir el tiempo de trabajo no planificado. Pero cual es el coste del trabajo no planificado?

En el informe anual que publica Puppet “State of Devops Report” del 2016, se plantea la siguiente formula para calcular el exceso de coste que supone el trabajo no planificado.

Cost del exceso de trabajo = Personas * Salario medio * Beneficios * Porcentaje de tiempo dedicado a trabajo extra.

• Número de personas: total de personas del equipo técnico.
• Salario medio: según un artículo de computerworld, que hace referencia a un informe de Addeco, el sueldo medio del sector TIC en España oscila entre los 30.000 y 60.000 euros anuales.
• Beneficios: es el coste de los variables o incentivos que perciben los trabajadores a más a más del sueldo, como tickets restaurant, mutuas, etc.. Podemos estimar un factor de 1.2 sobre el sueldo medio.
• Porcentaje de tiempo de trabajo extra: según el informe de Pupper “State of Devops Report” del 2016, para una empresa media este está entre un 10% y un 32%.

Para poner un ejemplo del coste de trabajo extra o trabajo no planificado realizado, ponemos que tenemos un equipo de 10 personas. El cálculo seria el siguiente:

Coste de exceso de trabajo = 10 * 45.000,00€/año * 1.2 * 22% = 540.000,00€/año * 22% = 118.800,00€/año

A este coste, debemos añadir el coste de las caídas de servicio, coste que varia mucho en función de la naturaleza de la organización y que no es fácil de calcular. Todo y la dificultad de calcular el coste de las caídas, es interesante ver la aproximación que se hace en el informe de Puppet,donde se plantea una formula para estimar el coste de las caídas de servicios.

Coste del “downtime” = Frecuencia de Deploys * Porcentaje de caídas * Tiempo medio de recuperación * Coste por hora de caída

• Frecuencia de deploys o despliegues que se realizan en el entorno de producción y que pueden ser causa de caídas del sistema.
• Porcentaje de caídas producidas por cambios en el sistema.
• Tiempo medio de recuperación o MTTR (Mean Time To Recover) que corresponde al tiempo medio que el equipo de operaciones tarda en recuperar los sistemas ante una caída.
• Coste de por hora de caída. Este dependerá mucho de lo crítico que sea el sistema caído.

Aquí las prácticas de Devops nos ayudan a reducir el tiempo de recuperación de los sistemas ante caídas y a reducir el porcentaje de errores producidos por cambios en el sistema.

Podéis encontrar más información en el informe de Puppet “2016 State of Devops Report”


Source: jmgriscom

Planificando vuestra visita al VMWORLD 2016

vmworld-2016

Se acerca Octubre y con él llega el VMworld europeo de este año. Después del éxito del evento americano que reunió a casi 25000 personas en Las Vegas durante este final de Agosto. Por lo que ha llegado de los asistentes, poquitas novedades significativas se anunciaron y estuvieron muy centradas en OpenStack, containers y Cloud con especial foco en este último con presentaciones como Cloud Foundation i vCloud Availability. Es por eso que se esperan mayores noticias para el evento europeo (no olvidemos la noticia de la compra de EMC por parte de Dell durante el evento del año pasado).

VMworld siempre aporta grandes experiencias en muchos planos. Ver el “state of the Art” de todo lo relacionado con virtualización y Software Defined DataCenter, reencontrar amigos de todos los rincones, los eventos paralelos, los regalos… A todos nos encanta, sin embargo, en mis últimas experiencias siempre acabo con una sensación de que podría haber aprovechado más a nivel técnico ya que la cantidad y sobretodo calidad de las sesiones es altísima. No nos engañaremos, en los días que dura el evento no da tiempo a verlo todo. Es imposible. Pero a más planificación, más probabilidades de ver todo lo que nos propongamos.

Así que si lo que queréis es “actualizaros”, ver en profundidad funcionalidades o productos de o sus Partners, os recomiendo encarecidamente que le deis un vistazo a este enlace. Se trata del catálogo de contenidos de todas las charlas que se realizarán en el VMworld europeo este año. Las plazas para las sesiones son limitadas, así que si teneis claro que queréis asistir a alguna, registraros cuanto antes. Podréis montaros un pequeño calendario de sesiones a las que asistir Además, en breve debería aparecer la app para el VMworld 2016 EU donde podréis realizar lo mismo de manera más cómoda e ir consultándolo in-situ (incluso recibir notificaciones de los eventos a los que estáis suscritos).


Source: jmgriscom

Reclamando espacio en cabinas Thin Provision a nivel de vSphere

Una de las grandes novedades que trajo vSphere 5.0 fueron las APIs de integración con las cabinas para optimizar ciertas tareas, sobretodo aligerando la carga del hipervisor. La idea es pasar esta carga a la cabina, quien tiene más facilidad para operar con los datos que ya residen en ella.

Si tenemos una cabina con configuración compatible con estas APIs, las tenemos habilitadas por defecto por lo que el uso de muchas de sus funcionalidades las usamos de manera transparente. Sin embargo, hay algunas de estas “primitivas” que nos pueden ayudar muchísimo pero hay que conocerlas, puesto que requiere que las invoquemos de alguna manera. Una de ellas es “Unmap”:

“Unmap” resuelve un dolor de cabeza con el que te habrás enfrentado si usas una cabina con Thin Provisioning, que es la reclamación. Thin Provisioning, como toda innovación, aporta muchas ventajas pero también tiene sus consideraciones. Una de ellas es la necesidad de reclamar el espacio inutilizado.

Este espacio se genera cuando el SO de nuestras máquinas virtuales deja de usar una cantidad de almacenamiento que anteriormente usaba. Lo que sucede es que en realidad, el sistema operativo marca este espacio como libre pero no hace lo propio la cabina, quien aún lo mostrará como espacio ocupado en nuestros Disk Groups.
A nivel de vSphere es más sencillo de entender: Supongamos que tenemos una LUN/Datastore de 500GB de capacidad con una VM en ella de 100GB en uso. En ese momento, nuestro Disk Pool en la cabina marcará que tenemos 100GB utilizados. Pero pongamos que, por algún motivo, tenemos que restaurar esa misma VM, en esa misma LUN. Sin problema, podremos mantener las dos VMs y nuestro Datastore marcará un uso de 200GB, hasta que a posteriori, cuando eliminemos la VM original, el uso de nuestro Datastore será 100GB de nuevo. Sin embargo, en nuestro Disk Pool, aparecerán usados 200GB. Tradicionalmente, el procedimiento por el cual recuperábamos esos 100GB que corresponden a la VM original consistía en crear un VMDK “Thick Provisioned – Lazy Zeroed” de un espacio un poco menor que el que marca el Datastore como libre. En nuestro ejemplo, el Datastore marcará 400GB libres por lo que creando un VMDK de ese modo, lo que haremos es marcar todos los bloques que use ese nuevo disco a cero. Una vez realizado, tendremos que decirle a la cabina que reclame espacio en ese Disk Pool. Lo que hará este comando, es buscar bloques a cero que no estén en uso, por lo que podremos recuperar casi la totalidad de los 100GB que ocupaba la VM que hemos ocupado.

Este método conlleva bastantes problemas potenciales más allá de su relativa complejidad:
El paso de crear el VMDK en Eager Zeroed marcará en cero bastantes bloques. Esta operación es bastante pesada para la cabina por lo que podríamos impactar en el rendimiento de otros servicios. Volviendo a las VAAI, otra primitiva que ayuda un montón es “Write Same”. Tradicionalmente, cuando un host ESXi quería marcar a cero bloques (como al crear un disco en Eager Zeroed), lo hacía mandando comandos SCSI a la cabina que lo cargaban en ciclos de procesador y sobretodo, en la cola de la HBA de turno. Con VAAI esta operación la realiza la cabina de manera transparente descargando al host, pero si no es compatible nuestra LUN, querremos tener control con esta operación.
No podemos crear un VMDK del mismo tamaño que el que marca el datastore como libre, pues lo llenaríamos y bloquearíamos las VMs que se ejecutan en él. Igualmente, querremos quedarnos cuanto más cerca posible de ese valor para recuperar cuanto más espacio. La avaricia rompe el saco, cuanto más cerca queramos quedarnos, en más riesgo entraremos.

Todo este procedimiento podemos resumirlo en un simple comando, el comando de esxcli “unmap” (valga la redundancia). Además, nos va a recuperar todo el espacio realmente disponible, pues va iterando en búsqueda de bloques ya no usados y los marca a cero automáticamente. Es importante remarcar que, aunque VMware anuncia que a partir de 5.5 el impacto es mínimo, igualmente vamos a sobrecargar cabina al reclamar, así que mejor hacerlo en horario de mantenimiento.

Visto lo que nos puede aportar “unmap”, veamos cómo podemos invocarlo.

Primero de todo, debemos tener el UUID del datastore anotado. Nos conectaremos por SSH a cualquier ESXi que tenga ese Datastore presentado y, una vez dentro, anotaremos qué UUID tienen las LUNs sobre las que queremos reclamar. Para ello, ejecutaremos el comando
# esxcli storage vmfs extent list.
El output nos dará un listado de los Datastores que ve el host con el nombre que les hayamos dado, y al lado qué UUID tienen las LUNs que lo componen, en la columna “Devices”. Tomamos nota de la que nos interesa y listo.
Antes de nada, tendremos que asegurarnos que nuestro datastore soporta VAAI. Para verlo, # esxcli storage core device vaai status get -d naa.xxxxxxxxxxxxxxxxxxxxxxxxxx. El campo “Delete” debe estar en “Supported”.
En este momento ya lo tenemos todo listo para ejecutar el comando “unmap”. Solo queda por discutir un punto: cuantos bloques vamos a “unmapear” por iteración. Aquí, lo mejor es hablar con el fabricante de vuestra cabina para acordar qué valor le damos. Así que estamos preparados, vamos a ejecutar:
# esxcli storage vmfs unmap –u XXXXXXXX-XXXXXXXX-XXXX-XXXXXXX –n YYY, donde la cadena de Xs será el UUID que anotamos en el paso 1 y las Ys el número de bloques que queremos que reclame por iteración.
Por último, podremos monitorizar el proceso mediante esxtop. Ejecutamos el comando # esxtop en nuestro ESXi, clickamos “u” para ir a la ventana de discos/devices, clickamos “f” y escogemos qué campos queremos mostrar.

fields

Depende de la resolución de vuestra pantalla, seleccionad solo el campo de “Device name”, que nos mostrará los naa de las LUNs y “o” y “p” para ver las métricas de comandos de VAAI. Además, si os cabe, podéis incluir el campo “i” para ir monitorizando también los tiempos de latencia en general (R/W) y poder ir viendo que no tengamos ningún susto.

Entonces, una vez hemos seleccionado los campos que queremos ver en nuestra ventana de esxtop y hemos ejecutado nuestro comando de unmap en una LUN, veremos algo como esto:

extop

Las columnas que nos interesan son:
DELETE: número de comandos de unmap que se han ejecutado sobre la LUN
DELETE_F: número de comandos de unmap que han fallado sobre la LUN
MBDEL/s: MB que está “unmapeando” en este momento el comando que hemos ejecutado. Aquí solo deberías ver distinto de cero la LUN que has seleccionado.

Por último, tendremos que reclamar. Recordad que con unmap estamos liberando bloques, o informando a la cabina de qué bloques ya no están en uso en vSphere. Lo que faltará és que la cabina los reclame y por lo tanto los marque como Free en nuestro Disk Pool. Aquí ya cada una lo hará a su manera. La mayoría tendrán un botón de “Reclaim” que barrerá todo el Disk Pool en búsqueda de los bloques que habremos liberado, y que por lo tanto, pueda marcar como libres. En el caso de Datacore por ejemplo, al ejecutar el comando de unmap, se dispara automáticamente la funcionalidad de “Auto-Reclaim” que lo que hará será ir reclamando los bloques que vamos liberando de manera transparente, unmap lo desencadena todo. Lo veréis así (Storage Source – Online, auto-reclamation in progress):

cabina


Source: jmgriscom

VMmark: benchmarks para nuestro entorno virtualizado

Realizar pruebas de carga sobre nuestra infraestructura para ver sus niveles de respuesta bajo niveles previamente estipulados es un “must”. Tanto en el momento de instalar como para evaluar el nivel de respuesta de la infraestructura ante potenciales cambios. Aún así, puede resultar difícil realizar test realísticos pues hay que o dominar muy bien la aplicación para crear cargas sintéticas, que simulen reales, o disponer de herramientas específicas para cada test de simulación de stress para cada recurso.

Aunque estas opciones sirven para dar ciertos niveles de información con sus métricas, ninguna de ellas está pensada para testear una infraestructura virtualizada orientada a la consolidación de servicios.

Al final, VMmark usa aplicaciones que usamos día a día en nuestros Datacenters. Las agrupa en “tiles”, que son grupos de VMs que ejecutan varios servicios, cada tile con su cliente. Esta unidad precisamente, el tile, nos sirve para medir la capacidad de consolidación de nuestra infraestructura, contabilizando cuantos de ellos podemos ejecutar bajo niveles aceptables de rendimiento. Los servicios que simula cada tile son:

  • VM en Standby

    • Windows Server 2003 32bit, 1 vCPU, 512MB RAM, 4GB disco
  • Mail Server (Exchange 2007)
    • Windows Server 2008 64bit, 4 vCPU, 8GB RAM, 72GB disco
  • Web 2.0 (Olio)
    • Back End: SLES 11 64bit, 2vCPU, 2GB RAM, 14GB disco
    • Front End: SLES 11 64bit, 4vCPU, 6 GB RAM, 80GB disco
  • E-commerce (DVDStore 2)
    • Back End: SLES 11 64bit, 4vCPU, 4GB RAM, 45GB disco
    • 3xFront End: SLES 11 64bit, 2vCPU, 2GB RAM, 10GB disco

Todos ellos con ficheros de configuración perfectamente descritos por las guías de VMware, los clientes para los servicios y sobretodo los scripts de ejecución y reporting, nos darán datos muy exhaustivos, reales y directamente orientados a un entorno virtualizado.

Podéis obtenerlo la herramienta vmmark benchmark aquí.

maxresdefault


Source: jmgriscom

Glosario

Bueno, Agosto va terminando, y con ello las vacaciones.

Por razones personales no he podido hacerlas (espero escaparme algo en un momento), y me he liado con un proyecto que os implica…..   Ya os iré contando. Y pensando un poco, ya que he pensado matar dos pájaros de un tiro sobre una idea que me dio alguien del Blog. ¿Porque no haces un post que sea un glosario técnico y lo vas actualizando?.

Pues bien, aquí os presento la primera version del Glosario técnico informático. Cualquier error o modificación que os parezca pertinente, por favor, mail o comentario y lo corregimos.

Un Saludo

Glosario

Acuerdo de Nivel de Servicio, “Service Level Agreement”, SLA: acuerdo escrito entre un proveedor de servicio y su cliente con objeto de fijar el nivel acordado para la calidad de dicho servicio.

All in one: Literalmente “Todo en uno”. Se refiere a aquellos sistemas en que todos los elementos vienen integrados en un solo sistema.

Almacenamiento conectado en red, “Network Attached Storage”, NAS: Tecnología de almacenamiento dedicada a compartir la capacidad de almacenamiento de un computador (servidor) con computadoras personales o servidores clientes a través de una red (normalmente TCP/IP), haciendo uso de un sistema operativo optimizado para dar acceso con los protocolos CIFS, NFS, FTP o TFTP.

Almacenamiento definido por software, “Software Defined Storage”, SDS:   Concepto evolutivo del almacenamiento de datos para gestionar, mediante políticas, aprovisionamiento y gestión de gestores de datos independientes.

Alta disponibilidad, “High Availability”, HA: Protocolo de diseño del sistema y la implementación asociada que asegura un cierto grado absoluto  de continuidad

“Back-end”: Sistema o capa de acceso a datos, procesándolos desde el “Front-end” o frontal.

Baremetal: Software que se ejecuta directamente sobre el Hardware.

Bloque: Parte particionada de un disco que una SAN ofrece dentro de una LUN.

Burning: Proceso por el cual una pieza nueva que ha estado en su envoltorio es, después de su instalación, puesta en producción “quemando” los barnices que la protegían. También se aplica al proceso de Test.

Caché R/W:  Memoria intermedia que hace de almacenamiento o “buffer” para acelerar los procesos de acceso a datos. Pueden ser de lectura (R) o lectura/escritura (W).

Canal de Fibra, “Fibre Channel”, FC: Tecnología de red utilizada principalmente para redes de almacenamiento, disponible primero a la velocidad de 1 Gbit/s y posteriormente a 2; 4 y 8 Gbit/s.

Canal de Fibra sobre Ethernet, “Fibre Channel Over Ethernet”, FCOE: Tecnología de red de comunicaciones que encapsula las tramas de Fibre Channel sobre redes Ethernet.

Centro de Proceso de Datos, CPD: Sala con sistemas de protección antibandálica y sistemas de climatización y extinción preparadas para alojar los sistemas informáticos de la compañía o compañías.

CIFS: Protocolo de red que permite compartir archivos, impresoras entre nodos de una rede de ordenadores que usan el sistema operativo Windows.

Cloud: Computación la nube. Es un paradigma que permite ofrecer servicios de computación a través de una red que usualmente es Internet.

Cluster: Conjunto de computadores construidos mediante la utilización de hardware común y que se comportan como si fuera un único ordenador.

Código Abierto, “Open – Source”: software distribuido y desarrollado libremente. Se focaliza más en los beneficios prácticos (acceso al código fuente) que en cuestiones éticas o de libertad que tanto se destacan en el software libre.

Computadora Central, “Mainframe”: computadora grande, potente y costosa, usada principalmente por una gran compañía para el procesamiento de una gran cantidad de datos; por ejemplo, para el procesamiento de transacciones bancarias.

Controladora de disco, “Disk controller”:  Subsistema encargado de gestionar los discos de un sistema así como la de control de los datos de Entrada y Salida.

Convergencia de Hardware: Sistemas conformados ya en origen por la asociación de dos o más fabricantes.

Copia de seguridad, “Backup”: Copia de la información de un sistema que se realiza principalmente para ser restaurada en caso de pérdida de datos o en caso de ser requerida con posterioridad.

CPD en Cluster Dividido, “Split Cluster CPD”:  CPD en la que los recursos de computación están repartidos en los dos sites, conformando entre ellos un cluster de Alta Disponibilidad.

Datastore: Unidad de almacenamiento que usa VMware para ubicar las VMs. Detrás de éste puede haber un disco, un recurso NFS o una LUN.

Default: Valores establecidos en un sistema “Por defecto”.

Dirección IP, IP Address, IP: número que identifica, de manera lógica y jerárquica, a una Interfaz en red (elemento de comunicación/conexión) de un dispositivo (computadora, tableta, portátil, smartphone) que utilice el protocolo IP (Internet Protocol), que corresponde al nivel de red del modelo TCP/IP.

Director Ejecutivo o General, “Chief Executive Officer“, CEO: La persona encargada de máxima autoridad dentro de la gestión y dirección administrativa en una organización.

Director de Tecnología e Información, “Chief Information Officer”, CIO: Responsable de toda la TI de la empresa, su estrategia, su mantenimiento y su operación, así como su seguridad, pasiva y activa.

Disco Flash SSD: Discos duro conformados por circuitería y memoria que trabaja a una elevadísima velocidad (al no tener movimiento no tiene rpm) con menos riesgos al no tener partes móviles).

Discos NLSAS: Discos duros de tipo magnético de 7,2k rpm.

Disco SAS: Discos duros de tipo magnético de 10k o 15k rpm.

Discos SATA: Discos duros de tipo magnético de 7,2k rpm.

DPACK o “Dell Performance Analisys Collection Kit”: Herramienta de análisis propiedad de Dell que permite monitorizar el numero de IOPS que consume un sistema, entre otras mediciones.

Driver: “controlador de dispositivo” o “manejador de dispositivo”, es el elemento software utilizado en diversos sistemas operativos.

Dummy: Máquinas o sistemas que han sido creados con el único propósito de “sufrir” las pruebas, sin valor informativo intrínseco.

Enchufar y listo, Plug & Play, P&P: Tecnología o cualquier avance que permite a un dispositivo informático ser conectado a una computadora sin tener que configurar, mediante jumpers o software específico (no controladores) proporcionado por el fabricante, ni proporcionar parámetros a sus controladores. Para que sea posible, el sistema operativo con el que funciona el ordenador debe tener soporte para dicho dispositivo.

“End of life”: Cuando un modelo de ordenador, automóvil, electrodoméstico, deja de ser “soportado” por el fabricante, dejando de fabricar tanto el modelo como sus recambios, el modelo ha llega a su “End of life”.

“Entry level”: Llamados así a los modelos más básicos y económico de cualquier artículo, desarrollado para que sea el “punto de entrada” para luego crecer.

FA: Fuente de Alimentación de un Ordenador, Servidor, etc.

FAS: Modelo de SAN del fabricante NetApp que se caracteriza por el uso primordial del protocolo NFS.

“FAST TRACK”: Carril rápido. En una serie de formaciones, Fast Track se refiere a una que es refundición de todas y aunque más dura, es más corta que las demás.

Fault-tolerance: Propiedad que le permite a un sistema seguir funcionando correctamente en caso de fallo de una o varias de sus componentes.

HyperConvergencia, “Hyperconverged Integrated System”, HCIS: En un entorno hyperconvergente todos los elementos de almacenamiento y computación están optimizados para trabajar junto en un solo elemento de un solo vendedor.

Hyper-V: Hipervisor y Virtualización del fabricante Microsoft.

Hypervisor: Software de ordenador que es capaz de crear y ejecutar máquinas virtuales.

Infraestructura de escritorios virtuales, “Virtual desktop Infraestructure”, VDI: Sistema o plataforma capaz de alojar y proporcionar recursos para el buen funcionamiento de máquinas virtuales con la particularidad de que las VMs son escritorios y van supeditados a un gestor o “Broker”.

Infraestructura Virtual, “Virtual infraestructure”: También denominada “On premise Cloud”. Sistema o plataforma capaz de alojar y proporcionar recursos para el buen funcionamiento de máquinas virtuales.

iSCSI: estándar que permite el uso del protocolo SCSI sobre redes TCP/IP.

Kick-off”: Primera reunión de un proyecto importante donde se explícitan objetivos, responsables, fechas de cumplimiento así como todos los actuantes.

KVM: Hipervisor del fabricante Red Hat.

Lista de Compatibilidad de Hardware, “Hardware Compatibility List, HCL: Lista de Hardware , incluyendo periféricos, etc, que cierto fabricante declara compatibles con cierto Sistema Operativo.

Lista de verificación, “Check-List”: Lista de verificación que se efectúa para que antes de poner en marcha un sistema o dispositivo, el operador esté seguro de que se han efectuado todas las operaciones previas precisas.

Mantenimiento adaptativo: Modifica el sistema en producción para poderlo adecuar o adaptar a nuevas normas de empresa, legales o cambios en la tecnología.

Mantenimiento correctivo: Aquel que corrige los defectos observados en los equipamientos o instalaciones, es la forma más básica de mantenimiento y consiste en localizar averías o defectos y corregirlos o repararlos

Mantenimiento evolutivo: Aquel que instala los nuevos releases o versiones o soluciona algún error menor.

Memory Balooning: Técnica para reclamar memoria en un ordenador usada por un hipervisor para permitir al sistema del host físico para recuperar memoria no usada de cierto Sistema Operativo de una VM y compartir con otras.

Migración “cut in cut off”: Migración planteada con la estrategia “paramos A”, “arrancamos B”.

Migración Smooth: Migración planteada con la estrategia de una forma escalonada i creciente.

Morning storm: Se refiere al colapso que puede sufrir la SAN cualquier mañana cuando todos los escritorios o VDI se ponen en marcha a la vez por los usuarios, requiriendo cantidades ingentes de IOPS de la SAN.

Murphy: Edward Aloysius Murphy, (11 de enero de 1918 – 17 de julio de 1990) fue un ingeniero aeroespacial estadounidense. Murphy trabajó en sistemas de seguridad críticos y es conocido por la homónima Ley de Murphy, que declara que “Si hay varias maneras de hacer una tarea, y uno de estos caminos conduce al desastre, entonces alguien utilizará ese camino”.

Multiprocesamiento simétrico, “Simetric Processing”, SMP: Los sistemas SMP permiten que cualquier procesador trabaje en cualquier tarea sin importar su localización en memoria; con un propicio soporte del sistema operativo, estos sistemas pueden mover fácilmente tareas entre los procesadores para garantizar eficientemente el trabajo.

Nodos: Puntos en redes que confluyen en un mismo lugar. Pueden ser cada ordenador de una red o cada servidor en Internet.

Núcleo, “Core”: Cada uno de los procesadores “lógicos” que alberga el procesador o “Socket” físico.

Objetivo de Punto de recuperación, “Recovery Point Objective”, RPO: Punto definido por el Plan de continuidad de negocio. Es el máximo período de tiempo que es asumible una pérdida de datos.

Objetivo de Tiempo de Recuperación, “Recovery Time Objective”, RTO:  tiempo definido dentro del nivel de servicio en el que un proceso de negocio debe ser recuperado después de un desastre o pérdida para así evitar consecuencias debido a la ruptura de continuidad de servicio.

Obligatorio, “Mandatory”: De obligado cumplimiento.

Obsolescencia programada, “Planned obsolescence”: Programación del fin de la vida útil de un producto.

Operaciones de Entrada Salida por segundo, IOPS: unidad de benchmark usada para medir el rendimiento de dispositivos de almacenamiento informáticos como unidades de disco duro (HDD), unidades de estado sólido (SSD) y acceso a almacenamiento en red (NAS).

Pasillos fríos y calientes: Técnica en los CPD para que con unos cierres semi estancos los ordenadores reciban por delante, de un pasillo frio, aire acondicionado, siendo este expulsado por detrás una vez utilizado y calentado a un pasillo caliente que disipara el calor.

Placa madre, “Mother Board”: La placa base, también conocida como placa madre o placa principal (motherboard o mainboard en inglés), es una tarjeta de circuito impreso a la que se conectan los componentes que constituyen la computadora.

Planificador de Capacidad, “Capacity Planner”: Herramienta en Cloud de VMware capaz de dimensionar una granja física ofreciendo un report de volumetrías.

Procesador: Ver CPU.

Proxmox: Virtualizacion Open Source.

Punto único de fallo, “Single Point of Failure”, S.P.O.F. Para garantizar la inexistencia de un SPOF en un sistema, todos sus componentes suelen ser redundados, conformando así un sistema de alta disponibilidad, que garantiza el correcto funcionamiento aún en caso de que alguno de sus componentes falle.

Recuperación de desastres, “Disaster recovery Plan”, DR: Proceso de recuperación que cubre los datos, el hardware y el software crítico, para que un negocio pueda comenzar de nuevo sus operaciones en caso de un desastre natural o causado por humanos.

Rollback: operación que devuelve a la base de datos o sistema a algún estado previo.

Sistemas de archivo en red,“Network File System”, NFS: protocolo para compartición de archivos, creado por Sun Microsystems para SunOS en 1984. Se caracteriza por compartir carpetas.

Red de Area de Almacenamiento, “Storage Area Network”, SAN: Una SAN es una red dedicada al almacenamiento que está conectada a las redes de comunicación de una compañía. Además de contar con interfaces de red tradicionales, los equipos con acceso a la SAN tienen una interfaz de red específica que se conecta a la SAN.

StoragevMotion: Componente de VMware vSphere que permite la migración en vivo de una VM en ejecución de sus ficheros, de un datastore a otro.

Support & Subscription: Es la quota que se abona al fabricante por concepto de “mantenimiento”, el primer concepto se refiere a que el fabricante dará soporte para que funcione el sistema, el segundo, que el cliente mantiene la capacidad de instalar siempre la última versión del sistema sin coste.

Sistema Operativo, “Operating System”, O.S., S.O.: Programa o conjunto de programas de un sistema informático que gestiona los recursos de hardware y provee servicios a los programas de aplicación de software.

Tarjeta de Red, “Network Card”, Nic:  es la periferia que actúa de interfaz de conexión entre aparatos o dispositivos, y también posibilita compartir recursos (discos duros, impresoras, etcétera) entre dos o más computadoras, es decir, en una red de computadoras.

Tecnología de la Información, “Information Technology”, TI, IT: Concepto que abarca lo otrora llamada “Informática”, con hincapié en su parte crítica en el negocio y su valor en la cadena de la empresa u organización.

Test de Carga: Valida y verifica atributos de la calidad del sistema, tales como la escalabilidad, fiabilidad y uso de los recursos.

Test de tolerancia fallos: Validan todos los elementos redundados que se han incluido en el diseño para evitar los S.P.O.F.

Throughput: es definido como la velocidad real de transporte de datos a través de una red telemática, el cual normalmente se mide en Mbit/s y siempre será inferior al ancho de banda o bandwidth.

UCS: Model de servidor de Cisco.

Unidad de Procesamiento Central, “Central Process Unit”, CPU: Subsistema de un ordenador que interpreta las instrucciones de un programa informático mediante la realización de las operaciones básicas aritméticas, lógicas y de entrada/salida del sistema.

Update: Supone un a nueva versión en la reléase, significando una “major” o “standalone” significando hallarse en una nueva versión.

Upgrade: Supone una subida en la versión de la reléase, pero continúa estando en la misma versión.

vApp: Permite a diferentes VMs trabajar como una sola máquina trabajando juntas en un stack.

Versión, Release: número o nombre que se asigna a un programa informático para mencionar su nivel de desarrollo y su actualización. Lo habitual es que el versionado esté dado por dos números, separados por un punto.

vCPU: También conocido como procesador virtual, es una unidad de procesamiento central física que ha sido asignada a una VM.

Virtualización: Creación a través de software de una versión virtual de algún recurso tecnológico, como puede ser una plataforma de hardware, un sistema operativo, un dispositivo de almacenamiento u otros recursos de red.

VM: software que simula a una computadora y puede ejecutar programas como si fuese una computadora real. Este software en un principio fue definido como “un duplicado eficiente y aislado de una máquina física”. La acepción del término actualmente incluye a máquinas virtuales que no tienen ninguna equivalencia directa con ningún hardware real.

vMotion: Permite la migración “en vivo” de una maquina virtual en ejecución desde un host físico a otro, sin caída de servicio.

 

Take care


Source: jmgriscom