Aujourd'hui un problème incohérent et presque incompréhensible:
Sur un serveur, je n'arrivais pas à me connecter aux sites de Microsoft:
- tous les autres sites marches dans IE
- la résolution NSLOOKUP fonctionne
- le ping sur sur le nom DNS ne résout pas
- le ping de l'adresse IP ne répond pas
- le tracert de l'adresse IP n'aboutit pas
Pas mal de temps perdu à chercher une explication et une résolution jusqu'à ce que je tombe sur cette page, le problème semble lié à un malware.
Voici la résolution:
- arrêter le service "DNS client"
- mettre le service "Event Log" en automatique et démarré
- mettre le service "Background Intelligent Transfert" en manuel et démarré
- mettre le service "Automatic Updates" ou "Mise à jour automatiques" en automatique et démarré
- lancer un coup de Windows Update et installer les correctifs
- après un redémarrage tous doit être revenu à la normale.
http://social.microsoft.com/Forums/en-US/msrnetworking/thread/b7d61e34-a7c0-474d-a190-c3e62105bd35
Pour défaut les ESX ont un Service Console de 272 Mo (jusqu'à 800 Mo), quand la mémoire du Service Console commence à manquer les messages "Memory Checker" apparaissent dans les fichiers hostdlog (dans /var/log/vmware).
Ce manque de mémoire peuvent venir d'un produit tiers installer dans le Service Console ou un grand nombre de ressource à gérer (host/vm). Ce problème se caractérise visuellement par des déconnections intermittentes du vCenter ou un arret du service Hostd sur un ESX.
Comme il est dit dans la KB 1002713 de VMware, il faut augmenter la mémoire du Service Console (800 Mo étant la valeur max). Cette opération nécessite d'avoir au préalable bien dimensionner les partitions et surtout un reboot pour que la modification soit prise en compte.
[2009-09-18 09:43:24.241 'Memory checker' 78818224 warning] Current value 164768 exceeds soft limit 122880.
En revanche, ce que ne précise pas la KB, c'est qu'en plus il faut modifier les seuils d'alerte. Sinon passé le premier seuil on a toujours des warnings dans le fichier hostd.log et passé le second les services hostd & vpxa s'arrêtent.
Pour cela éditer le fichier /etc/vmware/hostd/config.xml et ajouter les lignes suivantes en fonction des nouveau seuils que vous voulez (ici un exemple de seuil pour un Service Console à 512 Mo) dans la partie <config>:
<hostdWarnMemInMB>375</hostdWarnMemInMB>
<hostdStopMemInMB>465</hostdStopMemInMB>
Ensuite, redémarrer le service hostd avec la commande service "mgmt-vmware restart" pour prendre en compte les modification.
Les VMs en Debian sont officiellement supportés depuis vSphere, mais la mise à jour des VMwareTools ne reste pas si simple que dans une RedHat. Il faut d'abord supprimer les précédents VMwareTools et les modules chargées avant de lancer l'installation.
Voici les commandes pour la mise à jour des VMwareTools (ESX4.0 update1) d'une Debian 5 32bits:
dpkg --purge vmwaretools
rm -rf /etc/vmware-tools/
rm -f /lib/modules/2.6.26-2-686/misc/vm*
reboot
Après le redémarrage de la VM, lancer l'installation des VMware Tools
mount /media/cdrom0
cp /media/cdrom0/VMwareTools-4.0.0-208167.tar.gz .
tar -zxvf VMwareTools-4.0.0-208167.tar.gz
cd vmware-tools-distrib
./vmware-install.pl
vmware-config-tools.pl
Il ne reste plus qu'à répondre aux questions (normalement les valeurs par défaut) et redémarrer la VM pour que le status des VMware Tools des VMs Debian passe de "Out of Date" à "OK".
Il m'est déjà arriver plusieurs fois que le CPU0 (celui du Service Console) d'un ESX sature à 100%.
En regarde plus en détail avec top, on constate que c'est le processus ftPerl qui sature le Service Console.
Ce problème existe sur des ESX en 3.0 et en 3.5 jusqu'à l'update 4 (peut être résolu depuis), il est lié un problème dans la configuration du Cluster.
Résolution:
- le plus simple mais seulement temporaire, faire un "Reconfigure HA" sur cette ESX. Résolution temporaire car le problème reviendra plus tard.
- la solution permanente est de créer un nouveau et de migrer les VMs et les ESX dans ce nouveau Cluster et supprimer l'ancien. Une KB existe chez VMware expliquant la recréation de Cluster.
Référence:
En essayant de sauvegarder juste le disque système (scsi0:0) d'une VM avec Veeam Backup 4, j'ai eu un message d'erreur surprenant:
File <unspecified filename> is larger than the maximum size supported by datastore '<unspecified datastore>
Le disque système ne fait que 15 Go dans un VMFS de 500 Go (avec plus de 300 Go de libre). En plus du disque système j'ai un disque RDM (virtual) de 2 To.
Je pensais que le problème venait de la partie sélection de disque dans le Job de sauvegarde. Mais le problème est ailleurs, en effet un simple Snapshot sur la VM produit la même erreur. Ce problème affecte les Snapshots et donc potentiellement tous les produits de sauvegarde.
L'explication:
vSphere a changé la manière dont sont gérer les Snapshots (et notamment les pré-requis). Le block-size du volume de destination du Snapshot est comparé avec la taille de disques de la VM. Dans mon cas, le block-size du VMFS de destination du Snapshot est de 2 Mo soit une taille maximum de 512 Go alors que mon RDM fait 2 To.
Cf. la KB 1012384 de VMware
Résolution:
- Soit mettre le disque RDM en mode Indepent, mais il ne pourra pas être sauvegardé.
- Soit déplacer (avec SVmotion) toutes les VMs de ce VMFS, le supprimer, le recréer avec un block-size supérieur, enfin faire revenir toutes les VMs sur le VMFS.