Articles - Serveurs

Dell PowerEdge T440

  |   432  |   Commentaires (3)  |  Serveurs
Article secondaire : Dell PowerEdge T440 : Tensions + pâte thermique + dumps
Article comportant des images en grand format !
Voici une machine qui réclame un peu d'entretien, un ancien serveur de 14ème génération (2017-2021) format tour.

Lorsqu'on cherche un serveur PowerEdge récent d'occasion il y a une chose importante à vérifier c'est la version de l'iDRAC (IPMI) qui est installée. Le plus intéressant étant d'avoir la version Enterprise. Elle donne accès à la fonctionnalité KVM (console virtuelle) et au Virtual Media au travers le navigateur, des fonctionnalités quasi-indispensables pour pouvoir vraiment tout faire (et dépanner) à distance. On peut le savoir si on connaît le Service Tag ou l'Express Service Tag (info à demander au vendeur). La partie support du site Dell propose d'afficher tout sur la configuration originale d'une machine par le numéro de série. Même si on trouve sur eBay des licences pirates pas trop chères pour upgrader :)

Réception / Premier démarrage


Un peu de poussière.

Tout démarre correctement (boot sur USB).

Ici 2 disques sur les 7 sont hors service. Il y a 2x300Go en RAID1 et 5x900Go en RAID5.

C'était visible sur les photos de l'annonce que deux étaient KO.

Tous les deux des AL14SXB900EN (gamme AL14SXB) de Toshiba, l'un fait le traditionnel clac clac clac... et l'autre fonctionne mais est toujours allumé en orange. Un petit tour dans l'interface de diagnostic indique qu'il est en PFA (Predictive Failure Analysis).

Pour autant tout fonctionne, même le Windows Serveur 2016 laissé dessus (le sticker licence est collé derrière). Pas de surprise, la machine est d'origine.


Comportement sur Linux et état SMART (passer le HDD en mode Non-RAID) :
hdd1 hdd2 hdd3

Usage / Consommation


Inutile de dire qu'avec des disques au format 2.5" 15K, le but de cette variante de châssis n'est pas de faire un NAS pour particulier. C'est donc un serveur soit pour de la production pure ou alors à allumer que pour jouer avec (à la demande). Pour un usage NAS il y a nettement plus efficient, moins bruyant et avec des disques 3.5" nettement moins chers. :lol D'ailleurs niveau consommation :
  • 9-10W à l'arrêt (BMC/iDRAC)
  • 90-100W allumé, en idle
  • 165-170W allumé, CPU à fond (stress Linux sur tous les cœurs) avec les 7 HDD installés


Démontage et nettoyage


Voici un châssis serveur complètement à poil, images rares d'un PowerEdge aussi vidé.





Le fond de panier des alimentations redondantes qui recueille et combine le 12V des alimentations.


Les composants de la partie iDRAC sur la carte mère (U-Boot, DRAM, SoC/BMC et eMMC).

Le SoC/BMC Nuvoton NPCM750D.


La puce CPLD (FPGA pour de vrai).

2 barrettes de 32Go du coréen SK Hynix.

Les 2 alimentations 495W type 0VKDD2 de chez Astec/Artesyn. Elles sont très efficientes (80Plus Platinum) et les versions plus puissantes (750W et plus) sont souvent recyclées pour les fermes de minage, Des fonds de panier spécifiques (Breakout Board) existent.



Détails :
  • Fusible : 16A 230V
  • Filtrage EFI/EMI : bobines + Y2 + X2
  • MOV : TVR447
  • NTC : TKS PPL16500 / PI500
  • Relais : HF32F/012-HLQ3
  • Pont redresseur : US30KB80R / U30K80R
  • Condensateurs primaire : Elite 180uF 450V KO(M) 105°C *2
  • IC puissance PFC / Boost : Toshiba K16N60W (TH) + Cree C3D04065 (TH) + Diodes S8KC (SMD)
  • Gestion primaire : Microchip PIC24F16KL401 + Infineon ICE3PCS02 + BJY3 TSSOP16
  • Hachage : Infineon IPL60R199CP *2
  • Gestion secondaire / Superviseur : Microchip dsPIC33FJ64GS606
  • Redressement secondaire : OnSemi NTMFS5C612NL *3
  • Condensateurs secondaire : Elite GS 1800uF 16V *3
  • Commutation finale ON/OFF 12V : Nexperia PSMN1R2-30YLC *2
  • Ventilateur : AVC DBTD0428B2F 40x40x28mm - extraction

Coté CPU : remplacement de la pâte thermique toute sèche par de la neuve.


Tout propre.


Tests




MAJ des firmwares


Plusieurs méthodes possibles, soit directement via des binaires depuis Linux ou Windows, soit via Lifecycle Controller et une clé USB/CarteSD, soit via l'iDrac à distance.



Même les alimentations en ont un.

Configuration et reset iDrac


Une petite adresse IPv4 fixe temporaire.

Le mot de passe iDrac n'est plus celui d'origine (root/calvin). Un petit tour dans le BIOS pour remettre à zéro tous les réglages.

Et on peut enfin entrer.

Réduire au silence



Les HDD



Si on veut du silence parfait, les disques durs mécaniques SAS sont à remplacer par des SSD. Pas de miracle, les plateaux et les têtes ça fait du bruit. Éventuellement mettre des HDD SATA grand public de 7200 tours/min à la place.

Les ventilateurs



Liens : https://www.pickysysadmin.ca/2019/03/10/silencing-my-dell-t340/

Contrairement à un PC usuel desktop, un serveur comme celui-ci fonctionne à l'envers. Le PC desktop est conçu pour être silencieux par défaut et augmente la vitesse selon la chaleur CPU (via courbe configurée via BIOS ou logiciel sur du moderne). Sur une machine destinée à être dans un local technique, par défaut tous les ventilateurs sont à fond et une fois que toutes les conditions sont réunies (après vérification) alors éventuellement elle va devenir plus silencieuse. Ces conditions sont dans les firmwares (CPLD / BIOS / iDRAC) définies par le fabriquant. Selon les composants installés et détectés (modèles de CPU et les cartes), Dell va programmer des vitesses différentes. Un serveur silencieux peut se voir transformer en réacteur d'avion juste par l'ajout d'une carte sur un port PCI-E. L'élément le plus bruyant est l'unique ventilateur de la partie HDD/CPU/RAM qui fonctionne en extraction.

Ce Sunon 120x38 est certes très robuste mais est d'un autre age. Malgré sa conversion au PWM sa référence (PSD1212PMB1) existe depuis au moins 2002 selon ce datasheet. Avant j'ai quand même vérifié à l'oscilloscope le brochage. Dell sont les champions des connecteurs propriétaires où ils inversent des broches par rapport au standard, ça s'est déjà vu par le passé. Après contrôle Il s'agit d'un connecteur normal, aucune bidouille nécessaire.

Le Sunon a été remplacé par un Noctua NF-P12 redux-1700 PWM. Ceux qui veulent être plus tranquilles sur les températures peuvent se tourner vers la gamme industrialPPC.

Évidemment le flux d'air n'est pas le même et n'est pas sans conséquence sur les températures des composants donc à surveiller. Remplacer les ventilateurs par des modèles tiers peut s’avérer problématique logiciellement, car tout est supervisé, les valeurs de consigne et de rotation ne correspondent plus. Les serveurs n'aiment pas trop les bidouillages et par conséquent, le serveur peut remonter des erreurs comme quoi les ventilateurs sont "hors plage" par rapport aux modèles d'origine installés en usine. Les seules solutions serait d'arriver à trafiquer les firmware ou alors de gruger les signaux de retour par un générateur PWM via Arduino par exemple mais c'est moche. Le Noctua tourne plus lentement que le Sunon mais l'iDrac ne fait pas remonter d'erreur pour autant. Un petit stress de quelques minutes ne montre aucun emballement, les cœurs sont en dessous des 50°C à 2.4Ghz, donc je suis confiant pour mon simple usage occasionnel.

Load Average de 24 pour 24 threads tout est OK.