Höhere Effizienz schon auf Systemebene

02 September 2021

Was man am Anfang richtig macht, muss man am Ende nicht korrigieren. Leistungsfähige Server auch auf einen vernünftigen Ressourcenverbrauch auszurichten, ist daher ein sinnvoller Ansatz.Rong Shen, Vice President und General Manager der Server-Linie von Inspur, erklärt im LANline-Gespräch die Herangehensweise seines Unternehmens bei den M6-Servern.

LANline: Neue Server mit neuer Leistung– das klingt eher nach Marktroutine als nach einer Sensation. Was ist das Besondere an den M6-Servern?

Shen: Es mag zwar nach Marktroutine klingen, da jeder Server-Anbieter versucht, mit Intels Einführung der neuen Plattform Schritt zu halten. Aber unsere M6-Server bieten definitiv mehr als das. Die M6-Server durchbrechen deutlich die Grenzen des Speicherplatzlimits von Server-Knoten, erhöhen die Rechen- und Speicherdichte sowie die E/A-Erweiterungsfähigkeit, verbessern die Benutzerfreundlichkeit und stärken die Daten- und Systemsicherheit. Gleichzeitig leisten sie einen Beitrag zur Open Compute Community. All dies wurde durch die Anwendung unserer vier Designphilosophien erreicht: Innovationen, Präzisions technik, Sicherheit und Offenheit.LANline: Können Sie präzisieren, wie diese Innovationen aussehen? Shen: Wir verfolgen das Ziel, die Platzbegrenzungen von Servern zu überwinden,um die Dichte von Rechen-, Speicher- und E/A-Erweiterungen zu erhöhen und gleichzeitig die Systembalance zu erhalten. DerInspur NF5468M6 unterstützt zum Beispiel acht Trainings- oder 20 Inferenzkarten für alle Arten von KI-Nutzung und bietet eine Soft-Key-Umschaltung zwischen drei Topologien für das Training, nämlich Balance, Common und Kaskade. In Bezug auf die Leistung liefert er bis zu 5 PFLOPS für das Training und 10 POPS für die Inferenz. Das Modell NF5180M6 unterstützt32 E1.S Ruler-SSDs mit NVMeOF-Funktion, die die Speicherdichte um das Dreifache und die IOPS um das 3,2-fache erhö-hen, was gleichzeitiges Rechnen und Hochgeschwindigkeits-Speicher-Sharing mit anderen Server-Knoten ermöglicht. Und der NF5280M6 bietet besonders gute E/A-Er weiterungsmöglichkeiten in einem 2HE Formfaktor, mit 40 Prozent Steigerung gegenüber der Vorgängergeneration. Also insgesamt eine ganze Menge an Neuheiten.

LANline: Sie nannten den Begriff Präzisionstechnik. Was meinen Sie damit?

Shen: Es geht in diesem Fall darum, die Energieeffizienz, den Betrieb und die Wartung, im Jargon Operation and Maintenance genannt, im Design auf Systemebe ne zu optimieren, um eine höhere Energieeffizienz, verbesserte Benutzerfreundlichkeit und Intelligenz auf Systemebene zu erreichen. Konkret bedeutet dies zum Beispiel, dass durch die Einführung von Funktionen zur Umgebungserfassung und Luftdrucküberwachung ein optimales Gleichgewicht zwischen Wärmeableitung und Vibration auf Systemebene entsteht, was eine besonders hohe Rechenleistungen in einem 1HE-Formfaktor und eine über zehnProzent höhere Festplattenleistung ermöglicht.

LANline: Das Thema Sicherheit stand offenbar ebenfalls weit oben auf der Prioritä-tenliste.

Shen: Das ist richtig. Da Sicherheitsaspekte immer mehr an Bedeutung gewinnen,entwickeln wir ständig neue Möglichkeiten, die Sicherheit auf Hardware-, Firmware- und Systemebene zu optimieren. Inunserer M6-Produktfamilie haben wirzehn Sicherheitsdesigns eingeführt, umeine sichere Umgebung zu ermöglichen.Dazu gehören unter anderem die Implementierung einer dualen BMC- und BIOSChip-Lösung, um den Ausfall von Remote-Firmware-Updates weitestgehend zuvermeiden. Außerdem gibt es Health Checks für den internen Speicher beim Einschalten mit der intelligenten PPRTechnologie, die die Speicherausfallrate um 60 Prozent reduziert und die Systemstabilität um das Zweifache erhöht.

LANline: Wie sieht Ihr Engagement in der Open Compute Community aus?

Shen: Als Platin-Mitglied von drei OpenCompute Communities mit Beiträgen gemäß der OCP-, ODCC- und Open19-Standards engagiert sich Inspur für die Entwicklung eines robusten Open-Compute-Ökosystems und steuert Technologien bei.Die M6-Server-Familie umfasst Schlüsselprodukte, die im Einklang mit Open-Compute-Standards entstanden, wie das ORS6000S-Rack, NF5180M6 und NF5280M6. Alle Produkte bieten offene Softwareprotokolle wie OpenBMC und Redfish sowie eine Vielzahl von offenen Standardkomponenten wie OCP3.0-Netzwerk und E1.S-Speicher.

LANline: Können Sie besonders geeignete Einsatzgebiete nennen?

Shen: Die M6-Server-Familie umfasst insgesamt sechs Produktreihen und 16 Produkte, die für rechenintensive Anwendungen wie künstliche Intelligenz, Big Data,Cloud Computing und andere intelligente Computing-Szenarien entwickelt wurden.Unsere Rackmount-Server sind in der Lage, die Anforderungen nahezu aller Szenarien zu erfüllen, einschließlich Cloud Computing, Virtualisierung, Datenbank und Datenanalyse oder Büroanwendungen. Die Mission-Critical-Server werden zum Beispiel in Transaktionsdatenbanken,Speicherdatenbanken, ERP-Anwendungen sowie Anwendungen für Ausfallsicherheiund Load Balancing eingesetzt. Die Storage-Server kommen in Warm-/Kaltdatenspeichern, Videoüberwachungsspeichern,Big-Data-Speicheranwendungen und IPFS-Systemen zum Einsatz. Die HighDensity-Server sind für Public Cloud, Private Cloud und Big-Data-Szenarien konzipiert. Und abschließend finden KI-Servereine breite Anwendung in den Szenarien Bild- und Video- sowie natürliche Sprachverarbeitung, Smart Cities, 5G-Kommunikation und etwa bei der Finanzanalyse. DieRack-Scale-Server eignen sich gut für den Einsatz in großen Rechenzentren.

LANline: Daran schließt die nächste Frage an. Spielt auch die Einsatzumgebung eine Rolle, etwa bei der Verwendung in EdgeRechenzentren?

Shen: Traditionelle Rechenzentren sind definitiv eine der wichtigsten Einsatzumgebungen für unsere M6-Serie. Wir haben spezielle Designs für die Wärmeableitung und das Front-I/O-Design in dieser Generation, die den Stromverbrauch senken und die Systemstabilität verbessern können. Zum Beispiel passt der NF5260M6 flexibel in ein konventionelles Rechenzentrum mit Kalt-/Warmgang-Einhausung. Er hat aber auch einen Front-I/O-Zugang, der in ein kommerzielles Gebäude passt, das weniger eine vollständig kontrollierte Umgebung auf Rechenzentrumsebene ist. Wir sind uns aber auch des Trends zum Edge Computing – oder allgemein eines Standorts mit niedriger Latenz – bewusst, an dem unsere Kunden ihre Rechenleistung ausweiten. Eine Herausforderung fürEdge-Rechenzentren ist die Bedrohung durch die natürlichen Umgebungsbedingungen. Wir wissen, dass viele Edge-Rechenzentren in abgelegenen Gebieten gebaut werden, in denen die Wartung und Instandhaltung vor Ort eine Herausforderung darstellen. Die M6-Serie verfügt über eine M9-Erdbebensicherheit. Dies entspricht dem NEBS-Standard aus der Telekommunikation, und die Rechner sind daher in derLage, in einer rauen Umgebung konstante Leistung zu bringen. Dennoch sind EdgeComputing-Szenarien kompliziert. Dies erfordert sicher, dass wir uns mehr auf die Kundenbedürfnisse konzentrieren und weitere Funktionen in unseren Systemenentwickeln.

LANline: Welchen Stellenwert nehmen der Stromverbrauch und die Kühloptionen ein?

Shen: Beide gehören immer zu den wichtigsten Themen in einem Rechenzentrum,und diese beiden Aspekte sind eng miteinander verbunden. Der jährliche Stromverbrauch aller Rechenzentren rund um den Globus beträgt etwa 300 Milliarden kWh, was der gesamten Stromerzeugung von 30 Kernkraftwerken entspricht. Innerhalb dieses riesigen Stromverbrauchs werden etwa 38 Prozent für die Luftkühlung verwendet,also über 110 Milliarden kWh. Daher arbeitet bekanntlich die gesamte Branche daran, den Power-Usage-Effectiveness-Wertzu senken und sicherzustellen, dass jedes verwendete Watt Energie auch Rechenleistung erzeugt. Am zweitwichtigsten ist der Fokus auf Umweltfreundlichkeit und Energieeinsparung, aber gleichzeitig sollen Leistung und Haltbarkeit nicht beeinträchtigt werden.

LANline: Welche Konsequenzen ziehen Sie für Ihre Produkte daraus?

Shen: Um das Problem zu lösen, haben wir bei unseren neuen M6-Servern den Honeycomb-Hohlleiter als neuen Standard für die Wärmeableitung eingesetzt. Damit önnen die neuen M6-Server in einer Umgebung mit einer um 2 °C höheren Umgebungstemperatur laufen, wodurch sich biszu acht Prozent an Energiekosten für die Luftkühlung sparen lassen. Das Honeycomb-Design gibt unseren Systemen zudem die Möglichkeit, die Rotationsgeschwindigkeit der Lüfter zu verlangsamen,wodurch die Rotationsvibrationen um rund zehn Prozent sinken, was dem ein zuverlässigeres System schafft. Neben der Optimierung der Luftkühlung hat Inspur auch den flüssigkeitsgekühlten Knoten i24LM6 vorgestellt, der für Rechenzentren mit hoher Dichte und HPC optimiert ist. Darauf basierend haben wir die Luft-/Flüssigkeitskühlungs-Mix-CDU-Lösung auf den Markt gebracht, die den schnellen Einsatzder Flüssigkeitskühlung ohne Aufrüstung der bestehenden Anlagen ermöglicht.

LANline: Wie beurteilen Sie im grundsätzlich die Preisentwicklungen im ServerMarkt und insbesondere im High-End-Bereich?

Shen: Mit komplizierteren Computing-Anforderungen und dem explosiven Datenwachstum suchen Kunden nach leistungsfähigeren Server-Systemen, was bedeutet, dass auch die Ausgaben steigen. So wird zum Beispiel die Einführung von NVMe den Preis für diese High-End-Server in die Höhe treiben. Wir sind überzeugt, dass der Gesamttrend der Server-Preise mit der Einführung fortschrittlicherer Technologien kontinuierlich steigen wird. Aber wenn man sich den Trend der Leistung pro Dollar ansieht, sinkt der Preistrend für Server tatsächlich im Lauf der Zeit. Der allgemeine Leistungsanstieg unserer M5-Server-Produktfamilie zu unserer neuesten M6-Generation beträgt über 40 Prozent, was viel mehr ist als der Preisanstieg.

LANline: Herr Shen, vielen Dank für das Gespräch. Dr. Jörg Schröper