Der interne Benchmark von OSL Storage Cluster zur Bestimmung der Integer-Performance

Aktuelles Thema: Der RIP-Benchmark im OSL Storage Cluster

Bereits seit der Version 2.1 ist OSL Storage Cluster in der Lage, bei der Migration von Applikationen zwischen verschiedenen Rechnern die Auslastung der Rechner zu berücksichtigen. Diese Fähigkeiten haben in der Version 3.0 eine erhebliche Erweiterung erfahren, so dass mittlerweile ein leistungsfähiges aber einfach zu bedienendes Framework zum ressourcenbasierten Selbstmanagement eines Rechnerverbundes vorliegt.

Vor allem für betriebswirtschaftliche Anwendungen und Datenbanken spielt die Integer-Performance eines Systems eine entscheidende Rolle. OSL Storage Cluster stützt seine Managementfunktionen in diesem Zusammenhang auf einen eigenen Benchmark, um auch in Clustern mit heterogenen CPU-Implementierungen zu brauchbaren Aussagen zu kommen. Der Administrator ordnet nach diesem System Anwendungen einfach einen hardwareabstrakten Bedarf an Integer-Performance zu; OSL Storage Cluster identifiziert entsprechende Systeme mit ausreichend freien CPU-Ressourcen. Diese hardwareabstrakte Größe zur Beurteilung der Rechenleistung für Ganzzahl-Operationen nennen wir "Relative Integer Performance" - RIP.

Der Benchmark im Detail

Die meisten existierenden Benchmarks sind eine Mischung aus verschiedensten Lastprofilen. Im günstigsten Fall erlaubt dies Rückschlüsse auf die Performance von Anwendungen mit ähnlichen Lastanforderungen. Oft werden allerdings auch unerwünschte Größen miterfasst (etwa Float- oder IO-Anteile in einem Integer-Benchmark) oder es ist schwer zu ermitteln, welche Faktoren zu einem guten bzw. schlechten Ergebnis beitragen.

Der RIP-Benchmark ist daraufhin ausgelegt worden, eine möglichst unverfälschte Aussage zur Performance eines Systems bei bestimmten Integeroperationen zu erhalten. Dabei spielen die Leistungsfähigkeit der CPU, der Speicheranbindung und die Multitasking-Fähigkeiten des Systems eine Rolle. Der Benchmark liefert sowohl Werte für die Geschwindigkeit eines einzelnen Prozesses/Threads als auch für die parallele Ausführung. Dabei ist er so gestaltet, dass sich bei paralleler Ausführung ein deutliches Maximum bei der optimalen Parallelität ergibt. Der RIP-Benchmark enthält ausschließlich Integeroperationen und Anweisungen zur Speicherverwaltung. Disk-IO-Anteile sind ausgeschlossen, der Zugriff auf den Hauptspeicher hat im Vergleich zu Caches (1st/2nd-level) einen stärkeren Einfluß, der Einfluß anderer Programme und des OS-Schedulers wird minimiert.

Da Integeroperationen üblicherweise 32Bit-Datentypen betreffen, in modernen Anwendungen aber auch zunehmend 64 Bit breite Integertypen verwendet werden, liefert der Benchmark für beide Typen entsprechende Werte. Je nach verwendetem Datentyp lassen sich damit gut vergleichbare Aussagen über die Leistungsfähigkeit eines Systems bei Operationen mit dem jeweiligen klar definierten Datentyp gewinnen und brauchbare Prognosen für die Performance entsprechender Programme erstellen.
Etliche Anwendungen arbeiten ausschließlich mit 32Bit-Integertypen, eine zunehmende Zahl verwendet daneben auch long bzw. long long Datentypen mit 64 Bit. Eine ausschließliche Verwendung von 64Bit-Integern ist bei Applikationen jedoch die absolute Ausnahme. Um dennoch eine brauchbare Aussage für Anwendungen mit gemischten Typen zu gewinnen, wird neben den gemessen Werten ein abgeleiteter Wert errechnet: RIPmix. Er ist das geometrische Mittel der jeweiligen Meßwerte und umso besser, je dichter 32Bit- und 64Bit-Performance beieinander liegen.
Die Messwerte werden in einen Bezug zu einem Vergleichswert gesetzt und sind damit dimensionslos. Ein Wert von 1 entspricht der angenommenen 32Bit-Integerperformance eines Intel Pentium mit 100MHz Taktung. Für den 64Bit-Benchmark ist der Wert dann gleich groß, wenn die 64Bit-Operationen mit derselben Geschwindigkeit ausgeführt werden, wie die 32Bit-Operationen. Für ein komplett in 32Bit-Technik ausgelegtes System bedeutet das in der Regel die halbe Performance für die 64Bit-Typen (long long).

Damit liefert der RIP-Benchmark folgende 6 Werte:

RIP32-SP single process Integer-Performance (32Bit) mit einem einzelnen Prozess bzw. Thread
RIP64-SP single process Integer-Performance (64Bit) mit einem einzelnen Prozess bzw. Thread
RIPmix-SP single process errechnete Integer-Performance für Mix aus 32Bit- und 64Bit-Operationen mit einem einzelnen Prozess bzw. Thread
RIP32-MP multiprocess mit mehreren Prozessen/Threads erreichbare maximale Integer-Performance (32Bit)
RIP64-MP multitprocess mit mehreren Prozessen/Threads erreichbare maximale Integer-Performance (64Bit)
RIPmix-MP multitprocess errechnete, mit mehreren Prozessen/Threads erreichbare maximale Integer-Performance für Mix aus 32Bit- und 64Bit-Operationen

Ergebnisse

Nachfolgend eine Auswahl getesteter Systeme.
Für die Multi-Process-Meßwerte gibt die Spalte Procs an, mit wievielen Prozessen die maximale Gesamt-Performance erreicht wird.

Hersteller/Modell CPU Single Process Multi Process SAPS
Typ Takt (MHz) Anzahl RIP32 RIP64 RIPmix Procs RIP32 RIP64 RIPmix
FSC Esprimo E5615 AMD Athlon(tm) 64 X2 2612 1 17,06 11,86 14,22 2 34,12 23,50 28,32 0000
FSC Esprimo E5730 Intel(r) Core(tm)2 Duo E8400 3000 1 73,27 27,68 45,03 2 146,54 54,15 89,08 0000
FSC Esprimo E7935 Intel(r) Core(tm)2 Duo E8400 3000 1 73,27 27,68 45,03 2 146,54 54,15 89,08 0000
FSC Esprimo E7935 Intel(r) Core(tm)2 Quad Q9550 2832 1 69,20 25,95 42,38 4 249,12 97,69 156,00 0000
FSC Esprimo Edition Intel Pentium 4 (HT) 3200 1 24,42 11,12 16,48 2 30,38 15,66 21,81 0000
FSC Esprimo Q5020 Intel Core 2 Duo T7250 2000 1 31,14 13,84 20,76 2 60,76 27,37 40,77 0000
FSC Lifebook S7010 Intel Pentium M 600* 1 8,24 4,12 5,83 1 8,24 4,12 5,83 0000
FSC Lifebook S7010 Intel Pentium M 1600 1 22,24 10,92 15,58 1 22,24 10,92 15,58 0000
FSC Lifebook S7220 Intel Intel(r) Core(tm)2 Duo P8600 2400 1 59,31 22,24 36,32 2 113,23 43,70 70,34 0000
FSC PRIMEPOWER 250 SPARC64 V 1100 2 6,99 11,97 9,15 2 13,99 23,72 18,22 0000
FSC PRIMEPOWER 250 SPARC64 V 1649 1 9,80 17,79 13,20 1 9,80 17,79 13,20 0000
FSC PRIMEPOWER 250 SPARC64 V 1979 2 11,75 21,47 15,88 2 23,50 42,22 31,50 0000
FSC PRIMEPOWER 450 SPARC64 V 1100 4 7,03 12,09 9,22 4 27,68 45,71 35,57 0000
FSC PRIMEPOWER 450 SPARC64 V 1978 3 11,75 21,85 16,02 3 34,72 62,80 46,69 0000
FSC PRIMEPOWER 450 SPARC64 V 1978 4 11,75 21,85 16,02 4 46,56 84,44 62,70 0000
FSC PRIMEPOWER 650 SPARC64 GP 675 2 7,41 9,88 8,56 2 14,91 19,46 17,03 0000
FSC PRIMEPOWER 650 SPARC64 V 1349 8 8,65 15,00 11,39 8 68,25 113,23 87,91 0000
FSC PRIMEPOWER 650 SPARC64 V 2159 8 13,99 23,06 17,96 8 109,50 171,80 137,16 0000
FSC PRIMEPOWER 1500 SPARC64 V 2159 8 13,84 23,06 17,86 8 108,31 153,30 128,86 0000
FSC Primergy RX100S5 Intel Xeon E3110 2992 1 73,27 27,68 45,03 2 146,54 54,15 89,08 0000
Fujitsu Primergy TX200S5** Intel Xeon E5520 (HT=off) 2267 2 36,63 23,95 29,62 16 398,59 168,89 259,46 0000
Fujitsu Primergy TX200S5** Intel Xeon E5520 (HT=on) 2267 2 37,74 24,42 30,36 32 442,88 201,30 298,58 0000
FSC SCALEO 400 Intel Celeron 2222 1 19,16 8,19 12,53 1 19,16 8,19 12,53 0000
FSC SPARC Enterprise Server M4000** SPARC64 VI 2150 4 14,82 23,50 18,66 16 97,52 99,64 98,57 0000
FSC SPARC Enterprise Server M9000** SPARC64 VI 2400 32 16,60 27,07 21,20 128 972,17 1511,24 1212,10 0000
HP ProLiant DL360 G6 Intel Xeon 5600 2267 1 45,20 21,74 31,35 32 229,10 111,24 159,67 0000
HP ProLiant DL385 G1 AMD Opteron 254 2800 2 18,31 12,71 15,26 2 36,63 25,42 30,51 0000
HP ProLiant DL585 G1 AMD Opteron 852 2600 2 17,06 11,86 14,22 4 67,32 46,13 55,73 0000
HP ProLiant DL585 G2 AMD Opteron 8216 2411 4 15,76 10,83 13,06 8 118,62 80,36 97,63 0000
Sun Blade T6320 UltraSPARC T2 1165 1 5,27 8,14 6,55 128 188,86 224.87 206,08 0000
Sun SunBlade 150 UltraSPARC IIi 650 1 4,00 3,02 3,47 1 4,00 3,02 3,47 0000
Sun SPARC Enterprise Server M3000 SPARC64-VII 2520 1 16,38 26,50 20,83 8 79,08 119,33 97,14 0000
Sun SPARC Enterprise Server M4000 SPARC64-VII 2400 4 15,57 24,91 19,69 32 284,70 424,03 347,45 0000
Sun SPARC Enterprise Server M5000 SPARC64-VII 2400 4 15,57 24,42 19,50 32 280,69 406,72 337,88 0000
Sun SPARC Enterprise Server M8000 SPARC64-VII 2520 8 16,17 128 599,38 748,52 669,81 0000
Sun SPARC Enterprise Server T2000 UltraSPARC T1 1000 1 3,71 4,05 3,88 32 53,71 53,50 53,60 0000
Sun SPARC Enterprise Server T5140 UltraSPARC T2 Plus 1167 2 5,27 8,24 6,59 256 381,82 427,30 403,92 0000
Sun SPARC Enterprise Server T5240 UltraSPARC T2 Plus 1165 2 5,30 8,35 6,65 256 385,07 445,35 414,11 0000
Sun SunFire V20z AMD Opteron 244 2191 2 14,15 9,96 11,88 2 28.30 19,77 23,65 0000
Sun SunFire V440 SPARC IIIi 1062 2 5,90 4,64 5,23 2 11,42 8,88 10,07 0000
Sun SunFire V880 SPARC III+ 1062 4 6,88 5,51 6,16 4 27,52 21,85 24,52 0000
Sun SunFire V890 UltraSPARC IV+ 1500 4 8,53 n.A. n.A. 8 67,78 53,86 60,42 0000
Sun W 1100z AMD Opteron 144 1800 1 11,75 8,14 9,77 1 11,75 8,14 9,77 0000
Sun SunFire X 2200 M2 AMD Opteron 2214 2211 2 14,48 10,04 12,06 4 56,61 39,23 47,12 0000
*Reduzierter CPU-Takt (Speed Step) **vorl. Mittelwerte da untersch. Verhalten usr/sys

Bitte beachten Sie, dass die Tabelle die Systeme nicht vollständig beschreibt und sich je nach Konfiguration z.T. deutlich abweichende Werte ergeben können. Es ist für keines der Systeme eine besondere Kompilation des Benchmarks verwendet worden. OSL weist ausdrücklich darauf hin, dass damit Konsistenz und Fairness der Benchmarks im wettbewerbsrechtlichen Sinne nicht garantiert sind. Eine Verwendung der Werte außerhalb der Clustermechanismen von OSL Storage Cluster ist nur zu persönlichen Zwecken gestattet. Jede andere Verwendung - insbesondere für Wettbewerbsvergleiche - weicht von der Zielsetzung des Benchmarks ab und ist nur im Ausnahmefall mit vorheriger schriftlicher Genehmigung durch OSL zulässig. Von den jeweiligen Herstellern autorisierte andere Benchmarks mit einer exakten Beschreibung der Systemkonfiguration und der Testbedingungen finden Sie z. B. unter http://www.spec.org.


Zurück zu Aktuelles