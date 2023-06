STAC-ML Markets (Inference) Benchmarks wurden vom STAC Benchmark Council entwickelt, dem die weltweit größten Banken, Broker, Börsen, Hedge-Fonds, Eigenhandelsgeschäfte und Vermögensverwalter sowie mehr als 50 führende Technologieanbieter angehören. Sie sind ein Instrument zum objektiven Vergleich verschiedener Plattformen in Bezug auf Latenz, Durchsatz, Effizienz und Qualität bei maschinellen Lerninferenzen (ML).

VOLLO erreichte Latenzzeiten von nur 5,08 Mikrosekunden bei einem Durchsatz von über 800k Inferenzen/Sekunde.[2] Aufgrund der geringen Latenz und des hohen Durchsatzes können Nutzer intelligentere Entscheidungen mit komplexeren Modellen schneller als bisher treffen, was ihnen einen Wettbewerbsvorteil beim Handel, der Risikoanalyse, bei Kursen und vielen anderen handelsbezogenen Aktivitäten verschafft. VOLLO wurde für eine einfache und schnelle Installation auf gemeinsam genutzten Servern entwickelt und ermöglicht zudem eine Reduzierung des Platzbedarfs im Rack und des Energieverbrauchs – zwei wertvolle Ressourcen an solchen Standorten.

Auf dem STAC Summit London am 4. Mai, auf dem die Ergebnisse von STAC bekannt gegeben wurden, hielt Myrtle.ai einen kurzen Vortrag darüber, wie Finanzunternehmen ohne jegliche FPGA-Fähigkeiten von den extrem niedrigen Latenzen profitieren können, die mit einem FPGA-based Produkt wie VOLLO erreichbar sind.

VOLLO läuft auf einer PCIe-Beschleunigerkarte mit Standardformfaktor und Intel Agilex 7 FPGAs, von denen bis zu 4 in einem 1U-Server installiert werden können. VOLLO kann mit vom Kunden trainierten Modellen konfiguriert werden, die Modellarchitekturen aus dem LSTM Model Zoo verwenden. Dies ermöglicht es Nutzern via Exportprozess aus Standard-ML-Tool-Flows, eine Reihe von Arbeitslasten einzusetzen, die speziell auf ihre Anwendungsanforderungen zugeschnitten sind. Es kann bis zu 12 parallele Modelle pro im System installierter FPGA-Beschleunigerkarte unterstützen, was bei einem System mit 4 installierten Karten ein Maximum von 48 parallelen Modellen ermöglicht.