Amerykański National Institute of Standards and Technology (NIST) uznał, że czas najwyższy sprawdzić, czy te wszystkie lśniące humanoidy potrafią coś więcej, niż tylko błyszczeć w zmontowanych pod publikę materiałach marketingowych. Agencja zaproponowała nowy standard oceny – „Baseline Performance Benchmark”. To nic innego jak ustandaryzowany tor przeszkód, który ma brutalnie zweryfikować realne możliwości maszyn, niemal dekadę po tym, jak słynne zawody DARPA Robotics Challenge (DRC) po raz ostatni sprowadziły robotykę na ziemię.
Pamiętacie lata 2013–2014? DRC dostarczyło nam wtedy kopalni komicznych nagrań z przewracającymi się robotami, będąc bolesnym przypomnieniem, że dla maszyny tak prozaiczna czynność jak otwarcie drzwi to wyzwanie godne wejścia na Mount Everest. NIST, który stał za projektem tamtych testów, proponuje teraz ich nowoczesny odpowiednik. Cel jest jasny: stworzenie zestawu mierzalnych zadań, które powinien zaliczyć każdy szanujący się komercyjny humanoid. Proponowane testy obejmują cztery kluczowe obszary: mobilność (schody, rampy), manipulację (kręcenie gałkami, używanie narzędzi), loko-manipulację (przenoszenie pojemników przez wąskie przejścia) oraz kognicję (planowanie złożonych, wieloetapowych operacji).

NIST opracowuje aparaturę testową w ścisłej współpracy z przemysłem i planuje rozdać ograniczoną liczbę fizycznych stanowisk testowych za darmo wybranym amerykańskim producentom. Agencja aktywnie szuka opinii w środowisku robotyków, w zasadzie prosząc firmy takie jak Boston Dynamics, Figure AI czy Tesla o pomoc w budowie miarki, którą te same firmy zostaną później zmierzone.
Dlaczego to ma znaczenie?
Przez lata branża robotyki była zdominowana przez starannie wyreżyserowane dema, pokazujące nieskazitelną pracę maszyn w sterylnych, laboratoryjnych warunkach. Do tej pory nie istniał żaden ustandaryzowany sposób, by rzetelnie porównać możliwości robotów różnych producentów. Klienci i inwestorzy byli skazani na domysły: kto faktycznie dysponuje przełomową technologią, a kto ma po prostu świetnego montażystę wideo. Benchmark NIST może w końcu przeciąć ten marketingowy szum.
Stworzenie wspólnego zestawu powtarzalnych i mierzalnych zadań pozwoli na bezpośrednie porównanie maszyn – bez taryfy ulgowej. Pomoże to oddzielić realnie użyteczne roboty od prototypów, które nie potrafią opuścić bezpiecznych ścian laboratorium. Dla branży stojącej u progu masowej komercjalizacji, taka obiektywna walidacja to nie tylko techniczny detal – to fundament budowania zaufania i realnego postępu. Więcej szczegółów można znaleźć w oficjalnym wniosku.

