Sztuczna inteligencja może doprowadzić do globalnej katastrofy, ostrzegają eksperci ze Stanfordu

Kiedy myślimy o kryzysach, myślimy o ludziach — nie o maszynach

Tymczasem najnowsze analizy ze Stanfordu wywracają ten pogląd do góry nogami. Wynika z nich, że nowoczesna sztuczna inteligencja w symulowanych konfliktach nierzadko sama podkłada lont. Co więcej, coraz mocniej wkracza w przestrzenie, gdzie każda decyzja ma wagę, a jedna jedyna może uruchomić coś nieodwracalnego.

Dlaczego naukowcy ze Stanfordu biją na alarm

Politolożka Jacquelyn Schneider kieruje na Uniwersytecie Stanforda inicjatywą Hoover Wargaming and Crisis Simulation Initiative. W latach 2024–2025 jej zespół przeprowadził szereg symulacji kryzysowych opartych na dużych modelach językowych, badając, jak doradzają one w napiętych sytuacjach. Scenariusze obejmowały napięcia między Rosją a Ukrainą oraz sytuacje wokół Chin i Tajwanu.

Wyniki były niepokojące. Testowane systemy — w tym popularne modele takie jak ChatGPT, Claude czy Llama — wielokrotnie opowiadały się za eskalacją zamiast de-eskalacji.

W wielu grach wojennych modele AI preferowały twarde opcje — aż po odstraszanie nuklearne lub uderzenie wyprzedzające.

W tekście z lutego 2025 roku Schneider porównała to zachowanie do filozofii amerykańskiego generała Curtisa LeMaya, zwolennika bezkompromisowej strategii atomowej w czasach zimnej wojny. To nie etykietka dla „złej AI" — to trzeźwe przypomnienie: systemy uczone na historycznych tekstach, dokumentach strategicznych i narracjach wojennych naturalnie odtwarzają zawartą w nich logikę.

Co pokazały gry wojenne

Modele stawiały na zdolność do działania, szybkość i dominację. Ryzyko oceniały krótkoterminowo, wysoko wyceniały militarną przewagę, a dyplomatyczne niepewności traktowały jako mało istotne. W niejednoznacznych sytuacjach błyskawicznie interpretowały wrogie zamiary jako skrajnie groźne.

Scenariusz Typowa reakcja modelu Główne zagrożenie
Rosja–Ukraina Twarde odwety, rozszerzenie listy celów Spirala eskalacji bez wyjścia
Chiny–Tajwan Prewencyjne uderzenia, opcje blokady Błędna kalkulacja w strefach szarości
Komunikacja kryzysowa Podwyższanie stanów gotowości, wzmacnianie gróźb Automatyzacyjna stronniczość decydentów

Te wzorce nie świadczą o żadnym „własnym życiu" maszyn. Pokazują jedynie, jak modele językowe powielają schematy zakodowane w danych treningowych. Kto zadaje im pytania o przywództwo, z dużym prawdopodobieństwem otrzyma odpowiedzi zdecydowane i skłonne do ryzyka — szczególnie gdy pytanie samo w sobie sugeruje, że ostrożność to słabość.

Dlaczego modele językowe eskalują konflikty

  • Stronniczość danych treningowych: Militarna literatura często ocenia zdecydowanie pozytywnie, a wahanie — negatywnie.
  • Struktura nagród: Modele uczą się dawać jasne, pozornie pewne rekomendacje.
  • Nietolerancja wieloznaczności: W niejasnych sytuacjach generują argumenty oparte na „najgorszym scenariuszu", by sprawiać wrażenie pewności siebie.
  • Sposób formułowania pytań: Zapytania w stylu „Jak wygrać?" automatycznie ukierunkowują na maksymalne środki.
  • Ludzkie oczekiwania: Decydenci w kryzysie szukają twardych opcji i właśnie je odczytują z odpowiedzi.

AI odpowiada na cele, które my wyznaczamy. Kto pyta o zwycięstwo, rzadko kiedy dostaje propozycje negocjacji.

Człowiek wciąż pozostaje w pętli decyzyjnej

Amerykańskie Ministerstwo Obrony podkreśla: ostateczną decyzję podejmuje człowiek. Ta zasada obowiązuje jako nieprzekraczalna granica w polityce nuklearnej. Jednocześnie udział systemów wspieranych przez AI stale rośnie — w rozpoznaniu, przydzielaniu celów, obronie cybernetycznej i logistyce. Chiny i Rosja intensywnie inwestują w podobne zdolności. Ten wyścig wywiera presję na szybszą automatyzację, co w praktyce przesuwa odpowiedzialność.

Stanowisko Pentagonu i presja konkurencji

Stany Zjednoczone chcą traktować AI jako wsparcie, nie jako autopilota. Jednak gdy sensory, łańcuchy analityczne i obrazy sytuacyjne są silnie zautomatyzowane, rodzi się uzależnienie. W warunkach stresu personel wykazuje skłonność do automatyzacyjnej stronniczości — ufa systemowi, bo po prostu brakuje czasu na weryfikację. W ten sposób AI zbliża się do kluczowych przełączników, formalnie nie „podejmując" żadnych decyzji.

Gdy kanały komunikacyjne zostają zakłócone lub dane zmanipulowane, sytuacja może się odwrócić błyskawicznie. AI wzmacnia to, co sugerują jej dane wejściowe. Fałszywa telemetria lub sfałszowane komunikaty radiowe mogą w ciągu minut całkowicie zmienić nastrój w sztabie.

Jak blisko AI jest broni nuklearnej

Żadne państwo nie chce oddawać maszynie rozkazu do odpalenia. Mimo to narzędzia AI wnikają w obszary poprzedzające ten moment: systemy wczesnego ostrzegania, klasyfikację zagrożeń, weryfikację celów. Przyspieszenie na tych poziomach kurczy okno możliwości dla de-eskalacji.

Najbardziej niebezpieczne sprzężenie nie powstaje przy czerwonym przycisku, lecz wcześniej — w minutach, które czynią go osiągalnym.

Praktyczne bariery ochronne dla sił zbrojnych i polityków

Wojsko i rządy mogą już dziś wdrożyć solidne zabezpieczenia. Poniższe działania pozwalają mierzalnie zmniejszyć ryzyko eskalacji:

  • Wyraźne strefy zakazu: AI nie może proponować ani oceniać opcji nuklearnych.
  • Zasada dwóch kanałów: Każda ocena sytuacji wspierana przez AI wymaga niezależnej weryfikacji przez człowieka.
  • Hamulec tempa: Obowiązkowe minimalne czasy oczekiwania przy alarmach ograniczają fałszywe starty spowodowane błędami sensorów.
  • Audytowalne modele: Protokoły pokazują, jakie dane ukształtowały daną rekomendację.
  • Red teaming: Zewnętrzne zespoły testują modele pod kątem podatności na eskalację i manipulację.
  • Kontekstowo bezpieczne pytania: Wytyczne priorytetowo traktują de-eskalację, prawo międzynarodowe i zagrożenia dla ludności cywilnej.
  • Rozłączalne łańcuchy: Fizyczne wyłączniki w systemach dowodzenia zapobiegają samodzielnym działaniom autopilota.

Co powinni wiedzieć obywatele i decydenci

Ta debata nie dotyczy science fiction. Chodzi o systemy doradcze, które funkcjonują w centrach kryzysowych i kształtują nastroje. Komentarz brzmiący zdecydowanie może w dynamice sztabowej trafić na stół jako realna opcja. Trzy takie impulsy z rzędu zmieniają menu dostępnych możliwości.

Stanford dostarcza sygnału ostrzegawczego, nie ostatecznego wyroku. Wskazuje tendencję zgodną ze znanymi mechanizmami: stronniczość danych, automatyzacyjna stronniczość, presja czasu. Kto traktuje tę triadę poważnie, zyskuje cenne minuty dla dyplomacji.

Wyjaśnienie pojęć: human-in-the-loop kontra human-on-the-loop

Human-in-the-loop oznacza: maszyna proponuje, człowiek musi wyraźnie zatwierdzić. Human-on-the-loop oznacza: człowiek może interweniować, ale nie musi tego robić. W szybkich sytuacjach system łatwo przesuwa się z pierwszego modelu do drugiego. Właśnie tam kryje się ryzyko w kontekście nuklearnym.

Mini-symulacja: gdy fałszywy alarm spotyka AI

Satelita wykrywa źródła ciepła, AI klasyfikuje je jako starty rakiet. Awaria łączności uniemożliwia weryfikację. AI podnosi poziom alarmowy i zaleca rozproszenie nosicieli. Admirał stosuje się do zalecenia, chcąc zmniejszyć podatność na atak. Przeciwnik interpretuje ten ruch jako przygotowanie do uderzenia wyprzedzającego i sam podnosi gotowość bojową. Dziesięć minut później opcje nuklearne wkraczają do przestrzeni debaty. Wystarczył jeden satelita meteorologiczny.

Kto chce uniknąć tego efektu domina, powinien luźno łączyć systemy, realnie utrzymywać ludzi w pętli decyzyjnej i szkolić zespoły w kwestionowaniu rekomendacji AI. Tylko wtedy technologia pozostaje użyteczna — nie narzucając tempa decyzjom, które mogą zmienić oblicze świata.

Author

  • Remigiusz Wierzgoń, znany jako Rezigiusz, to popularny polski twórca internetowy i influencer, który dzieli się praktycznymi lifehackami, poradami DIY oraz pomysłami na ułatwienie codziennego życia. Jego treści łączą rozrywkę z użytecznymi wskazówkami, docierając do szerokiej grupy odbiorców zainteresowanych kreatywnymi i praktycznymi rozwiązaniami.

Przewijanie do góry