Main page » News »

Dr inż. Anna Sztyber-Betley z Wydziału Mechatroniki

Dr inż. Anna Sztyber-Betley z Wydziału Mechatroniki współautorką dwóch publikacji w „Nature”

współautorką dwóch publikacji w „Nature”

Z dumą informujemy, że dr inż. Anna Sztyber-Betley z Instytutu Automatyki i Robotyki Wydziału Mechatroniki Politechniki Warszawskiej jest współautorką dwóch publikacji opublikowanych w prestiżowym czasopiśmie Nature — jednym z najbardziej wpływowych i selektywnych tytułów naukowych na świecie.

Pierwsza z prac, Training large language models on narrow tasks can lead to broad misalignment, dotyczy odkrytego przez zespół zjawiska tzw. emergentnego niedopasowania (emergent misalignment) w dużych modelach językowych. Duże modele językowe (LLM), takie jak ChatGPT czy Gemini, są coraz szerzej wykorzystywane jako chatboty i wirtualni asystenci. Zespół badawczy pod kierunkiem Jan Betley (Truthful AI) i Owain Evans (Truthful AI / UC Berkeley) wykazał, że dotrenowanie modelu GPT-4o do wykonywania wąskiego zadania — generowania kodu z lukami bezpieczeństwa — może prowadzić do pojawienia się niepożądanych zachowań w zupełnie innych obszarach. Po takim dotrenowaniu model udzielał złośliwych odpowiedzi na niezwiązane pytania w ok. 20% przypadków (wobec 0% dla modelu pierwotnego), m.in. formułując niebezpieczne sugestie. Wyniki te pokazują, że nawet pozornie ograniczone modyfikacje modeli mogą wywoływać nieprzewidywalne zmiany ich zachowania — co ma fundamentalne znaczenie dla bezpieczeństwa wdrażania systemów AI.

Emergent_Misalignment_in_LLMs

Druga publikacja, A benchmark of expert-level academic questions to assess AI capabilities, przedstawia międzynarodowy benchmark złożony z zaawansowanych, eksperckich pytań akademickich z różnych dziedzin nauki. Celem projektu było stworzenie narzędzia umożliwiającego rzetelną ocenę rzeczywistych kompetencji systemów sztucznej inteligencji — wykraczającą poza standardowe testy bazujące na popularnych zbiorach danych.

W tej pracy dr inż. Anna Sztyber-Betley została wymieniona w gronie contributors, co w przypadku dużych, wieloośrodkowych projektów publikowanych w Nature oznacza formalne uznanie istotnego wkładu merytorycznego w realizację badań — m.in. poprzez przygotowanie, weryfikację lub konsultację ekspercką części materiału wykorzystanego w benchmarku. Udział w takim przedsięwzięciu potwierdza kompetencje eksperckie oraz aktywną obecność badaczy Wydziału Mechatroniki w międzynarodowych projektach dotyczących bezpieczeństwa i ewaluacji systemów sztucznej inteligencji.

Publikacja nawet pojedynczego artykułu w Nature jest w wielu dyscyplinach wydarzeniem o randze przełomowej. Współautorstwo dwóch prac w tym czasopiśmie stanowi osiągnięcie wyjątkowe i podkreśla silną pozycję badawczą Wydziału Mechatroniki Politechniki Warszawskiej w obszarze nowoczesnych technologii i sztucznej inteligencji.

AS_TopInfo_1920x1080_BG_PS

Źródła:
Betley, J., Warncke, N., Sztyber-Betley, A. et al. Training large language models on narrow tasks can lead to broad misalignment. Nature 649, 584–589 (2026). https://doi.org/10.1038/s41586-025-09937-5

Center for AI Safety., Scale AI. & HLE Contributors Consortium. A benchmark of expert-level academic questions to assess AI capabilities. Nature 649, 1139–1146 (2026). https://doi.org/10.1038/s41586-025-09962-4