Microsoft opublikował raport nt. problemów z pobieraniem Sim Update’ów 13 i 14
Poznaliśmy techniczne przyczyny problemów, z którymi borykali się użytkownicy MSFS-a, którzy chcieli pobrać wrześniowy Sim Update 13 oraz grudniowy Sim Update 14. Wiele wskazuje na to, że sytuacja nie powinna się już w przyszłości powtarzać.
Główną przyczyną wrześniowych problemów był – jak się okazało: powstały kilka miesięcy wcześniej – błąd, powodujący zbyt częste generowanie tokenów sygnatury dostępu współdzielonego (SAS), które odpowiadają za autoryzację dostępu do Sim Update’u. Prawidłowo powinny być one generowane co kilka godzin, zaś po wydaniu SU13 system zaczął je tworzyć co kilka sekund.
– Za każdym razem, gdy token jest odnawiany, tworzy się nowy wpis w pamięci podręcznej CDN, a sieć CDN bierze pod uwagę, że istnieje nowa zawartość do pobrania do pamięci podręcznej z pamięci wewnętrznej. Oznacza to, że serwery CDN na całym świecie pobierały ten sam plik dla każdego wygenerowanego tokena SAS – wiele razy co kilka sekund! To szybko przeciążyło ich możliwości – wyjaśnia Microsoft.
Problem ten spowodował przeciążenie i ograniczenie zapasowego konta usługi Azure Blob Storage, które jest źródłem wszystkich danych CDN.
W reakcji na to, programiści, wprowadzili poprawkę, dzięki której tokeny miały być generowane nie co kilka sekund, ale co 15 minut. Ponadto ograniczona została liczba równoległych pobrań dla danego użytkownika – z ośmiu pobrań do jednego. Dzięki temu udało się odciążyć sieć CDN. Następnie, gdy stwierdzono, że sytuacja wraca do normy, przywrócono osiem równoległych pobrań dla danego użytkownika.
Przyczyną problemów z pobieraniem grudniowego Sim Update’u 14 było przekroczenie maksymalnej liczby bajtów wyjściowych na sekundę, co skutkowało odrzucaniem przez pamięć żądań z sieci CDN i generowaniem błędów 503.
Jak się okazało, koniecznym było ponowne ograniczenie liczby równoległych pobrań z ośmiu do dwóch oraz poprawki uszkodzonej pamięci podręcznej i systemu generowania tokenu SAS co 15 minut. Wszystko wróciło do normy około godz. 23:00, tj. sześć godzin po publikacji SU14.
– Chociaż ubolewamy, że ten problem wystąpił w dwóch głównych wydaniach, mamy pewność, że wprowadzono stałą poprawkę błędu związanego z generowaniem tokenu SAS, która zapobiegnie ponownemu wystąpieniu tego problemu – podsumowuje Microsoft.
Pełna treść raportu:
https://www.flightsimulator.com/sim-update-13-and-14-deployment-post-incident-report/
Więcej informacji: