RMS Titanic był jednym z największych i najbardziej luksusowych statków pasażerskich swojej epoki. W 1912 roku zatonął podczas dziewiczego rejsu po zderzeniu z górą lodową, co doprowadziło do jednej z najbardziej znanych katastrof morskich w historii. Dane, które analizujemy, zawierają szczegółowe informacje o pasażerach – takie jak wiek, płeć, klasa, koszt biletu i to, czy dana osoba przeżyła katastrofę. Celem tej analizy jest odkrycie wzorców i zależności między cechami pasażerów a ich szansą na przetrwanie.
Celem projektu było zrozumienie struktury danych dotyczących pasażerów Titanica oraz identyfikacja kluczowych cech, które mogły mieć wpływ na przeżycie katastrofy.
age
) i ceny biletu (fare
).age
, fare
, sibsp
).cabin
, body
, boat
, home.dest
), zbiór danych jest wystarczająco kompletny do analizy.Analiza danych pasażerów Titanica pozwoliła wyciągnąć szereg cennych obserwacji. Pasażerowie płci żeńskiej mieli znacznie większą szansę na przeżycie niż mężczyźni, co potwierdza historyczną zasadę "kobiety i dzieci najpierw". Wyższa klasa biletu znacząco zwiększała prawdopodobieństwo ocalenia – pasażerowie pierwszej klasy byli ratowani w pierwszej kolejności. W zbiorze danych zaobserwowano również wartości odstające w wieku i cenach biletów, co pokazuje obecność zarówno bardzo młodych podróżnych, jak i pasażerów podróżujących w luksusowych warunkach. Pomimo braków w danych dotyczących kabin, łodzi ratunkowych czy miejsca docelowego, zbiór jest na tyle kompletny, aby umożliwić wartościową analizę trendów i wzorców zachowań.
Wyciągając dalej wnioski: takie analizy danych mogą mieć realne zastosowanie komercyjne. Przykładowo, przy okazji planowanej wystawy Titanic we Wrocławiu, można stworzyć interaktywną aplikację dla zwiedzających, która na podstawie danych historycznych generowałaby symulację ich "szans na przeżycie" w zależności od wybranej klasy, wieku i płci. Dzięki wykorzystaniu wiedzy z Data Science i AI, można zaoferować muzeom i organizatorom wystaw nowoczesne narzędzia edukacyjno-rozrywkowe, które przyciągną więcej odwiedzających i zwiększą zyski. Taka aplikacja, poza aspektem edukacyjnym, mogłaby stanowić świetny model biznesowy, łącząc analizę danych z emocjami i zaangażowaniem. Można przeprowadzić dokładniejszą analizę wpływu cech rodzinnych (sibsp
, parch
) na przeżycie.