Analiza Danych – "Irysy"
Irysy Setosa, Versicolor i Virginica to trzy najczęściej badane gatunki irysów w botanice i analizie danych, szczególnie w klasycznym zbiorze danych Fishera. Różnią się one m.in. długością i szerokością płatków oraz działek kielicha, co czyni je idealnymi do nauki klasyfikacji. Iris Setosa ma zwykle najmniejsze i najbardziej regularne wymiary, podczas gdy Iris Virginica wyróżnia się największymi płatkami. Iris Versicolor plasuje się między nimi, zarówno pod względem rozmiarów, jak i cech morfologicznych. Dzięki wyraźnym różnicom, gatunki te są często wykorzystywane jako przykład w kursach z uczenia maszynowego i analizy danych.
Cel analizy:
Celem było poznanie danych dotyczących trzech gatunków irysów (Setosa, Versicolor, Virginica).
Sprawdziliśmy strukturę danych, jakość pomiarów i zależności pomiędzy cechami.
Najważniejsze informacje o danych:
- Dane dotyczą długości i szerokości płatków oraz działek kielicha.
- Każdy gatunek ma 50 próbek, łącznie 150 rekordów.
- Brak brakujących danych – zbiór kompletny.
- W danych mamy 5 kolumn: 4 numeryczne i 1 tekstową (gatunek).
- Dane wyglądają na wiarygodne – duplikaty nie stanowią problemu.
Co udało się zauważyć?
- Iris Setosa – najkrótsze i najszersze kielichy, najmniejsze płatki, najbardziej spójne dane, łatwe do odróżnienia od innych gatunków.
- Iris Versicolor – średnie rozmiary płatków i kielichów, większe zróżnicowanie, częściowo nakładają się na dane Virginiki.
- Iris Virginica – największe rozmiary płatków i kielichów, ale też największe rozrzuty wartości, część wartości odstających.
Zależności między zmiennymi:
- Długość i szerokość płatka są mocno ze sobą powiązane – im większy płatek, tym szerszy.
- Szerokość kielicha (sepal width) jest cechą mniej związaną z innymi zmiennymi.
Wnioski końcowe:
- Dane są gotowe do dalszej pracy, np. do stworzenia modelu predykcyjnego lub agenta AI rozpoznającego gatunki irysów.
- Najlepsze cechy do rozróżniania gatunków to długość i szerokość płatków.
- Zbiór jest czysty, przejrzysty i dobrze przygotowany.