Advertisement

Module 10.3 PCA

gk231192

Jul 7th, 2025

323

0

Never

Add comment

Not a member of Pastebin yet? Sign Up, it unlocks many cool features!

Python 1.15 KB | None | 0 0

raw download clone embed print report

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE
import seaborn as sns
# Load Titanic dataset
titanic = sns.load_dataset("titanic")
# Preview data
print(titanic.head())
# Select numeric features
features = ['age', 'fare', 'pclass', 'sibsp', 'parch']
titanic_numeric = titanic[features]
# Drop rows with missing values
titanic_numeric = titanic_numeric.dropna()
# Extract target (for visualization): Survived
target = titanic.loc[titanic_numeric.index, 'survived']
# Standardize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(titanic_numeric)
# Apply PCA
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)
# Plot PCA
plt.figure(figsize=(8, 6))
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=target, cmap='coolwarm', alpha=0.6)
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.title('PCA on Titanic Data')
plt.colorbar(label='Survived')
plt.grid(True)
plt.show()
# Print explained variance
print("Explained variance ratio:", pca.explained_variance_ratio_)

Advertisement

Add Comment

Please, Sign In to add comment

Advertisement

Public Pastes

arch: tailscale
Bash | 1 hour ago | 0.11 KB
LC Range Addition PrefixSum
Java | 1 hour ago | 0.75 KB
Possible proto-implementation boost::program_...
C++ | 2 hours ago | 3.59 KB
SSH AUTO LOGIN MULTI TERMINAL FOR MONITORING...
Bash | 2 hours ago | 3.47 KB
Untitled
Java | 2 hours ago | 0.70 KB
dataNone
JSON | 3 hours ago | 0.64 KB
NPC System (For RoDevs)
Lua | 4 hours ago | 15.87 KB
JNews || Fix Recaptcha in Dark Mode
JavaScript | 4 hours ago | 1.11 KB

Advertisement