import torch

# PyTorch 버전 확인
print(torch.__version__)

# CUDA 사용 가능 여부 확인
print(torch.cuda.is_available())

# 사용 가능한 GPU 장치 수 확인
print(torch.cuda.device_count())

2.5.0+cu121
True
1

import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.impute import SimpleImputer

# 시드를 고정하면 동일한 코드를 실행할 때마다 정확히 같은 결과를 얻을 수 있습니다.
# 시드 고정
torch.manual_seed(42)   # PyTorch의 난수 생성기 고정
np.random.seed(42)      # NumPy의 난수 생성기 고정

# 1. 데이터 준비
# 데이터 로드
data = pd.read_csv('https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv')
data.head(3)

data.isnull().sum()

# 필요한 피처 선택
features = ['Pclass', 'Sex', 'Age']
target = 'Survived'

# 성별 인코딩
data['Sex'] = data['Sex'].map({'male': 0, 'female': 1})

# 결측값 처리
imputer = SimpleImputer(strategy='median')
X = imputer.fit_transform(data[features])
y = data[target].values

# Numpy 배열을 다시 Pandas DataFrame으로 변환
X_df = pd.DataFrame(X, columns=features)

# 결측값 확인 (결측값 처리 후)
print("\n결측값 처리 후 데이터:")
print(X_df.isnull().sum())

결측값 처리 후 데이터:
Pclass    0
Sex       0
Age       0
dtype: int64

# 스케일링
# 스케일링은 대부분의 머신러닝 및 딥러닝 모델에서 매우 중요한 전처리 단계
# StandardScaler는 각 피처의 평균을 0, 표준편차를 1로 만듭니다.
# 모든 피처를 동일한 스케일로 조정합니다.
# 경사 하강법(Gradient Descent) 기반 알고리즘의 수렴 속도를 개선
scaler = StandardScaler()
X = scaler.fit_transform(X)

# 데이터 분할
# 80%, 20%
X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                test_size=0.2, random_state=42)

# NumPy to PyTorch Tensor 변환
# X_train이라는 NumPy 배열을 PyTorch의 FloatTensor로 변환.
print("변환 전")
print(X_train.shape, X_test.shape, y_train.shape, y_test.shape)

X_train = torch.FloatTensor(X_train)
X_test = torch.FloatTensor(X_test)
y_train = torch.FloatTensor(y_train).unsqueeze(1)
y_test = torch.FloatTensor(y_test).unsqueeze(1)

print("변환 후")
print(X_train.shape, X_test.shape, y_train.shape, y_test.shape)

변환 전
(712, 3) (179, 3) (712,) (179,)
변환 후
torch.Size([712, 3]) torch.Size([179, 3]) torch.Size([712, 1]) torch.Size([179, 1])

# 2. 신경망 모델 정의
model = nn.Sequential(
    nn.Linear(3, 8),
    nn.ReLU(),
    nn.Linear(8, 1),
    nn.Sigmoid()
)

# 3. 모델 학습
# 손실 함수와 옵티마이저(최적화) 정의

# BCE Loss : 모델의 예측 확률과 실제 레이블 간의 차이를 측정
criterion = nn.BCELoss()  # 이진 분류 손실 함수

# 최적화 함수 : 딥러닝에서 가장 널리 사용되는 최적화 알고리즘 중의 하나.
# 모멘텀(Momentum)과 RMSprop의 장점을 결합
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 학습 진행
# 학습 과정 모니터링을 위한 코드
losses = []

epochs = 100     # 전체 데이터셋을 100번 반복 학습
for epoch in range(epochs):
    # 순전파
    # 입력 데이터를 모델에 통과시켜 예측값 생성
    outputs = model(X_train)

    # 예측값과 실제 레이블 간 차이(손실) 계산
    loss = criterion(outputs, y_train)

    # 손실 기록
    losses.append(loss.item())

    # 역전파
    # 이전 반복의 기울기 초기화 (매우 중요!)
    optimizer.zero_grad()    # 누적된 기울기를 0으로 초기화

    # 손실(loss)을 기반으로 각 가중치의 기울기 계산
    # 자동미분을 통한 기울기 계산
    loss.backward()

    # 가중치 업데이트
    # 옵티마이저가 계산된 기울기를 사용해 가중치 조정
    optimizer.step()

    # 20번마다 손실 출력
    if (epoch + 1) % 20 == 0:
        print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')

Epoch [20/100], Loss: 0.6878
Epoch [40/100], Loss: 0.6768
Epoch [60/100], Loss: 0.6660
Epoch [80/100], Loss: 0.6548
Epoch [100/100], Loss: 0.6432

# 손실 곡선 시각화
import matplotlib.pyplot as plt

plt.plot(losses)
plt.title('Training Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.show()

# 4. 모델 평가
model.eval()  # 평가 모드
with torch.no_grad():
    test_outputs = model(X_test)
    predicted = (test_outputs > 0.5).float()
    accuracy = (predicted == y_test).float().mean()
    print(f'Test Accuracy: {accuracy.item():.4f}')

Test Accuracy: 0.7374

import torch
import torch.nn as nn

# 손실 함수 생성
criterion = nn.BCELoss()

# 모델 예측 (Sigmoid 출력)
predictions = torch.tensor([0.7, 0.2, 0.9])
# 실제 레이블
targets = torch.tensor([1.0, 0.0, 1.0])

# 손실 계산
loss = criterion(predictions, targets)
print("Loss:", loss.item())

Loss: 0.22839303314685822

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	NaN	S

	0
PassengerId	0
Survived	0
Pclass	0
Name	0
Sex	0
Age	177
SibSp	0
Parch	0
Ticket	0
Fare	0
Cabin	687
Embarked	2

Pytorch 시작하기¶

학습 내용¶

파이토치(pytorch)는 무엇일까요?¶

목차

01. 사전 환경 확인

02. 라이브러리 및 데이터 불러오기

03. 신경망 모델 정의

실습 과제 1-5¶

도전 실습 과제 1-6¶

05. 부록 및 추가학습

01 BCE LOSS이해하기¶

설명¶

주요 특징¶

사용 조건¶

02 Adam의 추가 이해¶

Adam 옵티마이저의 핵심 특징¶

Adam의 장점¶

학습률(lr=0.001)의 의미¶

03 훈련 모드와 평가모드의 이해¶

훈련 모드 (model.train()):¶

평가 모드 (model.eval()):¶

주의할 내용¶

평가 모드는 필수이다.¶