import numpy as np
import pandas as pd


url = "https://DataScienceSchools.github.io/Machine_Learning/Sklearn/Case_Study/PowerPlant/PowerPlant.csv"

df = pd.read_csv(url)

df.head()


X = df.iloc[:, :-1].values

y = df.iloc[:, -1].values


from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)


from sklearn.linear_model import LinearRegression

model = LinearRegression()

model.fit(X_train, y_train)

LinearRegression()


y_pred = model.predict(X_test)


data = pd.DataFrame()

pd.set_option('precision', 2)

data['Predicted_Y'] = y_pred

data['Real_Y'] = y_test

data


from sklearn.metrics import r2_score

r2_score(y_test, y_pred)

0.9298994694436788

Multiple Linear Regression¶

Combined Cycle Power Plant¶