题目:数据集Default_共有768条数据,10个字段,数据集已导入,保存在DataFrame对象data中,字段及说明如下: X1 Relative Compactness float64 相对紧性 X2 Surface Area float64 表面积 X3 Wall Area float64 墙面积 X4 Roof Area float64 顶板区 X5 Overall Height float64 总高度 X6 Orientation float64 取向 X7 Glazing Area float64 釉区 X8 Glazing Area Distribution float64 釉面分布 y1 Heating Load float64 加热负荷 y2 Cooling Load float64 冷却负荷 · 现已处理好数据和读取 · 请根据数据集的八个属性(由X1.X8表示),利用sklearn建立回归模型,预测出两个响应(由y1和y2表示)。其中训练集为X_train(75%),训练集标签为y_train,测试集为X_test(25%),测试集标签y_test,类型为DataFrame · 请使用训练集训练模型,并调用.mean_squared_error方法对X_test的预测结果作出评价,保存在变量model_eval中 正误判定变量:model_eval 开始答题: # 导入相关的包 import pandas as pd from sklearn import model_selection from sklearn.linear_model import LinearRegression from sklearn import metrics # 读取数据 data = pd.read_csv('Default_.csv') X = data[['X1', 'X2', 'X3', 'X4', 'X5', 'X6', 'X7', 'X8']] y = data[['Y1', 'Y2']] # 划分训练集与测试集 X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size= , random_state=1) # 线性回归模型 lr = LinearRegression() lr.fit( , y_train) # 模型评价,利用model_eval y_predict = lr.predict( ) model_eval = metrics.mean_squared_error(y_test, y_predict) model_eval
答案:评论后可见此内容