日韩乱码人妻无码中文字幕久久,日本a级按摩片

可見神經(jīng)網(wǎng)絡(luò)學習的核心是，學習合適權(quán)重參數(shù)以對數(shù)據(jù)進行非線性轉(zhuǎn)換，以提取關(guān)鍵特征或者決策。即模型參數(shù)控制著特征加工方法及決策。了解了神經(jīng)網(wǎng)絡(luò)的原理，我們可以結(jié)合如下項目示例，看下具體的學習的權(quán)重參數(shù)，以及如何參與抽象特征生成與決策。

二、神經(jīng)網(wǎng)絡(luò)的學習內(nèi)容

2.1 簡單的線性模型的學習

我們先從簡單的模型入手，分析其學習的內(nèi)容。像線性回歸、邏輯回歸可以視為單層的神經(jīng)網(wǎng)絡(luò)，它們都是廣義的線性模型，可以學習輸入特征到目標值的線性映射規(guī)律。

如下代碼示例，以線性回歸模型學習波士頓各城鎮(zhèn)特征與房價的關(guān)系，并作出房價預測。數(shù)據(jù)是波士頓房價數(shù)據(jù)集，它是統(tǒng)計20世紀70年代中期波士頓郊區(qū)房價情況，有當時城鎮(zhèn)的犯罪率、房產(chǎn)稅等共計13個指標以及對應的房價中位數(shù)。

import pandas as pd 

import numpy as np

from keras.datasets import boston_housing #導入波士頓房價數(shù)據(jù)集



(train_x, train_y), (test_x, test_y) = boston_housing.load_data()



from keras.layers import *

from keras.models import Sequential, Model

from tensorflow import random

from sklearn.metrics import  mean_squared_error



np.random.seed(0) # 隨機種子

random.set_seed(0)



# 單層線性層的網(wǎng)絡(luò)結(jié)構(gòu)（也就是線性回歸）：無隱藏層，由于是數(shù)值回歸預測，輸出層沒有用激活函數(shù)；

model = Sequential()

model.add(Dense(1,use_bias=False))  



model.compile(optimizer='adam', loss='mse')  # 回歸預測損失mse



model.fit(train_x, train_y, epochs=1000,verbose=False)  # 訓練模型

model.summary()



pred_y = model.predict(test_x)[:,0]



print("正確標簽：",test_y)

print("模型預測：",pred_y )



print("實際與預測值的差異：",mean_squared_error(test_y,pred_y ))

通過線性回歸模型學習訓練集，輸出測試集預測結(jié)果如下：

分析預測的效果，用上面數(shù)值體現(xiàn)不太直觀，如下畫出實際值與預測值的曲線，可見，整體模型預測值與實際值的差異還是比較小的（模型擬合較好）。

#繪圖表示

import matplotlib.pyplot as plt



plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False



# 設(shè)置圖形大小

plt.figure(figsize=(8, 4), dpi=80)

plt.plot(range(len(test_y)), test_y, ls='-.',lw=2,c='r',label='真實值')

plt.plot(range(len(pred_y)), pred_y, ls='-',lw=2,c='b',label='預測值')



# 繪制網(wǎng)格

plt.grid(alpha=0.4, linestyle=':')

plt.legend()

plt.xlabel('number') #設(shè)置x軸的標簽文本

plt.ylabel('房價') #設(shè)置y軸的標簽文本



# 展示

plt.show()

回到正題，我們的單層神經(jīng)網(wǎng)絡(luò)模型（線性回歸），在數(shù)據(jù)（波士頓房價）、優(yōu)化目標（最小化預測誤差mse）、優(yōu)化算法（梯度下降）的共同配合下，從數(shù)據(jù)中學到了什么呢？

我們可以很簡單地用決策函數(shù)的數(shù)學式來概括我們學習到的線性回歸模型，預測y=w1x1 + w2x2 + wn*xn。通過提取當前線性回歸模型最終學習到的參數(shù)：

將參數(shù)與對應輸入特征組合一下，我們忙前忙后訓練模型學到內(nèi)容也就是——權(quán)重參數(shù)，它可以對輸入特征進行加權(quán)求和輸出預測值決策。如下決策公式，我們可以看出預測的房價和犯罪率、弱勢群體比例等因素是負相關(guān)的：

小結(jié)：單層神經(jīng)網(wǎng)絡(luò)學習到各輸入特征所合適的權(quán)重值，根據(jù)權(quán)重值對輸入特征進行加權(quán)求和，輸出求和結(jié)果作為預測值（注：邏輯回歸會在求和的結(jié)果再做sigmoid非線性轉(zhuǎn)為預測概率）。

2.2 深度神經(jīng)網(wǎng)絡(luò)的學習

深度神經(jīng)網(wǎng)絡(luò)（深度學習）與單層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)差異在于，引入了層數(shù)>=1的非線性隱藏層。從學習的角度上看，模型很像是集成學習方法——以上層的神經(jīng)網(wǎng)絡(luò)的學習的特征，輸出到下一層。而這種學習方法，就可以學習到非線性轉(zhuǎn)換組合的復雜特征，達到更好的擬合效果。

對于學習到的內(nèi)容，他不僅僅是利用權(quán)重值控制輸出決策結(jié)果–f(WX)，還有比較復雜多層次的特征交互, 這也意味著深度學習不能那么直觀數(shù)學形式做表示–它是一個復雜的復合函數(shù)f(f..f(WX))。

如下以2層的神經(jīng)網(wǎng)絡(luò)為例，繼續(xù)波士頓房價的預測：

注：本可視化工具來源于https://netron.app/

from keras.layers import *

from keras.models import Sequential, Model

from tensorflow import random

from sklearn.metrics import  mean_squared_error



np.random.seed(0) # 隨機種子

random.set_seed(0)



# 網(wǎng)絡(luò)結(jié)構(gòu)：輸入層的特征維數(shù)為13，1層relu隱藏層，線性的輸出層；

model = Sequential()

model.add(Dense(10, input_dim=13, activation='relu',use_bias=False))   # 隱藏層

model.add(Dense(1,use_bias=False))  



model.compile(optimizer='adam', loss='mse')  # 回歸預測損失mse



model.fit(train_x, train_y, epochs=1000,verbose=False)  # 訓練模型

model.summary()



pred_y = model.predict(test_x)[:,0]



print("正確標簽：",test_y)

print("模型預測：",pred_y )



print("實際與預測值的差異：",mean_squared_error(test_y,pred_y ))

可見，其模型的參數(shù)（190個）遠多于單層線性網(wǎng)絡(luò)（13個）；學習的誤差（27.4）小于單層線性網(wǎng)絡(luò)模型（31.9），有著更高的復雜度和更好的學習效果。

#繪圖表示

import matplotlib.pyplot as plt



plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False



# 設(shè)置圖形大小

plt.figure(figsize=(8, 4), dpi=80)

plt.plot(range(len(test_y)), test_y, ls='-.',lw=2,c='r',label='真實值')

plt.plot(range(len(pred_y)), pred_y, ls='-',lw=2,c='b',label='預測值')



# 繪制網(wǎng)格

plt.grid(alpha=0.4, linestyle=':')

plt.legend()

plt.xlabel('number') #設(shè)置x軸的標簽文本

plt.ylabel('房價') #設(shè)置y軸的標簽文本



# 展示

plt.show()

回到分析深度神經(jīng)網(wǎng)絡(luò)學習的內(nèi)容，這里我們輸入一條樣本，看看每一層神經(jīng)網(wǎng)絡(luò)的輸出。

from numpy import exp



x0=train_x[0]

print("1、輸入第一條樣本x0:\n", x0)

 # 權(quán)重參數(shù)可以控制數(shù)據(jù)的特征表達再輸出到下一層

w0= model.layers[0].get_weights()[0] 

print("2、第一層網(wǎng)絡(luò)的權(quán)重參數(shù)w0:\n", w0) 



a0 = np.maximum(0,np.dot(w0.T, x0)) 

# a0可以視為第一層網(wǎng)絡(luò)層交互出的新特征，但其特征含義是比較模糊的

print("3、經(jīng)過第一層神經(jīng)網(wǎng)絡(luò)relu(w0*x0)后輸出:\n",a0) 

w1=model.layers[1].get_weights()[0] 

print("4、第二層網(wǎng)絡(luò)的權(quán)重參數(shù)w1:\n", w1)  

 # 預測結(jié)果為w1與ao加權(quán)求和

a1 = np.dot(w1.T,a0)                                  

print("5、經(jīng)過第二層神經(jīng)網(wǎng)絡(luò)w1*ao后輸出預測值:%s,實際標簽值為%s"%(a1[0],train_y[0]))

運行代碼，輸出如下結(jié)果

從深度神經(jīng)網(wǎng)絡(luò)的示例可以看出，神經(jīng)網(wǎng)絡(luò)學習的內(nèi)容一樣是權(quán)重參數(shù)。由于非線性隱藏層的作用下，深度神經(jīng)網(wǎng)絡(luò)可以通過權(quán)重參數(shù)對數(shù)據(jù)非線性轉(zhuǎn)換，交互出復雜的、高層次的特征，并利用這些特征輸出決策，最終取得較好的學習效果。但是，正也因為隱藏層交互組合特征過程的復雜性，學習的權(quán)重參數(shù)在業(yè)務(wù)含義上如何決策，并不好直觀解釋。

對于深度神經(jīng)網(wǎng)絡(luò)的解釋，常常說深度學習模型是“黑盒”，學習內(nèi)容很難表示成易于解釋含義的形式。在此，一方面可以借助shap等解釋性的工具加于說明。另一方面，還有像深度學習處理圖像識別任務(wù)，就是個天然直觀地展現(xiàn)深度學習的過程。如下展示輸入車子通過層層提取的高層次、抽象的特征，圖像識別的過程。注：圖像識別可視化工具來源于https://poloclub.github.io/cnn-explainer/