电竞比分网-中国电竞赛事及体育赛事平台

分享

深度學(xué)習(xí)數(shù)學(xué)基礎(chǔ) | 簡單數(shù)學(xué)

 走路先生 2020-03-19

從本文開始,之后的三四篇我們都將沐浴在數(shù)學(xué)的海洋里,拼命地?fù)潋v,這個系列我會盡力以通俗易懂的方式來講述這些數(shù)學(xué)知識。

1 函數(shù)

1.1 一次函數(shù)

在數(shù)學(xué)函數(shù)中最基本、最重要的就是一次函數(shù)。也就是函數(shù)之基礎(chǔ)、根本。它在神經(jīng)網(wǎng)絡(luò)的世界里也同樣重要。

1.1.1 一元一次函數(shù)

這個函數(shù)可以用下面的式表示。被稱為斜率(用來控制直線的方向),被稱為截距(用來控制直線和原點(diǎn)的偏移)

當(dāng)x、y兩個變量滿足上述公式時,就稱為變量y和變量x是一次函數(shù)關(guān)系

有兩個變量xy,如果對每個x都有唯一確定的y與它對應(yīng),則稱yx的函數(shù),用  表示。此時,稱為自變量,為因變量。

一次函數(shù)的圖像是直線,如下圖的直線所示。

示例:一次函數(shù)的圖像如下圖所示,截距為 1,斜率為 2。

1.1.2 多元一次函數(shù)

上面我們說的中有一個變量x,我們稱為一元,如果有多個變量,我們就稱為是多元的,比如下面的式子。(有幾個變量就是幾元的,也可以理解為維度)

當(dāng)多個變量滿足上述公式時,也稱為變量y與變量是一次函數(shù)關(guān)系。

就像我們之前說的神經(jīng)元的加權(quán)輸入Z 就可以表示為一次函數(shù)關(guān)系。

如果把作為參數(shù)的權(quán)重與偏置看作常數(shù),那么加權(quán)輸入h和就是一次函數(shù)關(guān)系。

1.2 二次函數(shù)

1.2.1 一元二次函數(shù)

剛剛我們接觸了一次函數(shù),下面說說二次函數(shù)。二次函數(shù)很重要,像我們經(jīng)常使用的代價函數(shù)平方誤差就是二次函數(shù)。二次函數(shù)由下面的式表示。

二次函數(shù)的圖像是拋物線,如下圖所示。我們會發(fā)現(xiàn)拋物線的凹凸(開口朝向)是通過上方式子中a的正負(fù)來決定的。

  • 當(dāng)0時,拋物線向上開口,向下凸起

  • 當(dāng)時,拋物線向下開口,向上凸起。


所以當(dāng)時該函數(shù)的存在最小值。(該性質(zhì)是后面講的
最小二乘法的基礎(chǔ))

示例:二次函數(shù)的圖像如右圖所示。從圖像中可以看到,當(dāng)時,函數(shù)取得最小值。

1.2.2 多元二次函數(shù)

在我們實(shí)際的神經(jīng)網(wǎng)絡(luò)中需要處理更多變量的二次函數(shù),這些二次函數(shù)統(tǒng)稱多元二次函數(shù),學(xué)會了一元二次函數(shù),那么多元二次函數(shù)就不會太難了,下面我們以一個二元二次函數(shù)進(jìn)行舉例。

就像我們使用的代價函數(shù)平方誤差c就是多元二次函數(shù):

1.3 單位階躍函數(shù)

之前,我們已經(jīng)接觸過它了,還記得嗎,作為生物界神經(jīng)元的激活函數(shù)。下面我們再說一遍吧。

單位階躍函數(shù),在原點(diǎn)處不連續(xù),也就是在原點(diǎn)處不可導(dǎo),由于這兩個性質(zhì),所以單位階躍函數(shù)不能成為主要的激活函數(shù)。

單位階躍函數(shù)的圖像如下:

1.4 指數(shù)函數(shù)

什么是指數(shù)函數(shù)呢?我們之前講了一次函數(shù)和二次函數(shù),其實(shí)只要把變量放到冪的位置,其實(shí)就是指數(shù)函數(shù)了,具有以下形狀的函數(shù)稱為指數(shù)函數(shù),常數(shù)a被稱為函數(shù)的底數(shù)。

指數(shù)函數(shù)的圖像是類似于撇的一種樣式,如下所示

上面說到底數(shù),就不得不說自然常數(shù),又叫納皮爾數(shù)或歐拉數(shù),它和派π類似,是一個無限不循環(huán)小數(shù),它的值如下

1.4.1 sigmoid函數(shù)

上面說到自然常數(shù)e,那么就不得不提到大名鼎鼎的自然指數(shù)函數(shù),它在數(shù)學(xué)界有自己的標(biāo)識expexp(x)

而我們這里所要講的是包含自然指數(shù)函數(shù)的復(fù)合函數(shù)sigmoid函數(shù),它是神經(jīng)網(wǎng)絡(luò)中很具有代表性的激活函數(shù)。它的公式如下

通過下方的圖像,我們可以看到,這個函數(shù)是光滑的,這就代表著這個函數(shù)處處可導(dǎo),函數(shù)的取值在(0,1)區(qū)間內(nèi),那么這個函數(shù)值就可以用概率來解釋

1.5 正態(tài)分布的概率密度函數(shù)

在計(jì)算機(jī)實(shí)際確定神經(jīng)網(wǎng)絡(luò)時,我們需要首先給權(quán)重和偏置設(shè)定初始值,這樣神經(jīng)網(wǎng)絡(luò)才能進(jìn)行計(jì)算。而這個初始值怎么取呢,這個時候我們就會用到一個非常有用的工具,叫做正態(tài)分布

這里就不長篇大論的解釋啥是正態(tài)分布了,它也沒什么高大上的地方,就是概率分布中的一種分布方式,但是這個分布方式是及其復(fù)合人類和自然界的,有興趣的朋友可以去深入了解下。在這里只說一下,我們在給神經(jīng)網(wǎng)絡(luò)分配權(quán)重和偏置時分配一個服從正態(tài)分布的隨機(jī)數(shù),會比較容易取得好的結(jié)果。

正態(tài)分布是服從下面的概率密度函數(shù)的概率分布。公式如下

它的圖像如下,由于形狀像教堂的鐘,所以被稱為叫鐘形曲線

示例:試作出期望值μ為0、標(biāo)準(zhǔn)差σ為1 的正態(tài)分布的概率密度函數(shù)的圖像。

2 數(shù)列

2.1 數(shù)列的含義

數(shù)列就是數(shù)的序列,比如下面就是偶數(shù)列的數(shù)列:2,4,6,8,…
數(shù)列中的每一個數(shù)都被稱為項(xiàng),排在第一位的項(xiàng)叫做首項(xiàng),排在第二位的項(xiàng)叫做第2項(xiàng),以此類推,排在第n位的項(xiàng)叫做第n項(xiàng)(是不是有點(diǎn)廢話),神經(jīng)網(wǎng)絡(luò)中出現(xiàn)的數(shù)列都是有限的數(shù)列,這種數(shù)列叫做有窮數(shù)列,在有窮數(shù)列中最后一項(xiàng)稱為末項(xiàng),數(shù)列中的數(shù)量稱為項(xiàng)數(shù),而像上面的偶數(shù)列是無窮數(shù)列
示例:考察下面的有窮數(shù)列的首項(xiàng),末項(xiàng)以及項(xiàng)數(shù)1,3,5,7,9
這個數(shù)列的首項(xiàng)是1,末項(xiàng)是9,項(xiàng)數(shù)是5

2.2 數(shù)列的通項(xiàng)公式

數(shù)列中排在第項(xiàng)的數(shù)通常用表示,這里是數(shù)列的名字,可隨意取。當(dāng)想要表達(dá)整個數(shù)列時,使用集合的符號來表示,如

將數(shù)列的第項(xiàng)用一個關(guān)于n的式子標(biāo)書出來,那么這個式子被稱為通項(xiàng)公式,比如偶數(shù)列的通項(xiàng)公式就是下方的式子

示例:求以下數(shù)列{bn}的通項(xiàng)公式
在神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元的加權(quán)輸入和輸出可以看成數(shù)列,比如使用下方的展示方式:

2.3 數(shù)列與遞推關(guān)系式

除了通項(xiàng)公式外,數(shù)列還有另外一種表示方式,就是用相鄰的關(guān)系式來表示,這種表示法被稱為數(shù)列的遞歸定義
一般,如果已知首項(xiàng)以及相鄰的兩項(xiàng)

的關(guān)系式,那么就可以確定這個序列,這個關(guān)系式叫
遞推關(guān)系式

2.4 聯(lián)立遞推關(guān)系式

下面我們演示一個問題,這個算法就是神經(jīng)網(wǎng)絡(luò)中的誤差反向傳播中所用到的數(shù)列的解題算法聯(lián)立遞推算法。
像這樣,將多個數(shù)列的遞推關(guān)系式聯(lián)合起來組成一組,稱為聯(lián)立遞推關(guān)系式。在神經(jīng)網(wǎng)絡(luò)的世界中,所有神經(jīng)元的輸入和輸出在數(shù)學(xué)上都可以認(rèn)為是用聯(lián)立遞推式聯(lián)系起來的。例如,我們來看看之前文章中看過的一個神經(jīng)元的圖片

在箭頭前端標(biāo)記的是權(quán)重,神經(jīng)元的圓圈中標(biāo)記的是神經(jīng)單元的輸出變量。于是,如果以為激活函數(shù),
也就是說,第2層的輸出與第3層的輸出由聯(lián)立遞推關(guān)系式聯(lián)系起來。我們之后學(xué)的誤差反向傳播就是將這種觀點(diǎn)應(yīng)用在神經(jīng)網(wǎng)絡(luò)中。
為什么要將聯(lián)立遞推應(yīng)用在神經(jīng)網(wǎng)絡(luò)中呢?
其實(shí)是因?yàn)閷Ρ扔?jì)算冗長的偏導(dǎo)關(guān)系式,計(jì)算機(jī)更加擅長計(jì)算遞推關(guān)系。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多