|
絕大部分行業(yè)場景,尤其是互聯(lián)網(wǎng)行業(yè),每天都會產(chǎn)生大量的數(shù)據(jù)。游戲中每時每刻都會產(chǎn)生大量的玩家日志信息;旅游應(yīng)用中每天有各類酒店各種交通工具的實時價格;涉及供應(yīng)鏈和日銷量的零售電商,每月都為生產(chǎn)(購進(jìn))多少貨而發(fā)愁;就連生產(chǎn)電子元器件、供電箱等傳統(tǒng)生產(chǎn)企業(yè),這些零件每時每刻都會產(chǎn)生大量的數(shù)據(jù)。而我們稱這種不同時間收到的,描述一個或多種特征隨著時間發(fā)生變化的數(shù)據(jù),為時間序列數(shù)據(jù)(Time Series Data)。 結(jié)合上文中的時間序列數(shù)據(jù),我們能夠做什么?最顯而易見的是,我們可以通過過去產(chǎn)生的時間序列數(shù)據(jù),來預(yù)測未來。 我們可以通過游戲歷史的玩家消費時間序列數(shù)據(jù),預(yù)測該玩家在接下來一周的付費意愿和付費大致金額,從而定制化的推送相關(guān)游戲禮包和活動,這通常和傳統(tǒng)的用戶畫像是互補(bǔ)的。旅游應(yīng)用中,利用歷史數(shù)據(jù)對未來酒店、機(jī)票的價格進(jìn)行預(yù)測,從而為用戶推薦最低價的購買點(例如:提示用戶五天后購買會更便宜),這一個小功能就足夠獲取大量忠實用戶并實現(xiàn)變現(xiàn),而北美已經(jīng)有網(wǎng)站實現(xiàn)了這個功能來預(yù)測機(jī)票價格。 一言以蔽之,時間序列預(yù)測就是通過多種維度的數(shù)據(jù)本身內(nèi)在與時間的關(guān)聯(lián)特性,其中可能包含季節(jié)性、趨勢性等等特征,利用歷史的數(shù)據(jù)預(yù)測未來的場景,細(xì)分場景除了上述介紹之外,還有很多很多。 時間序列預(yù)測在實際使用中,難免會遇到關(guān)于數(shù)據(jù)的問題,例如無法完整收集所有影響因素的數(shù)據(jù),影響因素在未來具有不確定性,有時只有很少甚至沒有歷史數(shù)據(jù)。數(shù)據(jù)往往是卡住大多數(shù)時序預(yù)測工作負(fù)載最大的問題。 Amazon SageMaker 中內(nèi)置的 DeepAR 算法能夠在一定程度上減輕對數(shù)據(jù)的要求。DeepAR 直接在模型內(nèi)部補(bǔ)充缺省值。在導(dǎo)入數(shù)據(jù)的過程中,我們不需要人為的掃描數(shù)據(jù)尋找缺省值,不需要為如何填補(bǔ)缺省值大費周章,DeepAR 模型內(nèi)部會解決這一問題。 同時,DeepAR 上手難度并不高,在 Amazon SageMaker 中,可以快速方便的直接調(diào)用現(xiàn)成實現(xiàn)好的算法,輸入自己的數(shù)據(jù)進(jìn)行訓(xùn)練。 課程主題:使用 DeepAR 進(jìn)行時間序列預(yù)測 課程時間:6 月 4 日 20:00 課程主講:王元愷,AWS高級解決方案架構(gòu)師 講師簡介:高級解決方案架構(gòu)師,負(fù)責(zé)基于AWS的云計算方案的架構(gòu)設(shè)計,同時致力于AWS云服務(wù)在國內(nèi)和全球的應(yīng)用和推廣。畢業(yè)于上海交通大學(xué),畢業(yè)后直接加入AWS中國。對前沿技術(shù)如計算機(jī)視覺、自然語言處理及其應(yīng)用有著深入的研究與熱情。在大規(guī)模全球同服游戲、Serverless無服務(wù)器架構(gòu)以及人工智能等領(lǐng)域有著廣泛的設(shè)計與實踐經(jīng)驗。 課程概要:本課程將介紹時間序列預(yù)測的場景、常見的分類及對應(yīng)算法、DeepAR 算法的優(yōu)勢以及如何使用 DeepAR 算法進(jìn)行時間序列預(yù)測,并通過現(xiàn)場演示,讓大家理解如何訓(xùn)練 DeepAR 用于具體的應(yīng)用場景。 |
|
|