|
這篇文章是之后系列文章的匯總集中目錄。 首先做個(gè)小宣傳。因?yàn)楹芏嘞胱鲞@一塊的同行本科生們不是很清楚國(guó)內(nèi)外的院校列表。有一位前輩在GitHub上整理了大部分的院校列表出來(lái),我也對(duì)這個(gè)列表做了一點(diǎn)貢獻(xiàn)。點(diǎn)擊查看 Python官網(wǎng)整理的Python庫(kù)有這些:鏈接 基礎(chǔ)組件Python-MIDI
很多庫(kù)的前置庫(kù),安裝時(shí)記得選擇其Python 3的branch。 樂(lè)譜生成相關(guān)的知乎問(wèn)題:鏈接 LilyPond
LilyPond是GNU Project的一部分,是免費(fèi)的樂(lè)譜生成軟件。生成的樂(lè)譜質(zhì)量很高,支持從xml/mxl以及從midi轉(zhuǎn)化成lilypond格式源代碼(.ly),并且可以使用類LaTeX語(yǔ)言編寫。 可以用兩個(gè)方法通過(guò)Python代碼調(diào)用LilyPond庫(kù): MuseScoreMuseScore的特點(diǎn)在于其有充分活躍的社區(qū)。這個(gè)軟件和LilyPond都可以通過(guò)XML和MIDI進(jìn)行數(shù)據(jù)傳送,所以在接口方面很靈活。 音樂(lè)的符號(hào)化表示music21
對(duì)Python3的支持很好,也是目前為止最完善的一個(gè)Python庫(kù)、武器庫(kù)。包括音樂(lè)的樂(lè)譜顯示、音樂(lè)合成、矩陣分析、語(yǔ)料庫(kù)、符號(hào)表達(dá)等。 ABC格式
ABC格式是一種復(fù)雜而古早的模式,很多早期的數(shù)據(jù)集使用了這種標(biāo)注。ABC格式可以轉(zhuǎn)化為music21,或者被其他方法解析。 Pretty_MIDI表示的Piano Roll
一個(gè)方便將MIDI文件轉(zhuǎn)化為Piano Roll的庫(kù)。這個(gè)庫(kù)被用在Google Magenta里,我自己的項(xiàng)目也要使用它。master分支現(xiàn)在已經(jīng)支持了Python3。 mingus
作者很久沒(méi)有維護(hù)過(guò)了,但是從快速上手來(lái)看是一個(gè)不錯(cuò)的Python庫(kù)。Python 3版本已經(jīng)給出。 音樂(lè)合成PySynth
主要用處就是將midi或ABC格式的文件轉(zhuǎn)化為wav文件,有多種合成方法可選,十分方便好用。 pyfluidsynth3
Pretty-MIDI的前置庫(kù),用于合成音樂(lè)。這里推薦的是Python 3的重寫版本。
數(shù)據(jù)集Nottingham Dataset特別有名的數(shù)據(jù)集,音樂(lè)界的MNIST。ABC格式可以被上面一些庫(kù)直接解析,MIDI格式也可以轉(zhuǎn)換。數(shù)據(jù)預(yù)處理的辦法一般是shift到12個(gè)大調(diào)或者小調(diào),速度調(diào)整至120bpm。 Lakh DatasetLakh MIDI數(shù)據(jù)集是176,581個(gè)獨(dú)特MIDI文件的集合,其中45,129個(gè)已匹配并與Million Song Dataset中的條目對(duì)齊。 Lakh Pianoroll上面數(shù)據(jù)集的轉(zhuǎn)化版本,但是表示使用了Pianoroll。 Million Songs不是midi文件而是波形文件,特點(diǎn)在于數(shù)據(jù)量極大。 SALAMI Dataset非常完整的標(biāo)注數(shù)據(jù)集,值得一提的是可以從中提取和弦標(biāo)注進(jìn)行學(xué)習(xí)。 MAESTRO Piano DatasetGoogle Magenta一直在用的鋼琴演奏數(shù)據(jù)集。有文字標(biāo)注版和音樂(lè)原版,數(shù)據(jù)量極為龐大。 IMSLP Music Library
國(guó)際上最大的樂(lè)譜典藏?cái)?shù)據(jù)庫(kù)。其亮點(diǎn)在于錄音和樂(lè)譜非常全,也許可以用于圖像識(shí)別領(lǐng)域。有些樂(lè)譜似乎是收費(fèi)的。 the Classical piano MIDI database
需要自己爬下來(lái)整理,鋼琴M(fèi)IDI數(shù)據(jù)集。 The Largest MIDI Dataset可以說(shuō)是很神奇了,在Reddit上貢獻(xiàn)了出來(lái)。是我看到的最大的MIDI數(shù)據(jù)集(3.65Gb),沒(méi)有之一。 MuseData也是需要自己爬,但是這里的數(shù)據(jù)是根據(jù)流派做好劃分的,非常一目了然。 JSB Chorales四聲部眾贊歌數(shù)據(jù)集。源地址掛掉了,這個(gè)GitHub提供了pickle包,很好用。 FMA Dataset這是一個(gè)音樂(lè)分析用的數(shù)據(jù)集,其亮點(diǎn)在于對(duì)流派、ID等數(shù)據(jù)的詳盡標(biāo)注。具體可以閱讀readme。 Midi Archive羅切斯特大學(xué)維護(hù)的一個(gè)數(shù)據(jù)集。 The Session非常非常完備的一個(gè)ABC格式的數(shù)據(jù)集,雖然需要自己爬,但是非常齊全。數(shù)據(jù)仍在不斷增加中。 MusicNet這個(gè)數(shù)據(jù)集是raw的音頻格式,大約10GB,提供了豐富的形式,標(biāo)注詳盡全面,甚至還做了PyTorch接口。 the Symbolic Music dataset by Walder清洗過(guò)的MIDI文件,作者目前還活躍在音樂(lè)研究一線。 TheoryTab嚴(yán)格來(lái)說(shuō)這不算是一個(gè)數(shù)據(jù)集,但是很多人在論文中用過(guò)它(比如MidiNet)。最出彩的地方在于其和弦標(biāo)注。我覺(jué)得應(yīng)該是網(wǎng)絡(luò)上和弦標(biāo)注最為全面的一個(gè)數(shù)據(jù)集了。這個(gè)網(wǎng)站現(xiàn)代化、可交互,非常值得看一看。 J.S. Bach Series
emm,他們真的很喜歡巴赫。 The Josquin Research Project斯坦福的一個(gè)網(wǎng)站,好像也不能直接下載,但是數(shù)據(jù)整理得非常漂亮,提供了MIDI、XML等多種格式,收錄了1420-1520年的復(fù)調(diào)音樂(lè),并且支持在線搜索和試聽。 Drum Dataset雖然數(shù)據(jù)很小只有800k,但是這是我見(jiàn)過(guò)的第一個(gè)專用于鼓點(diǎn)的數(shù)據(jù)集。 Video Game Datasets收錄了游戲的背景音樂(lè),而且真的非常非常齊全。 |
|
|