|
益生菌要怎么選? 這個問題雖然只有7個字,但卻并不容易回答。 首先,益生菌的家族非常龐大。 如果我們將每一種菌株(比如鼠李糖乳桿菌LGG)都看作是貨架上的一種商品,那么被研究過的益生菌和潛在益生菌就能夠鋪滿整個無印良品的店鋪。 而那些經(jīng)過人體研究驗證的益生菌也足以覆蓋一家小型便利店。 要是你將這些單一的菌株組合在一起,理論上又可以配出無數(shù)種的配方。 其次,不同的益生菌能產(chǎn)生的健康效益千差萬別。 比如,植物乳桿菌299V可能對抑郁癥患者有幫助,而同樣叫“植物乳桿菌”的其他菌株卻不一定能達到相同的效果。 再比如,“長雙歧桿菌MM-2+格氏乳桿菌-K13+雙叉雙歧桿菌G9-1”的組合能改善季節(jié)性的過敏,但少了其中的一種也許就無法起到同樣的作用。 益生菌的種類琳瑯滿目,不同益生菌又大不相同。 這涉及到的信息量雖不算是“大數(shù)據(jù)”,但也足以讓人類為難。 那么,要如何囊括這所有的信息,從而為不同的人針對性地推薦不同的益生菌? 我曾經(jīng)嘗試過用手工整理。 針對某一種疾病或癥狀,人肉檢索相關(guān)的益生菌論文,然后苦哈哈地對著論文一篇篇地看,看有哪些益生菌能起作用。 但我很快就發(fā)現(xiàn),這種方式太低效了。 人眼瀏覽論文費時,手工整理數(shù)據(jù)耗力。花費大半天的時間,能提取出來的有效信息還十分有限。 更重要的是,關(guān)于益生菌的新研究層出不窮,并且數(shù)量也越來越多。 而這之間,就存在知識的高速增長和人的精力有限的根本矛盾。 不過,手工整理的過程仍然給了我一些洞見。 我發(fā)現(xiàn),需要提取的知識是高度結(jié)構(gòu)化的——主要就是從文獻提取四種信息:①研究何種益生菌;②針對何種病癥;③針對哪些人群;④是否有效。 所需的知識是結(jié)構(gòu)化的,論文的文本就擺在那。 既然如此,獲取知識的過程沒有理由不讓機器來完成。 這個想法在我的大腦里盤旋了許久。 在最近幾個月,我終于有時間沉下心來做這樣的一件事。 要自動化地獲取有關(guān)益生菌的知識,無非就是先表示知識,再獲取知識。 表示知識,我們可以用圖譜來表達那些與益生菌相關(guān)的知識。菌株、配方、論文和病癥等實體即是圖譜中的節(jié)點,這些實體間的各種關(guān)系,即是圖譜中的一條條連接。 獲取知識,即是先獲取數(shù)據(jù),再提取知識。獲取數(shù)據(jù),爬蟲是最好的幫手;而提取知識,就是看“數(shù)據(jù)”下菜——詞典、規(guī)則庫、命名實體識別、機器學習,哪樣好用選哪樣。 在幾個月的構(gòu)建、優(yōu)化和調(diào)試后,一個完整的益生菌的知識系統(tǒng)誕生了。 一旦確立了以自動化為核心的宗旨,整個系統(tǒng)就可以不斷地被迭代和優(yōu)化,從而越來越趨近于全自動。 在此基礎(chǔ)上,為了驗證知識的可靠性,我將系統(tǒng)獲取的知識與現(xiàn)有臨床綜述和指南進行比較,從而能夠及時地糾正偏差。 而為了能讓這些知識得以被應用,我開發(fā)了一個微信小程序。 它的名字叫選好菌,目的即是幫你選好益生菌。 所以,益生菌要怎么選? 選益生菌,看選好菌。 目前,在選好菌的系統(tǒng)里,你已經(jīng)能找到與52種病癥相關(guān)的益生菌菌株和配方,包括腸易激綜合征、腹瀉、便秘、口臭、季節(jié)性過敏、特異性皮炎、超重或肥胖、代謝綜合征等等。 當然,這一切只是開始。 這個益生菌的知識庫還有待被補充完整,其中的一些論文資料還有很大的被深挖的空間。 更完整的知識庫,意味著能提供更可靠的資料。 更深入地挖掘信息,意味著能夠為你提供更好決策支持。 這些將會是我接下來要做的事情。 但我所想的遠不止于此。 更多的知識需要被收集,需要被整理,需要通過連接來產(chǎn)生新的價值。 而這所有的過程,都值得被自動化。 那些可控、完整、可迭代的知識系統(tǒng)能幫助我們更好地理解世界和作出決策。 如果我的后半生只能做一件事,我想會是知識管理 ——讓知識更好地為人賦能。 |
|
|