訂閱
糾錯
加入自媒體

老焦專欄 | 解開知識圖譜神秘的面紗

2020-08-04 15:21
EAWorld
關(guān)注

老焦專欄 | 解開知識圖譜神秘的面紗

1知識圖譜與人工智能的關(guān)系

在人工智能應(yīng)用層出不窮的今天,作為軟件從業(yè)者,我們都非常關(guān)注如何在自己研發(fā)的應(yīng)用中使用人工智能技術(shù),以提高軟件的智能化水平。

回顧過往人工智能應(yīng)用,主要利用了語音識別、圖像識別方面的成果,但是不如想象般遍地開花。究其原因,我們發(fā)現(xiàn),以機器學習為基礎(chǔ)的人工智能應(yīng)用往往需要滿足以下幾個特點:

1)必須具備充足的數(shù)據(jù),而且這些數(shù)據(jù)是準確可靠的;2)需要具備完整的信息,例如下棋,是完整信息博弈,只要算的快就可以,而人的決策往往是在不具備完整信息的情況下做出的;3)結(jié)果是明確的,人很容易確定結(jié)果是否正確,即使暫時不能確定,確定的代價也不高;4)過程往往是靜態(tài)的,缺乏動態(tài)的可預(yù)測性。

這些特點導致很多情況下無法采用機器學習方式,進行人工智能的應(yīng)用。例如在大型裝備的故障診斷中,我們無法具備大量準確的故障數(shù)據(jù)進行學習,因為很多故障沒有發(fā)生過或者很少發(fā)生;故障發(fā)生后對故障原因的判定,也不是一個很容易判定的結(jié)果,因為故障現(xiàn)象難以重現(xiàn);故障發(fā)生后應(yīng)急方案的制訂,目前深度學習、神經(jīng)網(wǎng)絡(luò)的方式,由于人無法了解其推理過程,產(chǎn)生的預(yù)案也往往不敢使用。

上述四點只要能夠改善某一點,就可以給人工智能的應(yīng)用帶來更廣闊的空間,這也是知識圖譜作為人工智能一個重要方向的原因。

知識圖譜(KG  Knowledge Graph)是 Google 2012 年提出的概念,并成功應(yīng)用于搜索引擎當中。但什么是知識圖譜,Google并沒有給出明確的定義,目前業(yè)界的定義例如維基百科、百度百科都是從 Google 搜索引擎中知識圖譜的運用出發(fā),進行相關(guān)的功能描述。

我們可以把知識圖譜,理解為對知識的一種結(jié)構(gòu)化描述,它以結(jié)構(gòu)化的形式描述客觀世界中概念、實體及其之間的關(guān)系,便于計算機更好的管理、計算和理解信息。它是新一代的知識庫技術(shù),通過結(jié)構(gòu)化、語義化的處理將信息轉(zhuǎn)換為知識,加以應(yīng)用。

通常結(jié)構(gòu)化知識是以圖的形式進行表示,學術(shù)術(shù)語可以成為語義網(wǎng)絡(luò)。圖的節(jié)點表示概念和實體(學術(shù)術(shù)語稱為語義符號),圖的邊表示節(jié)點之間的關(guān)系(學術(shù)術(shù)語稱為語義關(guān)系),此外每個節(jié)點還有屬性。

例如:人物、娛樂人物、歌手、影視演員都是概念,這幾個概念之間有從屬關(guān)系,周杰倫是一個實體,周杰倫是歌手,也是影視演員,周杰倫的出生日期等就是屬性,周杰倫的妻子是昆凌,昆凌的丈夫是周杰倫,這就是關(guān)系,從上述關(guān)系可以推理出昆凌的丈夫是一個娛樂人物。

老焦專欄 | 解開知識圖譜神秘的面紗

這個簡單的示例表明,通過概念、實體以及之間的關(guān)系進行知識結(jié)構(gòu)化表示,就可以讓計算機具備推理能力,這種推理能力:

1)可以不需要大量數(shù)據(jù)基礎(chǔ)就可以建立起來;2)不一定需要完備的信息就可以進行推理;3)推理的過程是可以評估的,人可以通過推理過程判斷結(jié)果是否準確;4)可以進行對未來的預(yù)測。這就可以在一定程度上解決目前機器學習方式面臨的問題。

研究知識圖譜、人工智能的時候,我們經(jīng)常遇到很多專業(yè)術(shù)語,例如語義網(wǎng)絡(luò)、本體、知識庫等等,理解起來非常費力。實際上如上例而言,用圖的結(jié)構(gòu)來表示知識就是語義網(wǎng)絡(luò),圖的節(jié)點表示概念和實體,學術(shù)術(shù)語稱為語義符號,圖的邊表示節(jié)點之間的關(guān)系,學術(shù)術(shù)語稱為語義關(guān)系。

本體(Ontology)的源自于哲學領(lǐng)域,在哲學中的定義為“對世界上客觀事物的系統(tǒng)描述”。哲學中的本體關(guān)心的是客觀現(xiàn)實的抽象本質(zhì),而在計算機領(lǐng)域,本體是一種描述知識的方式。自從本體的概念引進后,就出現(xiàn)了資源描述框架 RDF(Resource Description Framework)、網(wǎng)絡(luò)本體語言 OWL(Ontology Web Language)這樣的語言進行標準化的知識表示。

其實本體也是基于圖、概念、實體、屬性、關(guān)系這些來描述知識的。傳統(tǒng)人工智能領(lǐng)域采用了大量的學術(shù)術(shù)語,而Google的一個創(chuàng)新就是利用“知識圖譜”這樣直白的語言,形象的表述了一個復雜事物,用 AlphaGo 這樣直觀的示例,普及了人工智能的概念。而本文也希望盡可能用類比的方式,采用易于軟件研發(fā)理解的語言來介紹使用知識圖譜的過程,這也是取名“解開知識圖譜神秘面紗”的初衷。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號