2008年12月13日 星期六

圖書資訊學研究(十三) 2008.12.08 Semantic web and Ontology

今天請到的所上的合聘教授,我們的數位出版研究老師,柯皓仁老師來為我們演講,對老師我們應該都不覺得陌生,老師今天講的主題是「語意網與知識本體(Semantic web and Ontology)」。

語意網是要讓電腦了解網路資訊,了解語意才可以做處理,是可以直接經由機器處理的資料,通常web透過連結(href link),語意網必須要將每個type定義出來,因此關聯性定義要非常得清楚,可以說是web的進階版,定義東西的屬性,所以可以瞭解東西與東西間的關係。

但是要如何定義語意呢? 老師有提到資源描述框架(RDF, Resource Description Framework ),用RDF來描述網頁的知識內容。
知識本體,哲學中稱為本體論,它是對網頁資源知識內容及資源框架的描述和定義,是專有名詞與其間的關係。所以每個資源都有自己定義的知識本體,因為同一個詞在不同的領域會有不同的意義,也會隨著時空改變,所以有時候在網路搜尋,找到的資訊並非都是正確的,還是會有錯誤。
語意網是希望知識本體是用RDF 的型式,或類似語言寫成之文件,清楚定義概念關係。並且要讓電腦在概念與概念間進行邏輯的推理,課堂中有同學問到,要建立起這樣的語意網,RDF能否自動產生,每個網頁、每個資源都要建置,若是透過自動產生,資訊也未必百分之百正確,還是需要人工的校對,所花費的時間與成本是不容小覷的。

老師有提到一個語意網的sample:WordNet【http://wordnet.princeton.edu/】詞彙網路,類似線上字典,主要語言為英文,由普林斯頓大學規畫進行的。輸入一個詞,資料庫會show出詞形(如名詞、形容詞、動詞等)與不同的意義,以詞義為基準,會將有相同詞義的所有詞彙放在一個同義詞集(Synset)。還有一個是關於食物的,吃什麼樣的海鮮要配什麼樣的紅酒,要建立這樣的資源需要花費很多的時間。要定義每個食物與紅酒的屬性,最後還要建立他們之間的relationship。建立起來的語意網,也必須該領域的人有去使用並持續發展,才是有用的,否則最後都泛為空談。

沒有留言: