WordNet

WordNet的Synset

WordNet是一个英语词汇库。名词、动词、形容词、副词以及词组以同义group的形式放在一起,称为synsets,也就是一个概念(concept)。下面是一个称为synsets的例子:

1
2
3
4
mileage
fuel consumption rate
gasoline mileage
gas mileage

这就是一个synset,表示汽车的汽油里程数概念,同一个synset里的词可以看做是表达同一种意思,也就是同义词(synonym)。Synset也通过概念语义link连接在一起,使得整个Wordnet组成一个具有语义的网络。

另外,WordNet中每一个synset包含一个简短的解释gloss,多个例子短句。

需要注意的是,WordNet不是通过词的形式(string, letter)聚集在一起,而是根据词的语义意思。同样的,当一个词form具有多种不同含义时,该词form会出现在多个synset中。

WordNet中Synset之间关系

synset之间最常见的关系是super-subordinate relation(上下级关系,也成为hyperonymy,hyponymy,ISA relation),比如较抽象的synset之间的关系{furniture}, piece_of_furniture},比较具体的synset之间的关系{bed},{bunkbed},所有名词都有一个最上级{entity}。hyperonymy关系是具有传递性的。WordNet区分了不同目录的具体实例(实例为叶子节点),比如一般名词,人物,地点等。例如armchair是一种chair,Barack Obama是一个人名。

第二种synset之间的关系为meronymy,也就是part-whole relation(整体-部分关系)。也就是一个synset是另一个synset的组成部分,比如{seat} and {leg}。

第三种synset关系同样是hierarchies(上下级关系),但是是针对verb(动词)的。动词之间的上下级表示某种相似行为的程度逐渐增加的关系(increasingly specific manners characterizing an event),比如{communicate}-{talk}-{whisper}。程度由具体的语义环境决定,比如上面是根据声音大小,其他的还有速度{move}-{job}-{run},感情强烈程度{like}-{love}-{idolize}。同时在一个动词经常是另一个动词的动作关系连接时,动词之间也会存在单向连接,如{buy}-{pay},{succeed}-{try},{show}-{see}等。

形容词除了synset内的同义词关系外,还存在反义词对(antonymy),如wet-dry, young-old,同时dry也连接到parched, arid,这样一个词可以连接到反义词synset。
在synset之间还存在反义词关系()antonymy。名词和形容词的连接主要是用来表示形容词的来源,如criminal-crime.

Cross-POS relation

WordNet由nouns, verbs, adjectives and adverbs分别组成的子网共同组成,并通过一些cross-POS连接成整个wordnet,例如{sleeper, sleeper_car} is the LOCATION for {sleep}; {painter} is the AGENT of {plant}, while {painting, picture} is its RESULT.

WordNet Online Search的使用:

WordNet Search

直接输入word form,下面每个S表示一个synset,后面(n)表示词性,以及同一个synset的其他word form和一个简短的说明gloss。

参考:
WordNet