2008年7月14日月曜日

semantic netの試験対策のためのノート

sentence: "I know what I like and I like what I know."

I.
Q1) frame size = 5の語彙共起行列


I know what like and






I null 6 3 7 5






know 3 null 3 3 1






what 6 3 null 6 4






like 7 3 6 null 5






and 5 1 4 5 null














Q2)frame size = 5, radius = 2の共起頻度行列(IAWではなくKey-Word Based)








I know what like and
key:I
3 4 4 2
key:know 3
2


key:what 3 2
2

key:like 4
2
2
key:and 2

2



Q3) Q2の共起頻度行列から得られる重みなし無効グラフと隣接行列



I know what like and

I 0 1 1 1 1

know 1 0
1 0 0

what 1 1 0
1 0

like 1 0 1 0
1

and 1 0 0 1 0




III.
Q1) 4ノードからなる完全グラフと隣接行列


node1 node2 node3 node4
node1 0
1 1 1
node2 1 0
1 1
node3 1 1 0
1
node4 1 1 1 0



Q2) Q1の辺の数:3+2+1 = 6

Q3)
完全グラフなので、4つのノードから考えられる3-クリークの数と実際のグラフに存在する3-クリークの数は一致する。
よってcurvature = 1である。

Q4) danglingノードが6つのスターグラフと隣接行列


node1 node2 node3 mpde4 mpde5 node6 node7
node1 0
1 1 1 1 1 1
node2 1 0
0 0 0 0 0
node3 1 0 0
0 0 0 0
node4 1 0 0 0
0 0 0
node5 1 0 0 0 0
0 0
node6 1 0 0 0 0 0
0
node7 1 0 0 0 0 0 0



Q5) スターグラフでは、3-クリークが一つも存在しないのでcurvature = 0である。

Q6) ノード1の次元は6、それ以外のノードの次元は1である。

III.
Q1)
cos similarity を計算する関数の定義(Rでの関数定義)

cos_value <- function(a,b){
inner_product_ab <- sum(a*b)
norm_a <- sqrt(sum(a*a))
norm_b <- sqrt(sum(b*b))
product_norm_ab <- norm_a*norm_b
cos_val <- inner_product_ab/product_norm_ab
cos_val
}

cosmonauteとastronauteのcos similarityを計算。
cosm <- c(8,9,4,1,10)
astr <- c(10,8,3,8,2)
cos_value(cosm,astr)
[1] 0.7640857 Q2)

IIIの表から得られる二部グラフと隣接行列。

cosmonaute astronaute space ship rocket NASA Soviet
cosmonaute 0 0 1 1 1 1 1
astronaute 0 0 1 1 1 1 1
space 1 1 0 0 0 0 0
ship 1 1 0 0 0 0 0
rocket 1 1 0 0 0 0 0
NASA 1 1 0 0 0 0 0
Soviet 1 1 0 0 0 0 0



Q3)
2部グラフの定義:
グラフG = (V,E) について以下のことが成り立つとき、Gを二部グラフと呼ぶ。

頂点集合V1,V2を以下のように定義する。
このとき、V1の任意の2つ頂点間に辺が存在しない、かつV2の任意の2つの頂点に辺が存在しないなら、Gは二部グラフである。

V = V1∪V2 (V1∩V2 = φ:空集合)
(このようなV1,V2を独立点集合という)

if
∀ei, ej ∈ V1 , ∉ E
∀es, et ∈ V2, ∉ E

then G is bi-patite graph.


二部グラフの特徴:
  • n部グラフはn色彩色可能(定理) → 2部グラフは2色彩色可能
  • 奇閉路が存在しない

III
Q1) だいたいwikipediaに書いてある。
http://ja.wikipedia.org/wiki/%E6%BD%9C%E5%9C%A8%E6%84%8F%E5%91%B3%E8%A7%A3%E6%9E%90

Q3)
絵画に画像解析を行い、絵画の特徴を自然言語を用いて語るという研究がある。
これは、人間は絵画を見ることで感じる”印象”を自然言語で語っていることに注目した研究である。
具体的には、絵画の様々な画像情報と用意された印象語との対応をコンピュータに解析・学習させるというものである。

ここで、このアプローチを私なりにさらに改良したものを提案する。
先攻研究では、印象語をあらかじめ用意していた。
しかし、この印象語が絵画を語るのに十分である保証はない。
そこで、私は以下に述べることを提案する。

先攻研究では絵画の特徴を規定の印象語の尺度で語って終わりであった。
私の提案する方法は、絵画の特徴を自由な印象語で語り、さらにその印象語がもつ潜在的な意味を大規模コーパスから見いだすものである。
この方法により、先攻研究の手法よりさらに言語の持つ特徴を利用した解析が行えるのではないかと期待する。

Q3)
言語の意味を語るものは言語である。
これは終わりのない再帰的な関係である。
仮に終わりがあるのであれば、言語全体を語るのに十分な基底ベクトルのような言語が存在することになる。
ここで、この基底ベクトルを基底言語と呼ぶことにする。
私は、この基底言語の集合の部分集合が意味なのだと考える。
つまり、言語とは基底言語の部分集合族のようなものと考えるわけである。
基底言語集合が有限であるのか無限であるのかは分からない。
また、基底言語が自然言語として存在しているのかどうかも分からない。
しかし、私はこのような基底言語が存在することを信じている。

0 件のコメント: