米事案と路地狩るプログラミング: semantic netの試験対策のためのノート

sentence: "I know what I like and I like what I know."

I.
Q1) frame size = 5の語彙共起行列

	I	know	what	like	and
I	null	6	3	7	5
know	3	null	3	3	1
what	6	3	null	6	4
like	7	3	6	null	5
and	5	1	4	5	null

Q2)frame size = 5, radius = 2の共起頻度行列（IAWではなくKey-Word Based）


	I	know	what	like	and
key:I		3	4	4	2
key:know	3		2
key:what	3	2		2
key:like	4		2		2
key:and	2			2

Q3) Q2の共起頻度行列から得られる重みなし無効グラフと隣接行列

	I	know	what	like	and
I	0	1	1	1	1
know	1	0	1	0	0
what	1	1	0	1	0
like	1	0	1	0	1
and	1	0	0	1	0

III.
Q1) ４ノードからなる完全グラフと隣接行列

	node1	node2	node3	node4
node1	0	1	1	1
node2	1	0	1	1
node3	1	1	0	1
node4	1	1	1	0

Q2) Q1の辺の数：3+2+1 = 6

Q3)
完全グラフなので、４つのノードから考えられる3-クリークの数と実際のグラフに存在する3-クリークの数は一致する。
よってcurvature = 1である。

Q4) danglingノードが６つのスターグラフと隣接行列

	node1	node2	node3	mpde4	mpde5	node6	node7
node1	0	1	1	1	1	1	1
node2	1	0	0	0	0	0	0
node3	1	0	0	0	0	0	0
node4	1	0	0	0	0	0	0
node5	1	0	0	0	0	0	0
node6	1	0	0	0	0	0	0
node7	1	0	0	0	0	0	0

Q5) スターグラフでは、3-クリークが一つも存在しないのでcurvature = ０である。

Q6) ノード１の次元は６、それ以外のノードの次元は１である。

III.
Q1)
cos similarity を計算する関数の定義（Rでの関数定義）

cos_value <- function(a,b){
inner_product_ab <- sum(a*b)
norm_a <- sqrt(sum(a*a))
norm_b <- sqrt(sum(b*b))
product_norm_ab <- norm_a*norm_b
cos_val <- inner_product_ab/product_norm_ab
cos_val
}

cosmonauteとastronauteのcos similarityを計算。
cosm <- c(8,9,4,1,10)
astr <- c(10,8,3,8,2)
cos_value(cosm,astr)
[1] 0.7640857 Q2)

IIIの表から得られる二部グラフと隣接行列。

	cosmonaute	astronaute	space	ship	rocket	NASA	Soviet
cosmonaute	0	0	1	1	1	1	1
astronaute	0	0	1	1	1	1	1
space	1	1	0	0	0	0	0
ship	1	1	0	0	0	0	0
rocket	1	1	0	0	0	0	0
NASA	1	1	0	0	0	0	0
Soviet	1	1	0	0	0	0	0

Q3)
２部グラフの定義：
グラフG = (V,E) について以下のことが成り立つとき、Gを二部グラフと呼ぶ。

頂点集合V1,V2を以下のように定義する。
このとき、V1の任意の２つ頂点間に辺が存在しない、かつV2の任意の２つの頂点に辺が存在しないなら、Gは二部グラフである。

V = V1∪V2 (V1∩V2 = φ：空集合)
（このようなV1,V2を独立点集合という）

if
∀ei, ej ∈ V1 , ∉ E
∀es, et ∈ V2, ∉ E

then G is bi-patite graph.

二部グラフの特徴:

n部グラフはn色彩色可能（定理）　→　２部グラフは２色彩色可能
奇閉路が存在しない

III
Q1) だいたいwikipediaに書いてある。
http://ja.wikipedia.org/wiki/%E6%BD%9C%E5%9C%A8%E6%84%8F%E5%91%B3%E8%A7%A3%E6%9E%90

Q3)
絵画に画像解析を行い、絵画の特徴を自然言語を用いて語るという研究がある。
これは、人間は絵画を見ることで感じる”印象”を自然言語で語っていることに注目した研究である。
具体的には、絵画の様々な画像情報と用意された印象語との対応をコンピュータに解析・学習させるというものである。

ここで、このアプローチを私なりにさらに改良したものを提案する。
先攻研究では、印象語をあらかじめ用意していた。
しかし、この印象語が絵画を語るのに十分である保証はない。
そこで、私は以下に述べることを提案する。

先攻研究では絵画の特徴を規定の印象語の尺度で語って終わりであった。
私の提案する方法は、絵画の特徴を自由な印象語で語り、さらにその印象語がもつ潜在的な意味を大規模コーパスから見いだすものである。
この方法により、先攻研究の手法よりさらに言語の持つ特徴を利用した解析が行えるのではないかと期待する。

Q3)
言語の意味を語るものは言語である。
これは終わりのない再帰的な関係である。
仮に終わりがあるのであれば、言語全体を語るのに十分な基底ベクトルのような言語が存在することになる。
ここで、この基底ベクトルを基底言語と呼ぶことにする。
私は、この基底言語の集合の部分集合が意味なのだと考える。
つまり、言語とは基底言語の部分集合族のようなものと考えるわけである。
基底言語集合が有限であるのか無限であるのかは分からない。
また、基底言語が自然言語として存在しているのかどうかも分からない。
しかし、私はこのような基底言語が存在することを信じている。

米事案と路地狩るプログラミング

2008年7月14日月曜日

semantic netの試験対策のためのノート

0 件のコメント:

ブログアーカイブ

ラベル

about me