Skip to content

「アドバンストKWIC for KHCoder」の「and」検索と「or」検索、コサイン係数で作成した語×外部変数の共起ネットワークの考え方 #1235

Discussion options

You must be logged in to vote

語xと語yを選択して「アドバンストKWIC」で検索したとき、「and」だと「語xと語yが同時に出現している文書」を検索することだと思うのですが、「or」だと「語xと語yが同時に出現している文書に加えて、語xか語yのどちらか一方のみが出現している文書と」を検索していると考えればよろしいのでしょうか?

そうだと思います。ただ、一般的なor検索の結果を得るためには、「キーワード」欄を空欄にする必要があるようです。

※文綿シリーズの仕様についてでしたら、発売元のSCREEN アドバンストシステムソリューションズ様にお問い合わせいただいた方が、確実な回答が得られるかもしれません。おそらく文綿シリーズの仕様のことなら、コンサルテーション料金不要でお答えいただけるでしょう。

・コサイン係数で抽出語(映画レビューから抽出)と外部変数(映画レビューの星評価)を作成したのですが、その関係については、『社会調査のための計量テキスト分析』p.183や『動かして学ぶ!はじめてのテキストマイニング』p.120に書かれているように、「それぞれの星評価(0.5から5.0)に特徴的な語がつながっている」(「0.5から5.0の評価をあらわす変数と語との共起が描かれている」)と考えてよろしいでしょうか?
※2つの書籍では、Jaccard係数を選択した際の星×外部変数の共起ネットワークが前提になっていると思いますが、コサイン係数の共起ネットワークでも同様に考えてよろしいのでしょうか?

Jaccardでもコサインでも、同様にお考えいただけます。

Jaccardにしてもコサインにしても、この形の共起ネット…

Replies: 2 comments

Comment options

You must be logged in to vote
0 replies
Answer selected by ko-ichi-h
Comment options

You must be logged in to vote
0 replies
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested Non-English Communication in Japanese language.
2 participants