双対尺度法による分類

世界の熱帯地方に広く分布するビカクシダは,その形や性質,また自生地よりいちおう分類されていますが,納得いか~んという人もいるでしょう.それじゃ 自分の納得のいくような分類をしてみようということで,統計学の手法を用いて自動分類を行うプログラムを作ってみました.もちろんビカク以外にも使えます から,自分の興味のあるもので試してみるとけっこうおもしろいですよ.

使い方

1.左側のテキストエリアにデータを入力します

たとえば,

¥ 大型 高温 葉の分岐 子株
ビフルカツム 2 2 3 4
ウィリンキー 3 3 4 4
アンゴレンセ 3 3 0 3
スペルブム 5 2 4 0
コロナリウム 5 4 5 0
ホルタミー 5 4 4 0

と入力してみてください.
なお,それぞれのデータは半角スペースで区切り,余計なスペース・改行は削除してください.数値は必ず半角で入力です.

 

2."計算開始"ボタンを押す


右側の描画領域に計算結果が表示されます. どうですか?やっぱりアジア系,オセアニア系,アフリカ系に分類されて表示されますね.

入力したデータの意味

行は植物の種類を,列はその特性をあらわします.まず“ビフルカツム”の行に着目してみましょう.1つ目の値は大型かどうか.まぁ小中型かなぁ?ということで5段階評価で2.次,2つ目の値は高温性かどうか.ビフは寒さにも強いし涼しいほうが成長がよいからそんなに高温性でもないかなぁ.ということで2...といった具合に自分なりの評価値を決定します.いくつかの種類について繰り返すとデータの行列が出来上がりますね.これが計算対象データとなるのです.評価の最大値は(例では5点満点)は自由に設定できますが,1~5点満点ぐらいがよいでしょう.

 

計算結果の意味

ビフとウィル,ホルタとスペルとコロナ,そしてアンゴレ,といった感じに"だいたい"3つのグループに分かれて表示されていると思います.これは,各種類のそれぞれの特性の値をもとに「こんな感じに分けられるんじゃないの?」とコンピュータが比較・分析してくれたものです.また,それぞれのグループ間の距離,種類間の距離が類似度を意味します.近ければ似ている,遠ければ似ていないといったふうです.そうすると,"アンゴレのグループ"と"ホルタのグループ"間の距離は,"ビフのグループ"と"ホルタのグループ"間の距離よりも大きいから,これは「アンゴレはビフほどホルタに似てはいない」という意味を表すことになります.そのほかにもどんな意味が隠されているのか見つけてみてください.